(1)、CMS系统原因 ,使同一篇文章出现不同的URL链接。
(2)、URL静态化设置错误,同一篇文章中有多个静态化URL。
(3)、URL静态化后,静态和动态URL共存,都有链接,也都可以访问。
(4)、加密网站,http://和https://。
(5)、URl中有端口号。
(6)、跟踪代码。
(7)、显示的都是首页内容。
网址规范化问题造成的一些问题:
(1)、分散页面权重,不利于排名。
(2)、外部链接也可能指向不同的URL,分散权重.
(3)、搜索引擎判断的规范化网址不是站长想要的那个网址。
(4)、如果问题太严重,也会影响收录。
(5)、相同内容的页面太多,可能被搜索引擎认定为作弊。
网址规范化解决方案:
(1)、确保使用的cms系统只产生规范化网址,无论是否有静态化
(2)、所有内部链接保持统一,都指向规范化网址。
(3)、在301从定向中,把不规范化URL全部转向到规范化URL。
(4)、提交给搜索引擎的XML网站地图中全部使用规范化网址。
10、URL的命名规则
大部分网站的URL命名规则是“根域名+栏目+文章页面”,也有一部分网站的URL命名规则是“根域名+文章页面”,其中能够产生变数的多半在于文章页面的命名规则上,有很多的朋友可能会注意到自己的命名规则是不太合理的,那么什么样的URL命名规则比较利于搜索引擎抓取呢?
(1)、网站的网址结构应尽可能简单些,并考虑网站组织的内容,让网址的构建合乎逻辑并易于理解(尽可能采用易读字词而非长的ID数字)。
(2)、建议您在网址中使用标点符号,帮助搜索引擎更好地分析网页内容,如在网址中使用连字符(-)而尽量避免使用下划线(_),用连字符分开两个单词,更有利于搜索引擎蜘蛛进行语义分析。
(3)、尽量少使用复杂的网址,特别是那些包含多个变量参数的网址(URL静态化),因为其可能会产生大量不必要的网址全都指向您网站上相同或相似的内容,给抓取工具带来麻烦,消耗大量不必要的带宽,也可能无法为您网站的所有内容编制完整索引。
当然,URL的结构优化还涉及到其他的一些细节,其中一个重要的就是对于后期URL权重的可控性的把握,例如,在开始的时候我们需要做长远考虑,给网站设计了很多的栏目,但是这些栏目又不是第一阶段我们想投入精力的,在这个时候我们可以将这些栏目进行robots屏蔽掉蜘蛛,或者使用nofollow标签让权重不传递,到达对于网页权重的合理引导,后期如果我们有精力开始发展新的栏目,就放开搜索引擎蜘蛛的抓取权限就可以了。