网站重复内容页面过多会造成资源和精力的浪费、关键词的内部竞争,还会分散权重,得不偿失。若是因为站内重复内容页面过多被搜索引擎误判为采集站就麻烦了。
从某种意义上来说,采集站实际上是摘取他人的胜利果实,触碰了飓风算法,会直接被搜索引擎惩罚,网站被降权清零。
一、同站消除重复内容的方法
1、因网址规范化造成的重复内容
解决办法:确保一篇文章只对应一个URL,不要出现多个版本,网站所有内部链接统一链接到这个URL,某些时候可以使用301转向。
2、非网址规范化造成的重复内容
解决方法:选取一个版本允许收录,其他版本禁止搜索引擎抓取或收录。
1)使用robots文件禁止抓取。
2)使用noindex meta robots标签禁止索引。
3)特殊情况可以使用Nofollow、JavaScript等阻止蜘蛛爬行,这个方法我们不建议使用。
4)使用canonical标签对网址进行规范化,也可以用在其他情况下。比如:
(1)电商网站同一款式,不同颜色型号的产品,可以使用canonical标签把权重集中在其中一种型号上。
(2)带有Session ID的页面也可以使用canonical标签,如页面http://网址/page-a.html放上如下代码:
<link rel="canonical" href="http://网址/page-a.html" />
这样,后面无论生成什么样的Session ID:
http://网址/page-a.html?sessionid=86461
http://网址/page-a.html?sessionid=85427
上面的URL都会被搜索引擎把权重集中到http://网址/page-a.html页面上。
二、不同网站重复内容的解决方法
不同网站之间重复内容解决起来比较麻烦,因为其他网站上的内容是无法控制的,基于此,良家佐言,有两点建议:
1、在页面中加入版权声明,要求转载的网站保留版权声明及指向原出处链接。
注:有些聚合网站会抓取feed自动生成的内容,所以在feed中加入版权声明和链接很有必要。
一般来说,原创版本外部链接会比转载多一些,这两年中文网站也开始有意识的维护版权问题,很多站长转载愿意保留链接和出处。
2、坚持原创内容,假以时日必能够增加网站权重,使网站上内容被判为原创的机会增加。
注:若有其他网站大量抄袭获得排名,可以联系对方加上版权或删除抄袭内容,或者向搜索引擎投诉。
作者:良家佐言
来源:https://www.badpon.com/2601.html