现今随着互联网的发展,网站也日益增多,关于网站如何运营成为了各个企业的首要面临的问题。最近a5报道了百度搜索结果页面开始对大型新闻门户网站进行原创内容标注,这表明百度对原创文章的重视,所以要想做好网站的运营必须要遵循这一点。
第一:为何搜素引、引擎要注重原创
1. 防止采集泛滥
通过一系列的研究表明,超过80%以上的新闻和资讯被人工转载或机器采集,从媒体报道到娱乐花边新闻等都被拿来转载或机器采集,所以原创文章可谓是岌岌可危,被一些采集包围,对搜索引擎来说收录也是既艰难又具挑战性。
2. 用户体验
搜索引擎之所以重视原创是为了提高用户体验,一些大规模的采集有可能导致采集网页内容残缺不全,格式错乱或附加垃圾等问题,这就大大影响了用户体验度。但这里所说的原创是指优质原创内容。
3. 鼓励原创
这种大量转载和采集长期会影响优质原创站长和作者的收益,关系到他们的创作积极性,所以要鼓励原创。
第二:正确识别原创
1. 搜索引擎应识别伪原创
现在大量的采集原创内容,用人工或机器的方法,篡改作者、发布时间和来源等信息,此类应需要搜索引擎识别出来。
2. 内容生成器,制造伪原创
也会有人利用自动文章生成器等工具,“独创”一篇新文章,然后安装一个新的标题,署上自己的名字就属于自己了,然而原创是需要有社会价值的,不是随便制造的,所以说这样一类文章是没有实用价值的。
第三:百度将如何识别伪原创
1. 持久战
作为原创收录并不是一朝一夕就可以完成的,面对挑战,应成立原创项目组,打持久仗,抽调大量人员组成原创项目组:技术、产品、运营、法务等等。
2. 原创识别法
现今互联网的有上百亿至上千亿的网页,要想从中挖掘原创实在是如同大海捞针,首先,要通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合:其次,对这些文章通过作者。发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等入手,识别出哪些才是真正的优质原创内容。
对于原创收录依然是现今需要解决的问题,这是一个生态问题,需要长期改善,所以我们更该投入很大的精力,希望大家多作原创,为原创作者、原创站点提供合理的排序和流量。
本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/60360.html
如有侵犯您的合法权益请发邮件951076433@qq.com联系删除