一、有收入出处的汉字有近10万,而有数据统计1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字时已到99%。因此常用的汉字也就3000个,那么一篇文章就是将这3000常用的汉字进行排列组合,那百度怎么进行判断文章的质量的呢?
相似度?用户体验?导入权重、跳出率?根据语义?导入权重?排版?错别字?字数?主题是否突出?
其实这些都挺好理解的,就像我们学生时代写的作文。
二、关于语义索引:搜索引擎通过索引页面,经过预处理,在正向索引把一篇文章整成一群关键词的集合,再经过倒排索引让每个关键词对应一系列文件。seo前辈昝辉在《语义分析和搜索引擎优化》一文中谈到潜在语义索引:
所谓潜在语义索引指的是,怎样通过海量文献找出词汇之间的关系。当两个词或一组词大量出现在同一个文档中时,这些词之间就可以被认为是语义相关。
举个例子,电脑和计算机这两个词在人们写文章时经常混用,这两个词在大量的网页中同时出现,搜索引擎就会认为这两个词是极为语义相关的。网站主题的形成
通常逻辑和结构适当的网站都会分成不同的频道或栏目。在不同的频道中谈论有些区别但紧密相关的话题,这些话题共同形成网站的主题。搜索引擎在把整个网站的页面收录进去后,能够根据这些主题词之间的语义相关度判断出网站的主题。
这让孤藤想到我们做淘宝客那样的单页面的时候,在网站文章随机插入关键词、锚文本搞内链,这么说来对于关键词的排名是不利的。
三、关于文章的相关性,昝辉在他的《seo实战密码》中也有指到,搜索引擎在去重的时候,他通常是提取10个特征关键词(出现频率最高的关键词)然后计算这些关键词的数字指纹。孤藤猜想这是不是也可以用在文章的质量上呢,通过提取部分特征关键词判断这些关键词与符不符合文章、网站主题,这些特征关键词之间是否有相关性。
四、孤藤猜想的打造高质量文章的注意事项(或原创或伪原创):
1.文章跟网站主题相关,不要做标题党,标题最好做到唯一性,标题不要太长(将心比心一个太长的标题是不是反映了你网站主题不够简洁,或者你概括能力不够强呢?),对于文章的核心关键词或相关关键词可以适当的多出现几次。
2.做好内链,当然如果能有外链就更好了。
3.做好文章的排版,少出现错别字,用好h2-h6标签,文章的核心关键词加粗,有涉及到相关文章做好链接。
4.字数不能太少,如果能有图文并茂那是最好的。
本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/49509.html
如有侵犯您的合法权益请发邮件951076433@qq.com联系删除