一、搜索引擎工作的基本原理
搜索引擎是根据以下原则计算的:首先,我们知道在web浏览器、百度浏览器、google浏览器、360浏览器中都配置了不同的搜索引擎。它们都有一个共同点,一开始捕获一个模块,然后这个模块就像一个软件程序一样,一旦有用户开始使用这些功能,程序就自动运行,提供用户想要查找的内容。
1、首先网站搭建,填充内容,蜘蛛抓取,识别,最后收录.
2、页面采集——蜘蛛抓取——第一轮计算——收录——第二轮计算(排名)——最后才排序
3、在搜索引擎上,放上一篇文章,我们可以这么理解,蜘蛛它会帮你归纳到一个相关内容中进行匹配与排名,搜索引擎蜘蛛发觉你的文章网站中内容与其他网站不一样,用户浏览网站体验久,会给网站得分给予排名。
二、Baiduspider根据上述网站设置的协议对站点页面进行抓取,但是不可能做到对所有站点一视同仁,会综合考虑站点实际情况确定一个抓取配额,每天定量抓取站点内容,即我们常说的抓取频次。那么百度搜索引擎是根据什么指标来确定对一个网站的抓取频次的呢,主要指标有四个:
1,网站更新频率:更新快多来,更新慢少来,直接影响Baiduspider的来访频率
2,网站更新质量:更新频率提高了,仅仅是吸引了Baiduspier的注意,Baiduspider对质量是有严格要求的,如果网站每天更新出的大量内容都被Baiduspider判定为低质页面,依然没有意义。
3,连通度:网站应该安全稳定、对Baiduspider保持畅通,经常给Baiduspider吃闭门羹可不是好事情
4,站点评价:百度搜索引擎对每个站点都会有一个评价,且这个评价会根据站点情况不断变化,是百度搜索引擎对站点的一个基础打分(绝非外界所说的百度权重),是百度内部一个非常机密的数据。站点评级从不独立使用,会配合其它因子和阈值一起共同影响对网站的抓取和排序。
本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/82366.html
如有侵犯您的合法权益请发邮件951076433@qq.com联系删除