搜索引擎的工作分为三个阶段,即爬行,索引和检索。
1、爬行
搜索引擎具有网络爬虫或蜘蛛来执行爬网。爬虫的任务是访问网页,阅读它并按照指向该网站其他网页的链接。每次抓取工具访问网页时,它都会复制该网页并将其网址添加到索引中。添加网址后,它会定期访问网站,例如每个月或两个月,以查找更新或更改。
2、索引
在此阶段,爬网程序会创建搜索引擎的索引。索引就像一本巨大的书,其中包含爬虫找到的每个网页的副本。如果任何网页发生更改,则抓取工具会使用新内容更新图书。
因此,索引包括爬虫访问的不同网页的URL,并包含爬虫收集的信息。搜索引擎使用此信息为用户的查询提供相关答案。如果页面未添加到索引,则用户将无法使用该页面。
3、检索
这是搜索引擎以特定顺序提供最有用和最相关答案的最后阶段。搜索引擎使用算法来改进搜索结果,以便只有真实的信息才能传达给用户,例如PageRank是搜索引擎使用的流行算法。它会转移到索引中记录的页面,并在其认为最佳的结果的第一页上显示这些网页。
本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/11261.html
如有侵犯您的合法权益请发邮件951076433@qq.com联系删除