/./ 虽然后世以百度、谷歌为代表的搜索引擎最终呈献给用户的.只是一个只有一个搜索条和一个搜索按钮的简单页面.但是隐藏在页面后台的却是一个由成千上万台服务器.天文数字级的海量数据.以及一个复杂的搜索引擎软件组成的庞大系统.而这个系统的核心.就是搜索引擎.
搜索引擎虽然很复杂.但是其系统总体架构却并不复杂.主要由网络数据采集模块.数据分析排序模块.数据库.用户查询请求分析模块等组成.起工作流程也很简单:
网络数据采集模块是一个很重要的模块.其主要功能是从网络上抓取网页信息发送回搜索引擎服务器.这个模块有一个很形象的名字.叫做网络蜘蛛.也有人把它叫做网络机器人.之所以叫网络蜘蛛.是因为蜘蛛会踩着它吐的蛛丝在网上漫步.而网络蜘蛛虽然自己不吐丝.但是互联网上的超链接却将无数的网页连接成一个巨大的网.网络蜘蛛则会在这个网上不停地到处爬行.采集网页信息.之所以叫网络机器人.却是因为这种爬行搜索的过程.是完全自动化进行的缘故.
网络蜘蛛将搜集到的网页信息.发送回搜索引擎服务器.由网络数据分析模块对之进行分析.按照一定的算法.给每个网........
全文内容获取中...
请关闭转码、阅读、纯净、屏蔽等模式,导致内容显示不全
如关闭后仍无法显示请下载纯净阅读APP或更换浏览器