加入收藏
担路网,一路担当!

为企业提供互联网工具,让供需互动变得触手可及

这两年,互联网让整个不太景气的传统经济稍有了零星的兴奋点。

但是,实在的企业老板**不能把互联网当成救市良药,若真把它当成“良药”,无异于传说中的“马踏飞燕”。

但是,我们必须拥抱这个互联网的社会,因为我们的家人,我们的朋友,我们的客户都在用互联网,他们的生活和工作已经无法与互联网绝缘!

简析搜索引擎工作原理


发布日期:2017-07-25

一个合格的SEO一定要对搜索引擎的基本原理有一定的了解,很多看似复杂的SEO问题,如果从搜索引擎的原理出发,这些问题就可以迎刃而解了。想要有效地开展SEO工作,一定要知其然并且知其所以然。下面担路网小编就简单为大家介绍一下搜索引擎的工作原理。

搜索引擎的工作过程大概包括三个阶段:

1.爬行和抓取:spider按照一定的策略发现访问页面,将网页抓回服务器。

在这过程中蜘蛛要做的是抓取重要的页面,影响页面重要程度的因素主要包括:网站和页面的权重;页面的更新度;导入链接的数量以及质量;与首页的点击距离;URL结构。

2.预处理:对抓回来的网页进行文字提取、分词、消除噪声、索引、倒排索引等处理。

现在的搜索引擎还是主要以文字为基础的,蜘蛛先将抓回来的网页中的文字去标签、程序。当然除了中文文字,蜘蛛还会提取一些重要的标签:meta标签、alt标签等。然后是分词,将容易产生歧义的词加粗换字体等形式提示搜索引擎。消除噪声是指将对页面主题没有意义的版权声明、广告等。搜索引擎还要对页面进行去重处理:提取页面的特征关键词比对数据库中是否有重复的。然后是建立正向索引:将每个网页简化成一个个关键词,再形成倒排索引:一个关键词对应相应的网页。

3.排名:用户查询关键词,调用排名程序,经过相关计算,形成排名。

搜索引擎接收到用户输入的搜索词之后,将搜索词进行分词、去停止词、指令处理、拼写错误的矫正,然后结合用户用户的地理位置、检索历史等,如果用户的搜索词在缓存中存在就可以直接将缓存结果提供给用户,如果不存在,就从索引库中将网页调取排名呈现,并将该关键词以及对应的结果加入到缓存中去。

SEO要在保证用户体验度的基础下迎合搜索引擎,SEO既要站在用户的角度,也要站在搜索引擎的角度,这样才能更好的优化好网站。




分享到:

加载中
旗下网站
产品体系
其它链接
CONTACT
联系我们
  • 热线:021-39517056 代理商咨询:15121033560
  • 投诉专线: 15121030463
  • 公司地址: 上海松江九亭九杜路349号417/418/419
  • 几万客户见证
  • 6x8小时售后服务
  • 免费的产品培训
  • 基于SaaS的云架构
  • 系统持续更新
友情链接:

高新技术企业编号:GR201631001183        ISO9001证书编号:ZZW16Q1111ROS