网站首页 / 新闻中心 / 简单了解搜索引擎的工作原理

简单了解搜索引擎的工作原理

发布者: 八维 | 1504 次阅读

FIRST:网站优化其实就是通过一些优化手段在保证用户体验的基础上去迎合搜索引擎的习惯然后让网站获得一个好的排名。作为一个合格的网站优化人员你必须了解搜索引擎的工作原理。
网站优化其实就是通过一些优化手段在保证用户体验的基础上去迎合搜索引擎的习惯然后让网站获得一个好的排名。作为一个合格的网站优化人员你必须了解搜索引擎的工作原理。

因为很多网站优化的技巧都是基于对搜索引擎的理解。

网站优化就是尽量减少搜索引擎的工作量和降低搜索引擎的工作难度,使搜索引擎能更轻松快速地收录网站页面,更准确地提取页面的内容。      

搜索引擎的工作大体上可以分成三个阶段:

1、爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面的html代码然后存入到自己的数据库当中
2、预处理:索引程序对抓取的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。
3、排名:当用户输入关键词后,排名程序调用索引数据,然后计算其相关性再按一定格式生成搜索结果页面。

网站和页面的权重、网页的更新速度、导入的链接以及网站的结构这些都是影响搜索引擎蜘蛛抓取网站页面的因素。

        搜索引擎抓取的原始页面并不能直接用于查询排名。预处理首先要做的就是从网站的html文件中取出标签、程序,然后提取出可以用于排名处理的网页文字内容。搜索引擎蜘蛛除了认识文字,也会提取一些特殊的包含文字的代码,拨入meta标签中的文字,图片中alt标签里面的文字,以及锚文本等。排名就是经过搜索引擎蜘蛛抓取页面,索引程序计算得到倒排索引后,搜索引擎就准备好可以随时处理用户搜索了。用户在搜索框填入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程是与用户直接互动的。搜索词处理搜索引擎接收到用户输入的搜索词后,需要对搜索词做一些处理,才能进入排名过程。搜索词经过处理后,搜索引擎得到的是以词为基础的关键词集合。文件匹配阶段就是找出含有所有关键词的文件。在索引部分提到的倒排索引使得文件匹配能够快速完成。找到的文件经常会有几十万几百万,甚至上千万个。用户可能只看前两页,搜索引擎结果也只显示一部分。上面还有说到一个排名相关性,关键词常用程度(这个可以通过百度指数来指导)、词频和密度、关键词位置和形式、链接和网页权重这些都是影响相关性计算的因素。

相关性计算使搜索引擎中最令网站优化人员感兴趣的部分了。

 
八维网

【信息来源】

八维网

上一篇:是否考虑过要如何真正做好SEO呢? 下一篇:拿到一个站点,考虑SEO要解决的问题?

相关文章: