搜索引擎工作的原理是什么?

  • A+
所属分类:SEO高级

世界各大搜索引擎发展到现在,其实技术水平都是差不多的,所以了解我们国内的搜索引擎(http://zhanzhang.baidu.com/wiki/9)老大哥 ‘百度’的搜索引擎的算法工作原理后,其他的搜索引擎也是一样的。

从百度的搜索引擎基础知识为我们分析了百度搜索引擎工作的原理的四个过程,抓取、过滤、建立索引和输出结果。下面为大家来说一下几个不好理解的要点。

什么是搜索引擎频率值?
a)、搜索引擎的硬件是有限的.不可能有太多资源对年—个网页频繁光顾,简单来理解就是不同的网站,搜索引擎光顾的频率是不一样。有些网站—天来抓取几百上千次,但是有的—天只有一次,也可能几天才回来一次。
b)、影响频率值:
虽然蜘蛛针对不用的网站的有不同的频率值,但是我们可过过做一些世情来影响它的频率值。
c)、提升频率度的方法:
经常更新的网站,往往频率值会比较高,所以尽可能持续更新:搜索引擎会形成习惯的,为了更加高效的工作,它会特别关注那些经常更新的网站。

网站历史记录:
a)、我f门网站所有的历史会被搜索引肇记录下来,搜索引肇的计算过程会参考您的网站历史中的表现。
b)、这里提醒大家:网站前期不要犯错误,必须在进行网站建设的时候不要做错误的事情,—定要谨慎,比如原创、网站的结构等等,在后期评估页面质量的时候会参考你前期的工作。
c)、三岁看到老,道理都是一样:搜索引擎执行的是人的意志.在你的“小时候”行为引擎都会记录在案的。
   过度优化:
a)网页中加入隐藏的文字、隐藏的链接;
b)与网页内容不相关的关键词;
c)具有欺骗性跳转或者陌欺骗性的重定向;
d)专门针列搜索引擎的桥页,即所谓的过度页;
e)针对程序生成的内容:制造大量的内容,命中搜索引擎结果
f)大量重复无价值的内容:
g)充斥着大量恶意广告、恶意代码的页面;
h)群发链接等等
    过滤:

百度搜索引擎基础知识中这样解释:”互联网中并非所有的网页都对用户有意义,比如一些明显的欺骗用户的网页,死链接,空白内容页面等。这些网页对用户、站长和百度来说,都没有足够的价值,因此百度会自动对这些内容进行过滤,以避免为用户和您的网站带来不必要的麻烦”。所以站长应该注意的问题:
a)、不要欺骗用户;
b)、对内容的把握上很多人是没什么概念的;比如采集,很多人乐l比不密,其实对收录有很坏的影响
c)、误区:所谓搜索引擎抓取就是被搜索引擎收录了;事实上:搜索引擎抓取—个页面,跟搜索引擘收录—个页面是不同的,他们之间还有—个环节叫做过滤,搜索引擎做算法码整更多是对过滤环节的调整。
d)、收录的问题往往集中在否能够通过‘过滤’:蜘蛛来抓我们的页面向来不是问题.我们没有收录的页面不是因为蜘蛛没过来,往往是因为在搜索引擎看来页面对用户没有价值。被过滤掉就进不了搜索引擎的—个数据库,也就是没收录。

建立索引:

在百度搜索引擎基础知识中“建立索引”中,我们可以看到百度已经对网站的关键词并没有提及到。这个提醒我们keywords已经不重要了。

输出结果:
a)、按照道理到这里搜索引擎的工作应该就结束了,事实上搜索引擎的工作才刚刚开始它要对搜素结果进行持续关注:
b)、比如同—个词的搜索结果,排名第—的网站,用户的跳出率极高.而排名第三的用户体验非常好的话,那么排名的顺序就要再次进行调整了。
以上是搜索引擎工作最基本的原理。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: