搜索引擎的工作原理
今天让我来浅谈一下SEO到底是什么以及搜索引擎的抓取的工作原理。SearchEngineOptimization中文翻译过来:搜索引擎优化,也就是我们天天梦绕魂牵的SEO了,简单的理解:通过优化搜索引擎自然搜索获得排名和流量的技术和过程就是SEO。其实网站优化分为站内和站外两部分优化,站内既是网站内部结构的调整,站外便是一些外部链接的投放以及友链的交换等等。
在这时候就会有人问了,我们为什么要做SEO,而不直接通过SEM竞价而去做推广?流量高,转换快?等等?我在这里解释一下,SEO一般搜索质量很高。1.不存在恶意点击的现象。2而且长期有效,像类似SEM付费推广一旦停止投放流量便是直接中断。3.成本相对低(相对于SEM来说)所以通过这3点便可以看出SEO的优势在哪里,但是不可否认SEO的劣势便是效果慢,对于那些急需做项目需要展现的公司来说SEM竞价确实是不二之选,但是从长期打算的角度来讲SEO确实是是我们不得不做的工作之一。
那么学习SEO新手们应该从哪里开始下手学习呢,知己知彼便能天下无敌,所以要想做好SEO,那么我们必须要知道搜索引擎到底是个什么东西,他到底在其中捣什么鬼,我们可以不懂编程,但是我们必须要了解搜索引擎的原理到底是什么;这是SEO新手第一堂课必学的东西。
简单说 搜索引擎的工作原理:由蜘蛛程序沿着链接爬行和抓取大量的页面,存入数据库,然后预处理,当用户搜索关键词的时候,搜索引擎排序程序会选出搜索词相关要求的页面。
爬行和抓取:spider(搜索引擎)通过跟踪相对的链接进行访问页面,获得HTML的代码从而存入数据库
预处理:索引程序对抓取的页面进行文字上的提取,索引成立,中文上的分词以备后续的排名工作。
排名:用户输入关键词:排名程序调用索引器,计算相关性,然后按生产结果做展现。
注释spider(蜘蛛) 搜索引擎负责爬行和访问的一个机器人;spider一般爬行访问都是先从网站根目录robots.txt文件开始;同时spider也有自己的代理名称,站长可以在日志文件看到蜘蛛的代理名称从而分辨是否是搜索引擎蜘蛛了。
常见的搜索引擎蜘蛛名称:
Baiduspider+(+http://www。baidu。com/search/spider。htm)百度蜘蛛
Mozilla/5.0(compatible;Yahoo!Slurp China;http://misc。yahoo。com。cn/help。html)雅虎中国蜘蛛
Mozilla/5.0(compatible;Yahoo!Slurp/3.0;http://help。yahoo。com/help/us/ysearch/slurp)英文雅虎蜘蛛
Mozilla/50.(compatible;Googlebot/2.1;+http://www.google。com/bot。html)Google蜘蛛
msnbot/1.1(+http://search.msn.com/msnbot.htm)微软Bing蜘蛛
Sogou+web+robot+(+http://www。sogou。com/docs/help/webmasters。htm#07)搜狗蜘蛛
Sosospider+(+http://help.soso。com/webspider。htm)搜搜蜘蛛
Mozilla/2.0(compatible;YodaoBot/1.0;http://www。yodao。com/help/webmaster/spider/;)有道蜘蛛
{:7_186:} {:4_117:} {:4_117:} {:4_117:} {:4_103:} 好贴 {:4_117:} {:6_162:} {:5_128:}
页:
[1]
2