我们都希望自己的网站做出来被搜索引擎收录,但是很多时候事与愿违,做了一个月的网站了,弄好之后,在搜索引擎上面还是找不到相关信息,甚至连自己的公司名称都搜索不到。这个是什么原因呢? 首先,我们要了解下搜索引擎的收录。 搜索引擎在抓取一个网站之后,首先会判断这个网站的页面的新颖程度,页面是否有重复,内容的质量是否充实。这个叫做蜘蛛爬行。如果的你的页面跟其他的网站存在90%以上的高度重复,那么搜索引擎就会跳过你这个网页的收录。当然,即使你的网站是新颖的,但是内容大部分是抄袭的,甚至是复制的,也是不能被收录的,这种页面也是不会抓取的。 在一个页面被抓取之后,搜索引擎下一步就是处理页面了。其中,较重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析**链接、计算网页的重要度/丰富度等。这一步就直接把那些质量度差的网页直接去除了。 第三步就是提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。 在了解了搜索引擎的基本原理之后,相信大家都会有了更深的了解,在懂得了原理之后,才能对症下药,做到事半功倍,而不是忙碌了半天最后发现是无用功!