搜索引擎建好检索数据库后,就能为用户提供检索服务了。当用户输入一个搜索关键字后,搜索引擎第一会处置搜索关键字,将它进行过滤和拆分,然后从索引数据库中将与之匹配的页面提取出来,再通过不一样的维度对页面的得分进行综合排序,最后再通过采集用户搜索数据对结果进行优化,此时就能得到最后的搜索结果。
1、处置搜索关键字
和处置页面的关键字一样,对用户输入的搜索关键字也需要进行拆分和降噪等操作,将它拆分为关键字组,并剔除对搜索结果影晌不大的词。如输入“衣服缩水了如何解决啊”,搜索引擎就会删除其中的了”和“啊”,然后将剩余的文字拆分为“衣服”“缩水”“如何解决3个关键字。
2、提取页面
确定好关键字后,搜索引擎就会从检索数据库中提取出包括有这关键字的页面,但这类页面并不会全部参与排名。由于搜索结果一般会有几十万甚至上干万条,全部进行排名会使计算量很大、速度很慢,而且用户一般也只能查询前面几页的结果,所以搜索引擎一般不会显示所有些搜索结果,只能显示网站权重高的几百条搜索结果。
3、综合排序
搜索引擎会依据不同维度的得分对参与排名的页面进行综合排序,以得到最后的搜索结果。综合排序主要包含以下6个方面的内容。
有关性丨有关性指页面内容与搜索关键字的匹配程度,如页面所包括搜索关键字的个数,这类关键字出现的地方,与外部网页指向该页面所用的锚文本等可以体现页面内容与搜索关键字的匹配程度的指标。
权威性|权威性更高的网站提供的内容更真实靠谱,所以其网页排名越靠前。
时效性|时效性指页面是不是为新出现的网页,且页面内容是新鲜的。现在,时效性在搜索引擎的排序中愈加要紧。
丰富度|丰富度指页面内容的丰富程度。假如页面内容非常丰富那样它不仅能够满足用户的单一需要,还可以满足用户的延伸需要。
加权|加权指通过人工方法提升某些页面(如官方网站、特殊通道页面等)的排名。
降权丨降权指减少有作弊嫌疑的网页的排名的做法
4、检索优化
最后,搜索引擎还会依据用户的IP地址、搜索时间、以往的搜索记录与浏览过的网页等信息对搜索结果进行优化通过IP地址可以获得用户所在的区域,依据各区域用户的搜索习惯,可以返回用户特定地域的排名结果。通过搜索时间、以往的搜索记录与浏览过的网页等信息好了解用户的搜索习惯与对什么内容更为关心,从而给出更准确化和个性化的搜索结果。
本文名字影响网站优化结果的几个要紧原因