作者:zhixinba 发表时间:2019-03-20 13:56:05
在爬行与抓取这两项工作准备好以后,搜索引擎就等着用户来搜索了。而搜索时,就与排名有关了。
当我们输入一个关键词时,它得首先进行分词,分词之后,会进行拼写矫正,看看是否输入正确。
K1 f1,f2,f3......fn
K2 f1,f2,f3......fn
K3
...
Kn f1,f2,f3......fn
在分词之后,会形成关键词,也就是k1,k2.....而每一个关键词对应无数个页面,从f1到fn,就是说有很多页面里都会有这个关键词。同时这个页面也会根据关键词的权重进行排序,f1是权重最高的。
不管我们输入什么词,在最下面会显示有超过一亿个结果,但是能够显示的也就只有70来页,就算能够全部显示出来,后面也是一些杂乱无章的东西。所以为了提升搜索引擎获取数据信息的速度,就出现了初始子集这个名词,它是指大范围里一个很小的区域,只要把这些文件匹配好就可以了。
在初始子集的选择里最后说到了匹配,那要怎么进行匹配呢?就要进行相关性计算了。主要的包括了关键词出现的次数,出现的位置等,可以通过这些指标或者是属性来匹配合适的搜索结果。
输入关键词搜索,所看到的结果的过程就被称为排名显示。
大家每次的搜索结果,它都是在搜索缓存里面的,也就是在百度或者谷歌里暂时存储起来了,这样就不用每次搜索时,都从庞大的原始数据库里去查找、匹配,这样可以节省时间,提高效率。
这个日志,是只有百度自己能看到,就比如说,用户搜索什么词、什么时候搜索的、用户所在的IP、进来后都点了哪些链接等数据都会记录下来。然后有内部人士通过这些数据
来分析,再把得到的结论进行不断优化,改进关键词页面的一个排名。
上一篇:搜索引擎的工作原理是什么?
优圣软件完美的策划方案能够让您的网站在同行间异军突起,让你的产品更快速、最大价值化的销售出去
让你的网站上线一个月就排在百度首页LET YOUR WEB SITE ON-LIFE FOR A MONTH ON THE BAIDU HOME PAGE
Copyright © 2023 贺州优圣互联网络科技有限公司 All Rights Reserved 桂ICP备2023004489号-5 地址:贺州市八步区八达西路443号