首页       新站提交       分类大全       待审网站       最新收录       最新点入       最新点出       拉黑网站       百度算法       收录问答      
当前位置:首页 > 收录规则 > 百度检索系统包含5个部分 发表:2013年12月3日 点击率:1460

百度检索系统包含5个部分

百度对已收录的内容有一个检索系统,这个系统主要包含5个部分:

(1)Query串切词分词→(2)查出含每个term的文档集合→(3)求交→(4)各种过滤→(5)最终排序

(1)Query串切词分词:把用户的查询词进行分词;

(2)查出含每个term的文档集合:找出待选集合;

(3)求交:交集可能是我们需要找的文档,整个求交过程实际上关系着整个系统的性能,这里面包含了使用缓存等等手段进行性能优化;

(4)各种过滤:把死链、重复数据、色情、垃圾结果、你懂的都过滤掉;

(5)最终排序:将最能满足用户需求的结果排序在最前,可能包括的有用信息如:网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等。

收藏本页→
©2012-2022 TNT网站收录www.tnt123.com 网站地图