![]() |
|
首页 新站提交 分类大全 待审网站 最新收录 最新点入 最新点出 拉黑网站 百度算法 收录问答 |
当前位置:首页 > 收录规则 > 百度检索系统包含5个部分 | 发表:2013年12月3日 | 点击率:1563 |
百度检索系统包含5个部分 |
百度对已收录的内容有一个检索系统,这个系统主要包含5个部分: (1)Query串切词分词→(2)查出含每个term的文档集合→(3)求交→(4)各种过滤→(5)最终排序 (1)Query串切词分词:把用户的查询词进行分词; (2)查出含每个term的文档集合:找出待选集合; (3)求交:交集可能是我们需要找的文档,整个求交过程实际上关系着整个系统的性能,这里面包含了使用缓存等等手段进行性能优化; (4)各种过滤:把死链、重复数据、色情、垃圾结果、你懂的都过滤掉; (5)最终排序:将最能满足用户需求的结果排序在最前,可能包括的有用信息如:网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等。 |
©2012-2022 TNT网站收录www.tnt123.com 网站地图 |