具备一定的python开发基础,对爬虫技术和搜索引擎感兴趣的人。
先修条件
具备一定的python开发基础,对爬虫技术和搜索引擎感兴趣的人。建议先学习或掌握以下技能:
Python基础 系列课程
数据挖掘综述 课程
课程描述
倒排表以字或词为关键字进行索引,表中关键字所对应的记录表项记录了出现这个字或词的所有文档,一个表项就是一个字表段,它记录该文档的ID和字符在该文档中出现的位置情况。
由于每个字或词对应的文档数量在动态变化,所以倒排表的建立和维护都较为复杂,但是在查询的时候由于可以一次得到查询关键字所对应的所有文档,所以效率高于正排表。在全文检索中,检索的快速响应是一个最为关键的性能,而索引建立由于在后台进行,尽管效率相对低一些,但不会影响整个搜索引擎的效率。
包含这门课程的系列课程
搜素引擎 系列课程
包含这门课程的岗位课程
学习建议
对于solr的内部实现机制,大家可以不用花费心思去了解,但是对于solr的搭建以及快速搭建一个倒排索引的流程,希望大家能够多多去学习和把握。
学习说明
下载资料:有
评论读取中...