1.8 本章小结

这一章作为本书的第一章,介绍了信息过载和信息检索的概念以及信息检索中的常用术语,之后介绍了分词的原理与分词算法,重点介绍了搜索引擎中倒排索引这种数据结构,最后介绍了检索模型中的布尔检索模型、tf-idf词元权重计算、向量空间模型以及概率检索模型。通过本章的学习,读者应该能了解Lucene的数学模型,知其然也知其所以然。