上一个最新的 Lucene 版本还只是 2.4.1 ,而此次直奔 2.9.0 ,如果不是有重大的提升或者改变意向,或者为 3.x 系列做准备的话,不至于版本号上升这么多。
果不其然,改版是为了向后兼容的问题,大量的修改了运行时的行为、API 等,当然也有很多功能增强、bugfix 以及优化等等,因此该版本值得花时间去研究一下改进的内容。
主要的改进内容有(更详细的内容还得看 Changes ):
- Per segment searching and caching (can lead to much faster reopen among other things)
- IndexWriter 增加了近乎实时的搜索能力
- 新的Query类型
- 更加智能和可扩展的 multi-term 查询,包括 wildcard,range 等
- 一个新的经过优化的收藏和评分的API
- 改进对 Unicode 的支持
- 一个新的基于属性的 TokenStream API
- 新的 QueryParser 框架,用以替代现有的 QueryParser
- 当对域进行排序时,评分机制是可选的
- 新的分析器,包括:PersianAnalyzer, ArabicAnalyzer, SmartChineseAnalyzer (最后这个是智能中文分析器)
- 新的快速向量高亮处理大文档的方法
- 支持高性能的数字域的处理,而不像以前版本那样需要转为文本存储
下载地址:
http://www.apache.org/dyn/closer.cgi/lucene/java/ |