/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
如果您是開發java相關的編程人員的話可以來試試這款Apache Lucene官方版,這是一個JAVA檢索引擎工具包,是一個是一個全文檢索引擎的架構,這款Apache Lucene官方版提供了完整的查詢引擎和索引引擎,部分文本分析引擎,有需要的朋友本不要錯過哦!
Lucene是一個高性能、可伸縮的信息搜索(IR)庫。它可以為你的應用程序添加索引和搜索能力。Lucene是用java實現的、成熟的開源項目,是著名的Apache Jakarta大家庭的一員,並且基於Apache軟件許可 [ASF, License]。同樣,Lucene是
當前非常流行的、免費的Java信息搜索(IR)庫。
Lucene作為一個全文檢索引擎,其具有如下突出的優點:
索引文件格式獨立於應用平台。Lucene定義了一套以8位字節為基礎的索引文件格式,使得兼容係統或者不同平台的應用能夠共享建立的索引文件。
在傳統全文檢索引擎的倒排索引的基礎上,實現了分塊索引,能夠針對新的文件建立小文件索引,提升索引速度。然後通過與原有索引的合並,達到優化的目的。
優秀的麵向對象的係統架構,使得對於Lucene擴展的學習難度降低,方便擴充新功能。
設計了獨立於語言和文件格式的文本分析接口,索引器通過接受Token流完成索引文件的創立,用戶擴展新的語言和文件格式,隻需要實現文本分析的接口。
已經默認實現了一套強大的查詢引擎,用戶無需自己編寫代碼即使係統可獲得強大的查詢能力,Lucene的查詢實現中默認實現了布爾操作、模糊查詢(Fuzzy Search)、分組查詢等等。
首先,它的開發源代碼發行方式(遵守Apache Software License),在此基礎上程序員不僅僅可以充分的利用Lucene所提供的強大功能,而且可以深入細致的學習到全文檢索引擎製作技術和麵向對象編程的實踐,進而在此基礎上根據應用的
實際情況編寫出更好的更適合當前應用的全文檢索引擎。
其次,Lucene秉承了開放源代碼一貫的架構優良的優勢,設計了一個合理而極具擴充能力的麵向對象架構,程序員可以在Lucene的基礎上擴充各種功能,比如擴充中文處理能力,從文本擴充到HTML、PDF等等文本格式的處理,編寫這些擴展
的功能不僅僅不複雜,而且由於Lucene恰當合理的對係統設備做了程序上的抽象,擴展的功能也能輕易的達到跨平台的能力。
轉移到apache軟件基金會後,借助於apache軟件基金會的網絡平台,程序員可以方便的和開發者、其它程序員交流,促成資源的共享,甚至直接獲得已經編寫完備的擴充功能。最後,雖然Lucene使用Java語言寫成,但是開放源代碼社區的程
序員正在不懈的將之使用各種傳統語言實現(例如.net framework),在遵守Lucene索引文件格式的基礎上,使得Lucene能夠運行在各種各樣的平台上,係統管理員可以根據當前的平台適合的語言來合理的選擇。