Erlang:一個通用的網絡服務器
2010-01-13 23:12:05
導語: 前面幾篇文章里談到了Erlang的gen_tcp網絡編程和Erlang/OPT的gen_server模塊,現在讓我們將它們兩者綁定在一起
Lucene進階:and 和or的條件查詢
2010-01-13 23:10:41
導語: 在用Lucene實現全站搜索的過程中,很可能會遇到這樣的問題,只所有某種特定的信息資源,而不是全部.如:某綜合性站點,有新聞,產品,論壇,Blog,視頻等資源,而搜索的時候先選一個類型(下拉列表),再輸入關鍵字進行搜索(當
Lucene(Lucence)建立索引(字段)
2010-01-13 23:09:43
導語: Lucene,這是官方稱謂,也有許多人叫它Lucence,做搜索和分詞用的工具包.也有人說是Java下的搜索引擎框架庫,見仁見智的說法罷了.不管叫什么,確實非常有用,比如做全站的搜索,其實它的用處遠大于此,但凡涉及到文本搜索
Lucene應用的一點體會
2010-01-13 23:07:22
導語: Lucene應用(我用的是Lucene2.1.0,有些觀點有可能也不太正確)1.多線程索引,共享同一個IndexWriter對象這種方式效率很慢,主要原因是因為:java 代碼 public void addDocument(Document doc, Analyzer
關鍵詞:應用
帶局部統計識別高頻詞匯及人名識別的Lucene中文
2010-01-13 23:06:10
導語: 經過努力終于在 引入局部統計識別高頻詞匯的Lucene中文分詞程序 以及 基于詞典的最大匹配的Lucene中文分詞程序 把中文人名識別功能加入,能把大部分的中文姓名識別出來,結果喜人。
基于詞典的最大匹配的Lucene中文分詞程序
2010-01-13 23:04:42
導語: 把自己之前完成的基于詞典的最大匹配的中文分詞程序修改成基于Lucene。其中包括了3種詞典的組織形式:簡單順序存儲SimpleDictionary,首字Hash詞典HashDictionary,雙重Hash詞典;例外實現了兩種分詞算法:正向最大