thinking-sphinx 中文支援的問題


#1

想為網站加上全文搜尋功能,從最多星的sunpot試,結果試到heroku無法部署,之後再試sphinx,結果中文沒辦法搜尋,兩個套件試過都蠻好用的,私心是比較喜歡sphinx啦…畢竟快又開源…



花了一整天,有找過網路上的討論
(裝上去5分鐘,結果中文支援花了五小時也沒搞定…),看來是以前不支援utf-8,到後面sphinx跟thinking改版後兩邊都有支援了,但網路上找到的中文支援好像不多,不知道大大嗎怎麼解決這一段呢,謝謝


#3

sphinx.yml.zip (8.7 KB)

抱歉最近卡了一堆事情,還被人催要回文 X"DD, anyway 上傳一個檔案過來,這是我過去的設定檔,其中的 CJK 的 charset_tables,其實來源來自於

http://sphinxsearch.com/wiki/doku.php?id=charset_tables

不過還有增加一些設定,而這個是 thinking-sphinx 1.3.18 的設定檔,所以現在肯定用不了(當然如果你調整成可以用了,請分享上來哩), but 這些都是針對 sphinx 的設定,thinking-sphinx 只是一個 gem 用 sphinx server,所以這份的 charset_tables 還是可以用就是了

分詞法 / 分詞演算法 / 分詞系統 一直都是自建搜尋引擎困難的點,尤其是 CJK,而這份是最簡單的兩字元切割後建 index 就是了,有問題再另外提出就是


#4

感謝XD,找機會來試試:blush: