有哪个全文检索引擎能好好对应中文? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
cmkpl

有哪个全文检索引擎能好好对应中文?

  •  
  •   cmkpl Jan 24, 2015 4040 views
    This topic created in 4117 days ago, the information mentioned may be changed or developed.

    Solr? Sphinx?

    16 replies    2015-01-26 13:54:19 +08:00
    abelyao
        1
    abelyao  
       Jan 24, 2015   1
    说个可能不符合楼主需求的,SAE 有个全文检索的接口,因为我的项目是部署在 SAE 上的,打算接下来使用这个服务,效果现在还不清楚: http://sae.sina.com.cn/doc/php/fts.html
    zeroten
        3
    zeroten  
       Jan 24, 2015
    @cmkpl 记得sae有国外的服务器
    abelyao
        4
    abelyao  
       Jan 24, 2015
    @cmkpl 如果你是面向国内用户的,SAE 其实也可以考虑一下,无备案的域名也可以绑定,原理是绕道 香港 或 美国 或 日本 去代理一下,访问速度稍慢一些而已
    fising
        5
    fising  
       Jan 24, 2015 via iPad
    阿里云
    kslr
        6
    kslr  
       Jan 24, 2015 via Android
    资料太少,无法分析,solr还要装java sphinx简单好用,但是要看情况
    Tianpu
        7
    Tianpu  
       Jan 24, 2015
    vibbow
        8
    vibbow  
       Jan 24, 2015
    http://azure.microsoft.com/zh-cn/services/search/
    不知道对中文支持怎么样。。。
    Agromania
        9
    Agromania  
       Jan 24, 2015   1
    sphinx就是个小玩具……solr其实搭起来非常简单的,elastic search也很不错,不过我没用过。
    两者都是基于lucene,有很多成熟的中文分词插件。
        10
    scarlex  
       Jan 25, 2015
    elastic search +1
    juicy
        11
    juicy  
       Jan 25, 2015
    elasticsearch不错,前段时间刚用它来做了个全文搜索~
    mengskysama
        12
    mengskysama  
       Jan 25, 2015
    sphinx 中文支持分词的分支 coreseek 已经出到5了。

    前几天尝试了xunsearch和sphinx对每个字建立索引,也就是等于没分词,查询速度来说sphinx比sphinx快很多。sphinx用起来也方面,协议也完全兼容mysql,你可以像捅mysql一样捅他的9306。

    重点是分词引擎好不好以及词库好不好,直接影响到搜索结果的完整性。(有人和我说分词完整性xunsearch不如coreseek5具体怎么样有待验证)。
    pubby
        13
    pubby  
       Jan 25, 2015 via Android
    @mengskysama coreseek5跳票一年了都不见更新,估计不再维护了吧
    armstrong
        14
    armstrong  
       Jan 25, 2015
    推荐ElasticSearch,前段时间刚用过,很不错
    mengskysama
        15
    mengskysama  
       Jan 25, 2015   1
    pubby
        16
    pubby  
       Jan 26, 2015
    @mengskysama 有用过吗?目前还在用3.2的,csft后来的版本都不稳定,不敢在线上使用。
    About     Help     Advertise     Blog     API     FAQ     Solana     2444 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 55ms UTC 02:08 PVG 10:08 LAX 19:08 JFK 22:08
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86