求 MongoDB 全文搜索思路指导。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ooh
V2EX    MongoDB

求 MongoDB 全文搜索思路指导。

  •  
  •   ooh 2014-03-16 22:26:30 +08:00 6623 次点击
    这是一个创建于 4228 天前的主题,其中的信息可能已经有所发展或是发生改变。
    数据已经接近700w,在100w的时候只是对标题进行检索就是很让人难以接受的了,为了提供更好的搜索体验,同时也要对内容进行检索,恩,要上全文搜索。以前没接触过,但是听说过sphinx,最近一次在面试的时候,也有提到solr。
    我寻思如果能用sphinx,当然最好,但是了解了一下,sphinx对中文支持不是很好;好了来到coreseek,但是我看了一下版本有点老了,这点有点忧虑;最后了解了一下solr,看样子很复杂,要格外装的东西略多。
    好了,接触一个新的领域,出现选择困难症状了,上面三个无论选择那个无疑都能轻松的搞定我的问题,但是,想来学一个新的东西,肯定要选个易学易用的,这方面的资料有点匮乏,想让大家给我出出主意,谢谢。
    语言用的Python,数据更新不是很频繁,可能也就一天更新一次或一周更新一次。
    第 1 条附言    2014-03-20 11:46:26 +08:00
    最终选择了solr:简单粗暴,中文支持很好,分词插件配置也比较简单,自动补全很好用。
    安装的东西略多,JDK,Tomcat...但是配置过一次就比较简单啦
    返回的数据处理起来感觉有点麻烦
    不过用上全文搜索速度不是上了一两个档次
    腰也不疼了,上楼也有劲了,感谢上次面试让我了解了这方面的知识,充分说明有空要去多面试
    9 条回复    2014-05-04 23:00:51 +08:00
    hpxl
        1
    hpxl  
       2014-03-16 22:29:38 +08:00   1
    可以用Xunsearch实现,支持php sdk。http://www.xunsearch.com
    chloerei
        2
    chloerei  
       2014-03-16 22:30:09 +08:00   3
    chol
        3
    chol  
       2014-03-16 23:16:48 +08:00   1
    ElasticSearch 10亿没问题,我们做过全面的测试;专门做全文检索的,和关系型数据库、NoSQL的衍生品根本不在一个数量级上
    ooh
        4
    ooh  
    OP
       2014-03-16 23:25:03 +08:00
    @hpxl
    @chloerei
    @chol
    脑袋瓜已经不够用了。。。
    humiaozuzu
        5
    humiaozuzu  
       2014-03-20 12:06:42 +08:00
    ElasticSearch +1
    ooh
        6
    ooh  
    OP
       2014-03-20 12:13:34 +08:00
    @humiaozuzu 听说很耗内存,高富帅产品是真的吗,只是找了个满足需求入门比较简单的。
    humiaozuzu
        7
    humiaozuzu  
       2014-03-20 12:19:07 +08:00
    @ooh 点头,java的都烧内存。。。
    notnumb
        8
    notnumb  
       2014-03-20 17:54:48 +08:00
    同样的硬件,如果软件优化方面都是一个水平,不会某个特别快,某个特别慢。重要看场景。
    不要抱怨mysql的fsync慢。fsync考虑的是操作的可靠性。
    重要是看你自己的需求就是需不需要mongodb或者是ElasticSearch某些特性。
    偏激的吹嘘ElasticSearch,只能说明盲目而已。
    captain234
        9
    captain234  
       2014-05-04 23:00:51 +08:00
    mongo 2.6已经支持全文索引了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2680 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 14:53 PVG 22:53 LAX 07:53 JFK 10:53
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86