向量存储数据库该如何选择? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
sirz

向量存储数据库该如何选择?

  •  
  •   sirz Apr 24, 2024 3273 views
    This topic created in 736 days ago, the information mentioned may be changed or developed.

    目前了解到的向量存储数据库有如下几种,主要的场景就是 RAG 开发,知识库数据量应该不算特别多,哪种更适合?

    chroma 、 elasticsearch 、 Milvus 、 neo4j 、 opensearch 、 pinecone 、 qdrant 、 redis 、 vespa 、 weaviate 、 pgvector

    24 replies    2025-05-16 23:34:36 +08:00
    LuvYukino
        1
    LuvYukino  
       Apr 24, 2024   1
    elasticsearch
    ren2881971
        2
    ren2881971  
       Apr 24, 2024
    Milvus 这玩意好像是专门的向量数据库
    mmdsun
        3
    mmdsun  
       Apr 24, 2024
    chroma 、Milvus 。
    mark2025
        4
    mark2025  
       Apr 24, 2024   2
    postgres + 插件(PGVector / Svector )
    https://pigsty.cc/zh/blog/pg/pg-eat-db-world/
    jackerbauer
        5
    jackerbauer  
       Apr 24, 2024
    @LuvYukino #1 据说不咋好用啊
    raycool
        6
    raycool  
       Apr 24, 2024
    Milvus
    jackerbauer
        7
    jackerbauer  
       Apr 24, 2024
    最近我们也要搞 RAG ,也在这块选呢,大家也帮忙参考参考,最好能支持混合检索的
    jackerbauer
        8
    jackerbauer  
       Apr 24, 2024
    点乘和欧氏最好都能支持的
    me1onsoda
        9
    me1onsoda  
       Apr 24, 2024
    pg 也支持
    veotax
        10
    veotax  
    PRO
       Apr 24, 2024
    @sirz Casibase ( https://github.com/casibase/casibase )是一套开源的基于 Web 的 AI 知识数据库,直接带有 RAG 聊天功能,也自带向量数据库。GitHub 已达到 2000+ stars ,欢迎体验~
    inhzus
        11
    inhzus  
       Apr 24, 2024
    先用 es ,大而全,文档多。唯一缺点是延迟相对高。有痛点的时候再其它的坑
    ihnfsa
        12
    ihnfsa  
       Apr 24, 2024
    我用过 milvus 和 lancedb ,milvus 功能比较全面,lancedb python api 方便,适合快速开发小 deme 做测试用
    kenvix
        13
    kenvix  
       Apr 24, 2024
    milvus 是最火的那个
    wupher
        14
    wupher  
       Apr 24, 2024
    写个简单的测试集评估一下呗。当然也要结合你的应用场景,比如你想弄个简单的客户端程序,弄个 ES ……

    同样,你要部署于阿里云,opensearch 就是现成的。

    如果你用诸如 LangChain / LlamIndex 连接上述库写个测试不难的。
    mogita
        15
    mogita  
       Apr 24, 2024
    已经熟悉 pg 了,直接用了 pg + pgvector
    lekai63
        16
    lekai63  
       Apr 24, 2024
    看你数据量,10w 以下 pg+vector 没啥问题。

    然后你可以参考 dify 的选择看:他们之前是 weaviate ,现在说是推荐 qdrant 。
    https://docs.dify.ai/v/zh-hans/getting-started/readme/features-and-specifications

    他们在一个 issure 中似乎提到了切换的原因,但我懒得去翻连接了
    B1acKy1in
        17
    B1acKy1in  
       Apr 25, 2024
    个人推荐 Milvus 性能很可以的
    mumbler
        18
    mumbler  
       Apr 25, 2024
    大项目用 Milvus ,小项目用 sqlite+faiss, 单文档用 csv+numpy
    bybyte
        19
    bybyte  
       Apr 25, 2024
    没人提 qdrant 吗
    happyxhw101
        20
    happyxhw101  
       Apr 25, 2024
    实际项目下来 es 最佳,pgvector.rs 其次,mivlus 等专门的向量库通用性太差,需求稍微复杂一点都不支持,而且做到后面往往需要混合搜索(传统搜索+向量搜索),这种 es 无敌
    XDeviation
        21
    XDeviation  
       Apr 25, 2024 via Android
    数据量不大的话用 milvus 最好,这个搜索速度和准确度都是最高的那一档,唯一的问题是 milvus 所有数据都存在内存里,数据量大很容易 OOM
    volvo007
        22
    volvo007  
       Apr 25, 2024
    不愧是最先进的开源数据库。明年估计也要搞类似东西了,先储备起来
    yuxian
        23
    yuxian  
       Apr 25, 2024
    pg + pgvector +1
    fox0001
        24
    fox0001  
       May 16, 2025 via Android
    玩过 Milvus 、Solr (应该类似 elasticsearch )、pgvector 。无脑推荐 Milvus ,在查询速度、功能,都是最强的。pgvector 比较折中,Solr 很慢
    About     Help     Advertise     Blog     API     FAQ     Solana     2760 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 73ms UTC 14:04 PVG 22:04 LAX 07:04 JFK 10:04
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86