有没有熟悉 clickhouse 的? clickhouse 对于分布式支持的如何? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
red13
V2EX    程序员

有没有熟悉 clickhouse 的? clickhouse 对于分布式支持的如何?

  •  
  •   red13 2 天前 1250 次点击

    要对一个大数据量的 table 进行查询,不会有复杂的查询逻辑,都是简单的 where 、order by 、group by 、sum 、avg 、count 查询,当前数据量接近 500 亿了,在半年内会增加到一万亿。

    目前方案是使用 spark ,我知道 clickhouse 很适合 olap 查询场景并且速度很快,但 clickhouse 对于 10000 亿数据量能扛得住吗?或者 clickhouse 也能很好的支持分布式?

    对 clickhouse 了解不是很深入,希望大佬指点

    amoia50
        1
    amoia50  
       2 天前 via iPhone
    分布式运维比较难直接上 Doris 或者 starrocks
    zqr10159
        2
    zqr10159  
       2 天前
    直接用 doris 就行了
    sealinfree
        3
    sealinfree  
       1 天前 via iPhone
    我存日志,有 573 亿,做了 7 个 clickhouse ,都是虚拟机,同一台全闪 7525 ,查询毫秒级,数据库后端这部分自己写的,没用其他中间件,体验很好,升级也没有太多坑,已经线上用了三年多了
    chenxytw
        4
    chenxytw  
       1 天前
    Check the `Distributed table engine` of clickhouse.
    1 trilliion rows is not big for clickhouse, the key is how your data partition.
    what's the columns split your data, what's the minimum & maximum rows of one part, and how many parts of your general query will read.
    For `order by` and `group by`, you will also focus on the columns you used,
    clickhouse is not good at non primary key, you can check what called `mark` in clickhouse.
    If your query sample from or sort in many marks, it will cause very low performance.
    red13
        5
    red13  
    OP
       1 天前
    @sealinfree 可以告知服务器的配置吗?
    sealinfree
        6
    sealinfree  
       19 小时 13 分钟前
    @red13 单台虚拟机 8 核心 24G 内存,服务器是 PowerEdge R7525 ,处理器:AMD EPYC 7H12 ,服务器负载常年 10%左右,服务器上还有其他业务一共 20 个左右虚拟机,clickhouse 只有 7 个
    ryh
        7
    ryh  
       2 小时 35 分钟前
    菜鸟的我第一次听说 clickhouse 还是从 PostHog 里, 一个开源的提供 SaaS 的分析工具平台,用的 clickhouse, 他们的体量应该不小(客户 top 3 是 ycombinator, mistral, supabase),有源码可以参考( https://github.com/PostHog/posthog/blob/master/posthog/clickhouse/cluster.py
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5358 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 34ms UTC 07:58 PVG 15:58 LAX 00:58 JFK 03:58
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86