关于分库分表的分歧 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
linxiaoziruo
V2EX    Java

关于分库分表的分歧

  •  
  •   linxiaoziruo 2020-09-29 16:27:04 +08:00 3623 次点击
    这是一个创建于 1845 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司新来 DBA,一直在强调目前数据量没必要分库分表。我们目前最大的单表数据量是 1 亿,整个库的数据文件大小 1 个 G 。 我不太能理解分库分表的界限在哪里,到了这个界限会引发哪些性能瓶颈?

    第 1 条附言    200-09-29 17:02:28 +08:00
    不好意思,数据文件是一个 T,笔误啊
    17 条回复    2020-09-30 11:52:41 +08:00
    ruanimal
        1
    ruanimal  
       2020-09-29 16:52:09 +08:00
    数据文件这么小,不分表也没啥吧
    linxiaoziruo
        2
    linxiaoziruo  
    OP
       2020-09-29 17:02:43 +08:00
    @ruanimal 笔误,是一个 T !
    optional
        3
    optional  
       2020-09-29 17:04:42 +08:00 via iPhone
    看负载啊,负载不高干吗分
    xsm1890
        4
    xsm1890  
       2020-09-29 17:08:00 +08:00
    我去,一亿数据就一个 T,我司一亿五千万总文件才步到六十个 G 。是不是存太多大字段了,冗余字段了。感觉这才是需要优化的地方
    xx6412223
        5
    xx6412223  
       2020-09-29 17:11:42 +08:00
    瓶颈是业务来定义的。
    xsm1890
        6
    xsm1890  
       2020-09-29 17:12:44 +08:00
    如果索引数据五五开的情况下,平均行长度达到了 5000bit????一个数据页就 16kb,个人觉得很不合理啊
    opengps
        7
    opengps  
       2020-09-29 17:14:12 +08:00
    犯不着纠结这个,总量可控,读写结构合理,那么分不分表对于性能的影响可能真的很小,或者说实在想优化下,可以进行表分区(表分区的优势是对外表现仍然是单表结构)
    linxiaoziruo
        8
    linxiaoziruo  
    OP
       2020-09-29 17:17:36 +08:00
    @xsm1890 兄弟,1 亿数据是单表数据,1T 数据是整个库
    mightofcode
        9
    mightofcode  
       2020-09-29 17:34:53 +08:00
    这点数据分个毛
    cheng6563
        10
    cheng6563  
       2020-09-29 17:35:39 +08:00
    1 亿数据,没范围查询,不嫌插入慢就没啥必要分吧。
    th00000
        11
    th00000  
       2020-09-29 17:37:23 +08:00
    同意 5 楼 3 楼 看法
    分库分表是根据业务来的, 要知道业务的瓶颈在哪里, 然后才能决定怎么分
    然而你 1 亿 的表 不是你们业务的瓶颈你分他干啥
    cco
        12
    cco  
       2020-09-29 17:38:51 +08:00
    用到必须得分库了再去分,不要过度设计。
    zhihhh
        13
    zhihhh  
       2020-09-29 17:48:02 +08:00
    太小了的确不用分。
    sanggao
        14
    sanggao  
       2020-09-29 17:51:27 +08:00   2
    你这高度理解不了 dba 的决定
    snappyone
        15
    snappyone  
       2020-09-29 22:21:44 +08:00
    界限就是性能可能顶不住了就考虑拆分
    polyang
        16
    polyang  
       2020-09-30 11:15:55 +08:00
    同意 15 楼的观点,不是达到多少数量量就一定要分库分表,主要看性能,性能不行了,没办法从其他方面优化了,可以考虑分库分表
    wakzz
        17
    wakzz  
       2020-09-30 11:52:41 +08:00
    楼上正解,主要看业务场景。有的表仅仅是做存储几乎不读,简单搞个冷备份就行了。如果当前业务场景下性能没问题,就暂时没必要为了分库分表而分库分表,毕竟分库分表就意味着风险和代码重构。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     912 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 34ms UTC 20:05 PVG 04:05 LAX 13:05 JFK 16:05
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86