[2021] 大家用什么大数据技术栈? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答术问题时复制粘贴 AI 生成的内容
zealinux
V2EX    程序员

[2021] 大家用什么大数据技术栈?

  •  
  •   zealinux 2021-09-28 09:58:24 +08:00 4197 次点击
    这是一个创建于 1527 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司这方面一片空白,我也从没搞过。 但公司要准备这方面的预研。

    是拿来用,而不是搞二次开发。 最好是直接拿开源的组装就行。

    大家怎么选型,有什么推荐的?


    现在只听说了 Hue,Hive,正在学习。 (之前只是用 Python Pandas 等数据分析)

    10 条回复    2021-09-29 17:09:41 +08:00
    zhengsidao
        1
    zhengsidao  
       2021-09-28 10:13:24 +08:00
    有自己的集群么,还是用的云服务?
    数据量是多大的呢,做大数据的场景是什么,是需求推动还是纯粹公司想做,达成什么方向 or 目的?
    大数据这一块的内容太多了,抛开业务场景去谈实践基本上扯淡。相关的组件学习、运维和使用成本都很高,如果没有经验也没有数据场景需求推动基本上干不了啥。
    推荐一下阿里巴巴大数据的书籍,<大数据之路> 看完心里有个大概,再根据场景选型对应的组件来调研。

    另外盲猜你的公司很小...
    xujia1998
        2
    xujia1998  
       2021-09-28 11:34:27 +08:00
    Flink ClickHouse
    libook
        3
    libook  
       2021-09-28 12:26:21 +08:00
    招个大数据架构师来搞,都是组合各种开源组件,但跟业务相关的东西还是得自己写的。
    dayeye2006199
        4
    dayeye2006199  
       2021-09-28 15:12:46 +08:00
    我默认楼主需要的是类似数据仓库之流的东西,这方面运维成本很高,小公司自己做没经验的话会很痛苦。建议直接买云厂商的解决方案。例如阿里云的 maxcompute 。比较现代的解决方案一般是存算分离,存储一般用普通的 oss 。

    在这个基本的仓库服务上,建议再酌情选择 数据治理,数据管道等组件。这方面可以开源和购买相结合。
    presto
        5
    presto  
       2021-09-28 15:17:04 +08:00
    Flink 、Presto Kudu
    yingsunwl
        6
    yingsunwl  
       2021-09-28 17:19:29 +08:00
    HDFS 、Hive 、Spark 、Flink 、Presto 、Kafka 、ClickHouse 、Doris 、Kylin
    zengqz
        7
    zengqz  
       2021-09-28 18:35:13 +08:00
    pulsar,很值得使用
    levelworm
        8
    levelworm  
       2021-09-29 08:04:30 +08:00 via Android
    Kafka 数据流经过 Spark 计算进 Vertica, 然后 Airflow 定时做 Transform 进数仓。
    zhygkx
        9
    zhygkx  
       2021-09-29 09:41:32 +08:00
    大公司基本不用 Hive 了,Hive Metastore 组件还在用。
    离线计算:Spark
    实时计算:Flink
    即席查询:Presto/Trino
    存储:HDFS/OSS
    michaelzhangcn
        10
    michaelzhangcn  
       2021-09-29 17:09:41 +08:00
    你要公司想要解什
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3183 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 11:25 PVG 19:25 LAX 03:25 JFK 06:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86