有没有做过 Hadoop/MapReduce 实际应用的 v 友呢?跪求小伙伴传授入门经验。我是做体感人机交互、虚拟现实的,如果你也对此感兴趣,那就更好不过了。
![]() | 1 Geoion 2015-09-11 14:05:35 +08:00 先 mark |
2 xsjguagua 2015-09-11 17:30:41 +08:00 天天撸这个。。但很好奇,这 hadoop 和 lz 的虚拟现实方式有什么交集呢? |
![]() | 3 xunyu 2015-09-11 17:34:51 +08:00 via Android mark, 楼主瓶颈在哪里 |
![]() | 4 loryyang 2015-09-11 17:55:57 +08:00 hadoop 这种成熟的技术,自学就行了,多看看书,有时间的话看看源码,写几个 MR 。 说实话,实际场景遇到的问题,大部分自己是没法遇到的,因为你根本搭不起那么大的集群,这种经验只能去看别人写的文章或者去公司里面工作才能遇到 |
![]() | 5 defunct9 2015-09-11 18:48:28 +08:00 via Android 管理过 600 节点(实体机)的 hadoop 集群,貌似开发人员用的多数是 hive 和 r |
![]() | 8 vietor 2015-09-11 20:42:14 +08:00 via Android spark 呀 |
![]() | 9 defunct9 2015-09-11 20:58:56 +08:00 via iPad @nower 我是运维.负责搭环境.貌似各种奇怪的玩意都装, storm , spark , facebook 的。但他门用的最多是 hive 。跑定时任务,好像是出数 |
10 xsjguagua 2015-09-11 21:20:47 +08:00 @nower 你是想搞分布式的图像识别模型训练么,这技术本身难度就不小。但即使不谈技术,你想快速的出模型,进行使用的话,集群资源也是问题啊 |
12 laozhao0 2015-09-11 21:36:15 +08:00 我是搞 hadoop 的,也是在数百台的集群上跑,好像每台机器内存 64G ,每天有数十 TB 的数据产生。 实际中如 @defunct9 所说,大多数时候用 hive , hadoop MR 一般写好一次就不管了,最多换一下配置文件。 MR 输出的文件 location 到 hive 表目录下,使用 hive 进行统计查询。 hive 的话,只要会写 SQL 语句,就没有入门的门槛。 所以,其实作为一般分析人员,没什么难度的,最多用 java 写一个 UDF ,或者用 python 写一个 streaming 。 更深的,我也不太懂。 现在可以学 spark 啊,简单又方便。 |
13 xsjguagua 2015-09-11 22:02:48 +08:00 @nower 如果图像简单的话,那单机训练出模型就可以了啊,使用的时候过模型的速度是很快的,即使要 online learning 的速度也是可以的。 mr 那套是离线处理,速度不够的 |
14 1000copy 2015-09-11 23:25:26 +08:00 互换技术,多新颖的想法。 |
![]() | 15 xunyu 2015-09-11 23:30:42 +08:00 via Android 用 mesos spark 可能更符合你的需要, hadoop 落盘计算效率堪忧 |
16 AgentK 2015-09-12 05:34:05 +08:00 怎么换? 像武侠片一样把功力传给我吗? |