
主要是从文本中提取信息,转换加工。。数据量挺大的,希望速度快,还要容错性高.
1 vulgur 2015-01-27 10:26:14 +08:00 人生苦短,我用Python |
2 lululau 2015-01-27 10:27:15 +08:00 最好的文本处理工具是 Perl,没有之一 |
3 roricon 2015-01-27 10:32:29 +08:00 据说是Perl |
4 lingo233 2015-01-27 10:33:12 +08:00 awk? |
5 acgeo 2015-01-27 10:38:47 +08:00 C++搞定一切! C++吸星大法好!! C++能创造其他语言!! 哈哈哈 |
6 princelai 2015-01-27 10:39:32 +08:00 perl,sed&awk不是专门干这个的嘛 |
7 sleeperqp 2015-01-27 10:41:30 +08:00 sed或者awk把 python也可以~~ |
8 em70 2015-01-27 10:41:37 +08:00 via Android awk效率惊人,可以用来提取,给其他语言进行二次分析 |
9 loveuqian 2015-01-27 11:15:44 +08:00 PHP大军还有30秒到达战场???? |
10 lxrmido 2015-01-27 11:19:57 +08:00 PHP是最好的语言 |
11 tini9 2015-01-27 11:20:33 +08:00 ruby就挺好 |
12 czheo 2015-01-27 12:04:34 +08:00 感觉乱不是语言的问题 |
13 lu18887 2015-01-27 12:12:19 +08:00 楼上的不要把这帖子变成月经贴好么! |
14 tabris17 2015-01-27 12:12:34 +08:00 大多数支持正则的脚本都没问题,看你熟悉哪个了 资格老点的就是perl了,但是python\ruby\php都没问题 |
15 garfeildma 2015-01-27 12:14:05 +08:00 xml解析可以scala啊,内建xml支持 对ms不反感的话C#也挺好 |
16 NeoAtlantis 2015-01-27 12:17:27 +08:00 xml解析,如果单个文件不算太大的话试试python的beautifulsoup。 |
17 Dongdong36 2015-01-27 12:47:58 +08:00 1L +1 |
18 zythum 2015-01-27 12:49:34 +08:00 字符串处理效率高。无疑awk |
19 aa88kk 2015-01-27 12:52:48 +08:00 数据量大,xml就别解析了, 太慢。直接正则提取。 |
20 invite 2015-01-27 12:53:45 +08:00 很明显,应该用C。 |
21 xdeng 2015-01-27 13:01:22 +08:00 via iPhone c 谁用谁知道 |
22 whoops 2015-01-27 13:05:06 +08:00 sed or awk,海量数据处理时,比起perl来,速度快的不是一个数量级 |
23 Her0 2015-01-27 13:05:54 +08:00 Python, awk,sed |
24 yakczh 2015-01-27 13:13:21 +08:00 你提供个样本,需求结果的数据, 然后贴一下各种语言的代码,根据运行时间和代码长短,就知道哪种语言适合 |
25 itfanr 2015-01-27 13:25:30 +08:00 python 没有之一 |
26 Comdex 2015-01-27 13:39:38 +08:00 golang吧,运行效率可能比脚本语言好,但又容易入门 |
27 proudzhu 2015-01-27 13:47:21 +08:00 via Android perl + 1 |
28 ray1919 2015-01-27 14:15:16 +08:00 Perl为字符串而生,xml有现成包 |