![]() | 1 ChangQin 2018-06-20 08:57:10 +08:00 有,go 程序设计语言前几节就有这个 demo |
![]() | 2 jiezhi 2018-06-20 09:01:02 +08:00 python 入门里也有这个 demo 吧 |
3 xy2401 2018-06-20 09:01:56 +08:00 mark。我之前想统计 比如 spring 文档里面 的高频词汇,感觉需求类似 |
![]() | 4 yuanfnadi 2018-06-20 09:02:11 +08:00 via iPhone Java 入门时候写过类似 demo |
![]() | 5 lhx2008 2018-06-20 09:03:36 +08:00 via Android 读进来切一下,python 可以用 counter,java 可以用 stream |
![]() | 6 NaVient 2018-06-20 09:03:40 +08:00 python --> from collections import Counter |
![]() | 7 qilishasha 2018-06-20 09:09:43 +08:00 数组长度数组长度 |
8 kingname 2018-06-20 10:18:18 +08:00 |
![]() | 9 laoyuan 2018-06-20 10:26:14 +08:00 手写原生 |
10 simapple 2018-06-20 10:31:28 +08:00 nltk |
11 soho176 2018-06-20 10:45:39 +08:00 是准备统计最近十年高考英语卷,出现频率高的单词吗? |
![]() | 12 fengche361 2018-06-20 10:59:52 +08:00 爬取+分词+wordcount ? |
13 yuriko 2018-06-20 11:04:34 +08:00 第一反应是 MapReduce 的范例…… |
14 hyi 2018-06-20 11:19:29 +08:00 学 python 时写过一个统计英文 txt 单词词频的 python 小脚本,用的是 nltk 库,你可以参考下思路,https://github.com/Hangyi/parse_words_frequency |
15 jyf 2018-06-20 11:32:09 +08:00 主流的爬虫一般都会统计词频 因为有个流行的算法 TF-IDF 就是拿词频作为计算基础的 |
![]() | 16 woscaizi 2018-06-20 11:46:23 +08:00 写过一个类似的东西,是统计小说中 2 到 5 字的词语出现的次数,没有考虑是否是有意义的词的情况 https://github.com/pandaTED/zhihuSpider/blob/master/src/main/java/cn/panda/hello/Hello.java |
![]() | 17 Tink PRO 这点功能不如手写 |