做了的事情:
- 每天不停的抓某论坛上面股市相关的人的发言
- 人工标注了接近 3W 条数据 自身需要, 不是讨论大盘的都被认定成股市无关
- 训练了一个分类模型, 判断这一条语句的结果:
- 无关或无用
- 看涨
- 看跌
目前自己用的感觉:
- 不能直接预测股市涨跌(废话,也不是目标)
- 看涨看跌感觉还是比较准的, 只不过对那种转折语句判断确实容易出问题
- 蛮多实际上有用的
一个简陋的 demo
http://stock.flyml.net/
在最底下有测试窗口
PS:目前还是很容易挂的, 不要黑我。。。

http://stock.flyml.net/
在最底下有测试窗口
PS:目前还是很容易挂的, 不要黑我。。。
1 ljsh0102 Jan 8, 2018 全是看平或无用 |
2 chinajik Jan 8, 2018 有兴趣,觉得不错 |
nbsp; 3 tmkook PRO 就这量涨不起来!明天还得跌回去 这句话都说看平或无用,是不是训练量不够? |
4 takato Jan 8, 2018 via iPhone 这东西放在五六年前其实效果非常好。 |
5 qdwang Jan 8, 2018 via iPhone 时间长了你会发现舆情和行情没有相关性 |
6 quickma Jan 8, 2018 这个没法对操作进行指导呀,只能当成分析大众的工具。 |
7 RangerWolf OP @takato 能说一下现在不好的原因吗? |
8 RangerWolf OP @tmkook 现在最大的问题就是 很多确实是有用的, 被判定成无用了。 我单独把你这句话“现在最大的问题就是 很多确实是有用的, 被判定成无用了。” 喂给了判定涨跌的模型, 结果是看跌, 概率 0.91 |
9 RangerWolf OP @x7395759 是的~ 我也没指望能通过 AI 把股市变成我的提款机 |
10 RangerWolf OP |
11 fe619742721 Jan 8, 2018 跌是不可能跌的, 这句话被判定成 跌 ,概率 0.97 。。。哈哈 好好玩 |
12 RangerWolf OP |
13 takato Jan 8, 2018 via iPhone @RangerWolf 大家都开始使用的时候,信号会减弱,最后会淹没在噪声之中。 |
14 code4life Jan 8, 2018 看起来不错,楼主继续加油 |
15 takato Jan 8, 2018 via iPhone @RangerWolf 另外当开始使用这套系统的时候,自身就会成为一个市场信号,这个信号同样会被其他系统捕捉,最后会变成“谁掉头更快”、“谁对信号更敏感”就能吃掉别人的斗争。 |
17 AlwaysBee Jan 8, 2018 有一个叫 查舆情 的网站,很强大,识这个网站的创始人 |
18 qdwang Jan 8, 2018 |
19 RangerWolf OP @code4life 感谢 哈哈 |
20 RangerWolf OP @hqtc 能稍微详细说说? 不是很懂 |
21 chinvo Jan 8, 2018 你的微博接口貌似挂了 |
22 guanaco Jan 8, 2018 via iPhone 这个内用,大多数人是不赚钱的,也就是说大多数舆情是错的 |
23 guanaco Jan 8, 2018 via iPhone 没用,手滑出的错字 |
24 guanaco Jan 8, 2018 via iPhone 还不如写个爬研究员的微信公众号有用,这个楼主能做一个? |
25 hqtc Jan 8, 2018 @RangerWolf “另外当开始使用这套系统的时候,自身就会成为一个市场信号”。这句话不是很难理解吧。就是你这个系统预测出的结果,将会对市场产生影响。当然前提是有一定的关注量,就像雪球上的很多大 V 组合一样,他买的票为什么涨,因为大家看到他买了纷纷跟进。。 我 15 年被收割一波之后 9 月开始抓个股数据,抓了一年的,现在废弃了 t/276786 |
26 RangerWolf OP @chinvo 亲,你说的微博接口是什么? 我没看懂你的意思 |
27 RangerWolf OP @guanaco 爬公众号的代码应该也不少了吧? 可能还没完全看懂你的意思 |
28 RangerWolf OP |
29 guests Jan 8, 2018 挺有意思的项目。 明天大盘多半凶多吉少预测结果:跌, 概率 0.702844 明天大盘晴转阴预测结果:涨, 概率 0.658135 X 大盘涨跌都很正常,平常心看待预测结果:看平或无用, 概率 0.583144 大盘明天是割肉行情预测结果:涨, 概率 0.566443 X |
30 hlwjia PRO 搭车问:谁有股票市场的数据实时接口的吗? |
33 chinvo Jan 8, 2018 @RangerWolf #26 大概是我理解错了,以为你这个会有连续数据,15 分钟和 1 小时数据都是 N/A。仔细想想其实这个“大 V ”和“消息”是不连续的,没人发帖就不会有数据。 |
34 RangerWolf OP @chinvo 是的~ 抓的数据本身就是不连续的 |
35 RangerWolf OP |
36 guanaco Jan 8, 2018 via iPhone @RangerWolf 得到研究员发布的最新研报是有作用的,舆情跟踪各大股票论坛,每只个股加入自选股的数量变化是最有效的 |
37 huijian222 Jan 8, 2018 人工标注 3W 条。。。楼主也是牛逼。。。 |
38 RangerWolf OP @huijian222 数据为王 没有数据没办法 其实还是花了不少钱请人一起标注的 |
39 RangerWolf OP @guanaco 不知道方便分享一下完整的研报? |
40 guanaco Jan 8, 2018 via iPhone @RangerWolf 我也在找这个 |
42 nasmatic Jan 9, 2018 git 上有个项目通过 google NLP api 分析 Trump 的 twitter 的情绪来对接交易的,LZ 可以参考下。名字好像叫 trump2cash |
43 admirez Jan 9, 2018 via iPhone 真的还不如好好研究买点好股票放着,或者资金大一点抢东方红 |
44 yougezai Jan 9, 2018 方向没毛病啊,能不能增加板块,关键字 这类的 |
45 ming7435 Jan 9, 2018 沪指 10000 点居然是看平或无用 |
46 RangerWolf OP @yougezai 感谢, 下一步就是逐步的细化 |
47 Felldeadbird Jan 9, 2018 如果可以针对指定板块就更加美滋滋了。 |
48 tmkook PRO http://ai.baidu.com/tech/nlp/sentiment_classify 还不如用百度的,我觉得分析的比你准确多了 |
49 Clarencep Jan 9, 2018 这个 AI 简直是 zz... |
50 RangerWolf OP @Clarencep 很尴尬~ 继续加油了 |
51 radiolover Jan 9, 2018 在中国,金融大数据舆情分析行业的水很深,假观点其实比真观点要多 |
52 Jackliu Jan 9, 2018 |
54 takato Jan 9, 2018 via iPhone @radiolover 把信号稀释到 random 水平就可以了。 |
55 Artists Jan 9, 2018 股票这玩意儿是人多说了算吗? |
56 BlueFly Jan 9, 2018 「一盈二平七亏」的零和游戏的股票市场 你跟我说随大流? |
59 yun PRO 谢楼主分享,看了楼主网站,你的这个股市分析是用 Zepplin + Cassandra 做出来的吗? |
60 RangerWolf OP @yun 不是啊~ flask + echarts |
61 liujm Jan 9, 2018 @RangerWolf 请问你的舆情分析算法实现用什么来做的? jieba + tf-idf 分类算法? |
62 RangerWolf OP @liujm 只能说是基于开源类库 加了一些自己的脑洞~ |
63 kingda Jan 9, 2018 mark 下 |
64 liujm Jan 9, 2018 @RangerWolf 主要是我有时候也会做类似的文本分类,感觉否定+情感词开源类库不太准确 |
65 RangerWolf OP |
66 enzohobmg Jan 9, 2018 有想法总是好的 |
67 tttty Jan 10, 2018 @RangerWolf 情感分析的接口用的哪里的? |
68 RangerWolf OP @tttty 股市的是自研的 |
69 oneFan Jan 10, 2018 撸主这个想法也可以用在其他领域 比如足球彩票? |
70 RangerWolf OP @oneFan 理论上是吧~ 不过没有玩过足彩 也没有相关数据 |
71 wizardforcel Jan 12, 2018 via Android 大多数人都在瞎 jb 预测。整合的时候最好设定个阈值,然后按照论坛声望加权。 |
72 RangerWolf OP |
73 BeForever Jan 15, 2018 您链接挂啦。。挂啦。。。啦、、、 |
74 RangerWolf OP @BeForever 今天早上就发现了 一直没得空处理 哎 多谢提醒 |
75 BeForever Jan 16, 2018 @RangerWolf 不客气~坐等您处理好了去学习哈哈哈 |