做了一个自动总结股票评论的网站,可以快速了解一只股票的态势 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
zmt2023
V2EX    分享创造

做了一个自动总结股票评论的网站,可以快速了解一只股票的态势

  •  
  •   zmt2023
    PRO
    2024-01-03 23:35:33 +08:00 2841 次点击
    这是一个创建于 675 天前的主题,其中的信息可能已经有所发展或是发生改变。

    引子

    作为一根佛系的大 A 韭菜,我买了四五只股票,但平时 996 没空关心股票的动向,只有到了周末会打开雪球翻一翻。一只比较热门的股票在雪球上每周能积攒七八百条讨论贴,而且里面很大部分是些莫名其妙的吹牛和情绪宣泄,真正有参考价值的帖子大概就占十分之一。我看一条帖子至少要 5 秒,如果要把帖子都翻完,每只股票要翻一个小时,对于我宝贵的周末时间来说这个成本是不可接受的,所以我经常是草草翻一遍了事,很难抓到一些有效信息。

    某天股票突然涨了几个点,我考虑要不要套现离场,这种重大决策值得我去好好翻一遍近段时间的帖子,看看其他人都在说什么,于是我花一两小时翻完了这支股票和关联股票的帖子,有价值的帖子或许有一两百条,但里面看多和看空的都有,双方对比不算悬殊,大概是 4:6 ,也可能是 6:4 ?我也没仔细点过,而且两边听起来都有点道理。结果我这一两个小时基本是白花了。

    正文

    上面写的就是我这个网站的 user story,也是我个人的亲身经历,为了解决这个需求,我开发了后湖这个网站。

    后湖 https://www.houhu.info

    总的来说,后湖会在各类财经平台上抓取评论贴,然后使用大模型对帖子进行分类过滤。首先会过滤掉没营养的帖子,然后对言之有物的帖子进行看多/看空的情绪判断,最后会归纳这些帖子的观点依据,比如是因为财务的原因还是产品的原因。这样用户能快速感知到这只股票近期的态势,是看涨的人多还是看空的人多,看涨里面又是因为什么原因看涨,不会再出现 user story 里狂翻两个小时什么结论也得不出的情况。

    现在主要的功能有三块:

    雷达图

    把帖子观点按照利好利空以及话题种类做了分类,这样能直观体现市场关注点。统计结果(不同话题下观点的数量)用雷达图做可视化对比,以这张图为例,可以看出普遍认为该公司的产品有优势,而利润营收(财务状况)不容乐观。

    radar_plot

    观点一览

    如果想看具体的观点,这里会提供每个观点的摘要( AI 生成)和原文链接,同时提供了发布时间与各种话题的分类筛选。 post_plot

    情绪走势

    最后是近段时间的情绪指数统计,同时在最下方提供了股价走势 K 线的对比,中间一排是计算情绪指数用到的样本量,样本量越高指数越可信,如果样本量不足 10 条,则当天的情绪指数可能参考价值不大。 sentiment_plot

    尾声

    后湖是个业余项目,现在还有许多的待优化点,欢迎大家吐槽批评,如果对网站的更多细节感兴趣,可以去网站https://www.houhu.info首页添加公众号,里面有比较详细的功能更新日志和说明。

    大概一个多月前,我在即刻上小小的宣传了一下网站,也收到了不少点赞转发,但到今天为止,依然没有多少留存的用户。我思考了一下,可能的原因有下面几点,不知道各位试用过程中有没有遇到:

    1. 没有覆盖到用户感兴趣的股票(当前因为成本原因只覆盖了热门的 50 多支,有需求可以留言)
    2. 觉得 AI 的总结和分类不靠谱
    3. 访问不方便(手机版页面适配不佳,网页打开速度太慢等)
    4. 平时不看社交平台的股票评论,不够可靠

    如果有,请留言告诉我,对我下一步的优化非常重要,万分感谢!

    11 条回复    2024-01-08 15:34:55 +08:00
    GUSNYpU376k4Sx2V
        1
    GUSNYpU376k4Sx2V  
       2024-01-03 23:40:33 +08:00
    楼主我有个需求如下,你看看能做吗?合适的话留言我把联系方式给你,我们更深入的沟通下?

    朋友想专业进入币圈薅毛行业.

    基于总所周知的原因的,很多项目在早期阶段是隐私状态,但是进入到上 shi 或者交互阶段一般就会开始半公开或者小范围开放, 这个时候互联网上就会有蛛丝马迹出现,打算要做的 爬虫就是基于这个需求而提出的:

    从 x 或者币圈相关媒体中找到公开或半公开的项目
    从公众 hao/Tg/D 群组中找到相关公开或半公开项目

    根据关键词热度进行画图,参考 dapanyuntu,com 鼠标移动点击即进入到该项目详情页.
    后台(如果需要)有简单图形配置界面,方便管理。
    flmn
        2
    flmn  
       2024-01-04 10:42:59 +08:00   1
    大概看了下,你爬的是雪球评论,只从文字分析,但是你不知道说这话的人水平如何,有没有私心,或者纯粹是水军。这样的话,得出的结论也是不太可靠的。
    zmt2023
        3
    zmt2023  
    OP
    PRO
       2024-01-04 22:21:27 +08:00
    @Beeium 这个想法挺有意思的,但我还有全职工作,时间排不过来,不好意思~
    zmt2023
        4
    zmt2023  
    OP
    PRO
       2024-01-04 22:41:33 +08:00
    @flmn 感谢指点,确实这些评论的可信度是个问题,后面我会考虑给帖子添加一些权重,比如点赞评论数,甚至去自动搜索涉及的消息来源。不过当前来说,我希望先把后湖搞成一个能快速获取全局视野和灵感的地方,这也是那些专业软件缺失的功能,严肃的交易决策做出还是需要在专业软件上做验证。
    xinyana
        5
    xinyana  
       2024-01-05 02:54:19 +08:00 via Android
    股市?你跟她讲技术技术,他跟你讲套路,劝君远离
    taofoo
        6
    taofoo  
       2024-01-06 15:50:01 +08:00
    请教一下,这个 ai 是自己训练出来的么?有啥框架或者文章参考一下不
    zmt2023
        7
    zmt2023  
    OP
    PRO
       2024-01-07 00:15:39 +08:00
    @taofoo 现在是调的 ChatGPT 的 API ,不过之前试过开源的 ChatGLM2 ,效果也不会差太多
    zagfai
        8
    zagfai  
       2024-01-07 00:54:05 +08:00
    功能单一 没啥用途,我感觉就是,这些评论的情绪完全没有意义,你做过统计的话,有没有相关性,能统计出来的,有效果的话你应该已经赚第一波钱了
    qm
        9
    qm  
       2024-01-07 12:51:44 +08:00
    @Beeium 留个联系方式,我们聊聊看?
    zmt2023
        10
    zmt2023  
    OP
    PRO
       2024-01-07 20:25:16 +08:00
    @zagfai 其实大部分时候网上的情绪指数是跟着股价走的,所以直接靠情绪指数交易不太可行。不过有一些异常情况,比如股价和情绪指数几天内明显背离,值得注意并且人为深入分析下。后面会考虑把这种异常标识出来。
    husinhu
        11
    husinhu  
       2024-01-08 15:34:55 +08:00
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2588 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 07:36 PVG 15:36 LAX 23:36 JFK 02:36
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86