微博情绪分析器及开发过程 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
greatdk
V2EX    分享创造

微博情绪分析器及开发过程

  •  
  •   greatdk 2015-03-06 17:53:52 +08:00 464 次点击
    这是一个创建于 3907 天前的主题,其中的信息可能已经有所发展或是发生改变。
    很早以前我就对诸如人工智能,语义分析,大数据处理等等东西很感兴趣,无奈高等数学渣的天怒人怨,基本算法也烂的人神共愤,所以一直只是做一些不那么底层的东西,虽然也可以有趣,但趣味总是不那么深入。最近在SAE后台看到了分词服务,于是想到能不能借助它做一个情绪分析的工具,经过一番摸索,终于做出了一个小工具,顺便把它延伸到了微博平台,最后实现的功能是,用户通过微博登录,然后程序抓取所有发过和转发的微博,并挨个分析其中关键信息的情绪度,再根据不同权重计算出最后的情绪度,也可以叫做幸福感,我把这个工具称作『微博幸福感分析器』,下面是我的开发过程:

    http://www.wdk.pw/909.html


    测试体验地址: http://www.coolirand.com/weibo/

    嗯,其实实现非常简单,也没有什么复杂的算法,大神们轻喷~
    20 条回复    2015-03-10 09:35:39 +08:00
    jubel
        1
    jubel  
       2015-03-06 18:16:22 +08:00   1
    sujin190
        2
    sujin190  
       2015-03-06 18:40:39 +08:00
    幸福度为0。。。。
    Twinkle
        3
    Twinkle  
       2015-03-06 18:48:37 +08:00
    分析19131条微博,xxx的幸福感分析结果为:1.81931464174

    看到分析的时候不停闪动着“卧槽”,醉了。。。
    typcn
        4
    typcn  
       2015-03-06 18:49:51 +08:00
    就是读取发过的微博,然后匹配正负面词进行加减分的分析?
    tyhunter
        5
    tyhunter  
       2015-03-06 19:25:30 +08:00
    分析2169条微博,XXXXX的幸福感分析结果为:2.67313915858
    est
        6
    est  
       2015-03-06 20:46:46 +08:00
    分析完成!

    分析7009条微博,幸福感分析结果为:0.454929577465
    (正数为正面,负数为负面,数值越大情绪越强烈)

    你有着模棱两可的幸福,呼吁大家来帮助这位忧伤的少年吧

    排名:1444 分享到微博
    love4taylor
        7
    love4taylor  
    PRO
       2015-03-06 20:54:02 +08:00
    经过分析,@Love4Taylor的幸福感分析结果为:0.818897637795 重新分析
    (正数为正面,负数为负面,数值越大情绪越强烈)

    Love4Taylor有着模棱两可的幸福,呼吁大家来帮助这位忧伤的少年吧

    排名:1386
    jucelin
        8
    jucelin  
       2015-03-06 21:31:24 +08:00
    分析242条微博,@jucelin的幸福感分析结果为:2.41304347826
    (正数为正面,负数为负面,数值越大情绪越强烈)

    jucelin的生活有着自己的小幸福,让大家来祝福jucelin的日子越来越幸福吧

    排名:620
    Comdex
        9
    Comdex  
       2015-03-06 22:12:02 +08:00
    能分享一下程序么及如何做么?最近要利用分词和大连理工情感词典做个实验工具
    greatdk
        10
    greatdk  
    OP
       2015-03-06 22:20:18 +08:00
    @Comdex 代码写的太烂了不好意思拿出来~开发过程博客已经写的比较清楚了啊
    greatdk
        11
    greatdk  
    OP
       2015-03-06 22:20:36 +08:00
    @typcn 嗯,差不多
    momo5269
        12
    momo5269  
       2015-03-06 22:31:14 +08:00
    1.4……路过前天做的
    dangge
        13
    dangge  
       2015-03-06 23:37:05 +08:00
    为何测试完我自动关注了楼主
    虽然不是什么大事,但是这种行为我很反感。
    greatdk
        14
    greatdk  
    OP
       2015-03-06 23:41:47 +08:00
    @dangge 我擦,刚开始的测试了几个接口,这个忘去掉了,我还奇怪怎么涨粉丝那么多,是不是大家都觉得这个东西很厉害,非常抱歉,已经去了
    Fly1993
        15
    Fly1993  
       2015-03-07 10:31:31 +08:00
    分析5817条微博,@WenryXu的幸福感分析结果为:1.76655052265
    (正数为正面,负数为负面,数值越大情绪越强烈)

    WenryXu有着基本的幸福,但是似乎也有不少烦恼。呼吁大家来帮助这位忧伤的少年吧

    排名:1116 分享到微博
    unwarsky
        16
    unwarsky  
       2015-03-07 11:53:54 +08:00
    分析659条微博,幸福感分析结果为:0.753968253968 _(:з」∠)_
    Comdex
        17
    Comdex  
       2015-03-07 13:39:55 +08:00
    有标准的幸福度么
    iugo
        18
    iugo  
       2015-03-09 10:55:40 +08:00
    很喜欢这种广告的方式. 在最后宣布结果时, 语言多样性上可以提升一下.
    hinate
        19
    hinate  
       2015-03-09 13:32:15 +08:00 via iPhone
    经过分析,@Hinate丶的幸福感分析结果为:2.11363636364 重新分析
    (正数为正面,负数为负面,数值越大情绪越强烈)

    Hinate丶的生活有着自己的小幸福,让大家来祝福Hinate丶的日子越来越幸福吧

    排名:911
    evillions
        20
    evillions  
       2015-03-10 09:35:39 +08:00
    分析完成!

    分析6871条微博,@evillions的幸福感分析结果为:2.12562313061
    (正数为正面,负数为负面,数值越大情绪越强烈)

    evillions的生活有着自己的小幸福,让大家来祝福evillions的日子越来越幸福吧

    排名:915
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2615 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 07:50 PVG 15:50 LAX 23:50 JFK 02:50
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86