弄了一个公众号: 利用人工智能分析过滤电商评论 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
ZYJ
V2EX    分享创造

弄了一个公众号: 利用人工智能分析过滤电商评论

  •  1
     
  •   ZYJ 2018-05-02 04:41:12 +08:00 5536 次点击
    这是一个创建于 2750 天前的主题,其中的信息可能已经有所发展或是发生改变。

    大家好,我和几个小伙伴开发了一个基于人工智能,机器学习的工具, 名字叫"评论小助手", 尝试解决电商评论里存在的一些问题.

    先介绍一下我们主要想解决的问题:

    无论是卖家还是买家都觉得评论对于商品的销量起着很大的作用. 所以商家会积极鼓励买家对商品进行评论, 其中包含正当或者不正当的手段. 由此造成热销商品有着大量的评论,对于现潜在用户来讲,漂亮的评论数据看起来很美, 基本上都是极高甚至是 5 星的好评. 但是产品真如评论分数所表示的那么好么? 想通过看看评论来考查商品, 却苦于评论太多, 而且真假难辨, 看起来很费时间.

    我们认为用户真实的需求是需要一个工具来把评论中的 noise 去除掉, 当然假评论也属于 noise 评论.

    我们的方法:

    通过分析大量的用户评论, 我们发现虽然评论数量很多, 但对于用户有参考意义的并不是很多, 我们觉得可以通过机器学习的方式来过滤评论, 从而让用户可以更加容易的查看评论.

    目前我们会过滤以下评论:

    1. 评论不是针对商品的. 比如: 老板人很好, 快递不错等.
    2. 重现评论很高的评论. 类似的评论在不同的产品反复出现的. 我们认为这些评论对于购买参考意义不是很大.
    3. 疑似刷单的评论. 单从一个产品里可能无法看出来, 但我们考虑到刷单为了成本考虑, 会将类似的评论运用到其他产品. 所以将大量产品的评论放在一起通过大数据分析和机器学习来看的话, 可以发现一些规律.

    同时我们还会对一些评论增加权重, 比如虽然打的是 5 星好评, 其实看内容却发现用户想表达的意见是差评.

    根据我们的测试结果, 通过过滤后, 剩下的评论比例大约在 2-3%之间.

    工具使用方式:

    说了这么多, 怎么用这个工具呢? 我们目前通过微信服务号的方式来提供服务, 小伙伴们只要将要查看的产品链接通过服务号来发送给我们, 我们就会将分析结果以消息的方式回复给你.

    请注意: 由于现在还在刚起步阶段, 提供的服务比较有限.

    1. 现在我们只支持分析京东上的服饰类产品, 其他类别的支持还在进行中
    2. 由于分析产品涉及实时抓取评论, 所以会需要一些时间, 一般来说如果要查询的产品我们还没有分析过, 那么需要大约等待一分钟左右, 但你可以一次发送好几个需要分析的链接以缩减等待时间. 但如果要查询的产品我们已经分析过了, 那么恭喜你, 马上就能拿到结果:)

    大家可以通过扫描二维码或者在公众号中搜索"评论小助手"来使用这个工具. image

    下面简单介绍下具体使用步骤:

    • 从京东 APP 拷贝要检测的产品链接, 然后发送给我们的公众号.

    • 进入到我们的公众服务号, 在长按输入框, 粘贴刚刚复制的链接并点击发送

    • 我们分析完毕, 就会以消息的形式通知您

    • 点击消息查看详细结果,包括 AI 分析结果,过滤后的评论和被过滤的评论

    最后, 谢谢你有耐心看到这里, 如果你觉得有点, 欢迎试用. 当然更重要的, 如果你有什么意见, 欢迎留言.

    第 1 条附言    2018-05-17 15:31:14 +08:00

    大家好! 评论小助手有更新了! 非常感谢大家的各种建议和试用!

    1. 发布Chrome浏览器的插件了! 可以在PC上浏览器查看评论分析结果了. 具体安装和使用方式, 到 http://www.zyj.ai/help.html#chrome_install 查看. 各版本的下载链接可以到 http://www.zyj.ai 获取

    2. 放开支持京东上所有的产品了. 之前仅仅支持服饰类

    3. 服务号支持更多变种的京东链接, 比如 http://wqitem.jd.com/item/view?sku=19510871405&sOngli=1

    4. 其他一些小问题的修改

    请关注评论小助手服务号, 及时获取最新更新

    第 2 条附言    2018-06-05 11:34:08 +08:00

    浏览器插件增加对360的安全浏览器和极速浏览器的支持.

    浏览器插件可以同时添加多个产品一起分析, 节约等待时间. 经常使用的用户可以试试浏览器插件.

    两种安装方式

    1. 可以从我们的主页(http://www.zyj.ai) 上点击相应链接

    2. 直接到360扩展中心安装. 链接

    除了360浏览器外, 小助手还支持Chrome.

    浏览器插件使用帮助

    如果需要支持其他浏览器, 也请留言

    37 条回复    2018-06-05 11:34:50 +08:00
    chniccs
        1
    chniccs  
       2018-05-02 09:03:30 +08:00
    感觉是把差评都选出来了
    ZYJ
        2
    ZYJ  
    OP
       2018-05-02 09:16:07 +08:00
    也不是所有的差评, 但是差评的权重值会稍微高一点
    natforum
        3
    natforum  
       2018-05-02 10:39:31 +08:00
    专门看差评?
    olbb
        4
    olbb  
       2018-05-02 10:47:13 +08:00
    这样用起来太麻烦了 感觉做成 chrome 插件会好用很多
    ZYJ
        5
    ZYJ  
    OP
       2018-05-02 10:49:38 +08:00 via iPhone
    @natforum 不是的 都会看的 过滤后的评论里 有不少是好评里选出来的
    ZYJ
        6
    ZYJ  
    OP
       2018-05-02 10:51:00 +08:00 via iPhone
    @olbb chrome 插件 en 也在考虑中 主要是觉得大部分人都在手机上用 pc 用的人不多
    Shura
        7
    Shura  
       2018-05-02 12:16:49 +08:00
    @ZYJ 我还是喜欢在 PC 上进行购物,看评论、看图片、看参数、比价格都很方便。
    ZYJ
        8
    ZYJ  
    OP
       2018-05-02 12:28:18 +08:00
    @Shura @olbb 谢谢你们的意见. 看来 chrome 的插件势在必行
    awolfly9
        9
    awolfly9  
       2018-05-02 13:10:24 +08:00
    感觉和我之前撸的一个轮子很像。

    http://awolfly9.com/article/jd_comment_analysis
    awolfly9
        10
    awolfly9  
       2018-05-02 13:11:18 +08:00   1
    线上实时分析: http://awolfly9.com/jd/
    xgzxy
        11
    xgzxy  
       2018-05-02 13:15:08 +08:00
    这个到最后是不是也要走,淘宝推荐环节?开始招代理,做猫腻,变相售物
    ZYJ
        12
    ZYJ  
    OP
       2018-05-02 13:17:23 +08:00
    @awolfly9 你给的网页打不开, 不过看到你 github 上的项目了, 我们的理解是差不多的 //hand
    ZYJ
        13
    ZYJ  
    OP
       2018-05-02 13:19:51 +08:00
    @xgzxy 还没想这么远. 不过 我认为, 消费者是聪明的, 很容易看出来你是站在哪一面. 我觉得愚弄用户没什么好下场.
    mengdisheng
        14
    mengdisheng  
       2018-05-02 13:21:45 +08:00
    @awolfly9 擦 6666 啊 开源吗
    xgzxy
        15
    xgzxy  
       2018-05-02 13:24:02 +08:00
    @ZYJ 那你做这个,真的为了情怀,还是为了提高技术?
    awolfly9
        16
    awolfly9  
       2018-05-02 15:44:07 +08:00   1
    @mengdisheng 已经开源了,在我的 github 可以看到源码


    @ZYJ 可以打开的
    ZYJ
        17
    ZYJ  
    OP
       2018-05-02 16:28:00 +08:00 via iPhone
    @awolfly9 现在可以打开了 看了下 侧重点有点不一样。你的工具用了它评论及其附带的一些 metadata 来分析 数据 很不错的思路
    gamecreating
        18
    gamecreating  
       2018-05-02 18:32:59 +08:00
    主要看后续 AI 强不强大....
    find
        19
    find  
       2018-05-02 22:53:44 +08:00 via iPhone
    它属于监督 还是强化呢?你的训练数据哪里来的呢 ?
    WildCat
        20
    WildCat  
       2018-05-03 04:08:41 +08:00 via iPhone
    @awolfly9 老铁,你 GitHub 多少?
    ZYJ
        21
    ZYJ  
    OP
       2018-05-03 04:58:13 +08:00
    @xgzxy 和朋友聊天, 觉得这评论的确是个问题, 刚好又符合自己的兴趣, 就做个试试, 看看能不能做出一个对大家有用的工具来.
    ZYJ
        22
    ZYJ  
    OP
       2018-05-03 05:00:21 +08:00
    @gamecreating 没错, 很看好依赖 AI 技术来解决这些信息过载以及 fake 评论的问题. 现在的信息量实在太大, 又有过多的 noise, 单纯依赖人工去看, 实在没有效率.
    xgzxy
        23
    xgzxy  
       2018-05-03 05:33:14 +08:00
    @ZYJ 好早啊
    zddhub
        24
    zddhub  
       2018-05-03 07:13:28 +08:00 via iPhone
    箭头反了
    OscarUsingChen
        25
    OscarUsingChen  
       2018-05-03 07:59:24 +08:00
    让我想起了美国这边针对 amazon 假评论的 fakespot.com
    lixuedong
        26
    lixuedong  
       2018-05-03 08:27:11 +08:00
    @awolfly9 层主这个分析时间有些长啊
    awolfly9
        27
    awolfly9  
       2018-05-03 10:07:08 +08:00   2
    @WildCat github 同 id
    @lixuedong 你分析的那个商品,由于实时抓取,在抓取的时候会有点时间
    rootliang
        28
    rootliang  
       2018-05-03 23:20:19 +08:00 via iPhone
    @awolfly9 #27 层主这个是否提供有公开 api 供查询
    lixuedong
        29
    lixuedong  
       2018-05-04 08:51:59 +08:00
    @awolfly9 是关于网速还是电脑性能问题
    SuckCat
        30
    SuckCat  
       2018-05-04 10:21:39 +08:00
    和我们给海尔做的口碑系统差不多,想请教一下你筛选评论的规则就那 3 条吗?你把有用评论筛选出来是怎么处理?能否根据评论给出建议?
    awolfly9
        31
    awolfly9  
       2018-05-04 10:36:34 +08:00
    @rootliang 你需要什么 API 可以私聊,博客中有我微信

    @lixuedong 是我服务器性能问题
    ZYJ
        32
    ZYJ  
    OP
       2018-05-04 11:36:07 +08:00
    @zddhub 谢谢提醒. 可否告知是哪个箭头反了?
    ZYJ
        33
    ZYJ  
    OP
       2018-05-04 11:39:44 +08:00
    @SuckCat 不是的, 帖子里只是打个举几个常见的例子. 终极目标是让看评论变得简单一点, 尽可能多的把无关紧要的去除 /或者找出重要的评论. 现在版本还比较简单, 如果确实有人用. 像"根据评论给出建议"也是不错的, 尽量简化看评论需要的时间.
    ZYJ
        34
    ZYJ  
    OP
       2018-05-04 11:40:16 +08:00
    @find 目前还是比较简单的监督方式.
    ZYJ
        35
    ZYJ  
    OP
       2018-05-05 01:18:35 +08:00
    @OscarUsingChen en, 针对都是评论, 不过侧重点不一样. fakespot 主要针对和找出虚假评论. 国内情况更复杂一点, 不止虚假评论, 还有很多其他问题, 比如好评返现, 随意的评论, 这些都给看评论造成困扰. 我想更多的侧重找出有用的评论.
    ZYJ
        36
    ZYJ  
    OP
       2018-05-18 06:17:21 +08:00
    @olbb @Shura 做了个 Chrome 插件, 你们可以用用看.
    具体安装和使用方式, 到 http://www.zyj.ai/help.html#chrome_install 查看. 各版本的下载链接可以到 http://www.zyj.ai 获取
    ZYJ
        37
    ZYJ  
    OP
       2018-06-05 11:34:50 +08:00
    新增了对 360 安全浏览器和极速浏览器的支持, 具体看附言 2.
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1222 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 17:48 PVG 01:48 LAX 09:48 JFK 12:48
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86