一个 idea: 用机器学习过滤掉你不想看的邮件 - V2EX
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
RangerWolf

一个 idea: 用机器学习过滤掉你不想看的邮件

  •  
  •   RangerWolf Nov 6, 2015 4722 views
    This topic created in 3855 days ago, the information mentioned may be changed or developed.
    现在大部分邮件提供商已经过滤掉一部分的广告邮件, 但是很多时候还是收到很多自己不会进去看的邮件~

    自己做了一些机器学习跟 NLP 的项目,感觉可以训练一些模型,根据用户历史看过( y=1 )跟没看过(y=0)的邮件作为训练集训练出一个模型,过滤掉一部分用户不会点击看的邮件~


    不知道这种功能有人会喜欢吗?
    19 replies    2015-11-07 19:11:13 +08:00
    9hills
        1
    9hills  
       Nov 6, 2015
    不看的邮件你收它干嘛。。
    zhangwei
        2
    zhangwei  
       Nov 6, 2015
    谷歌有个大概 400 人的团队在做这个事情。。。你一个人搞定了么 TAT
    RangerWolf
        3
    RangerWolf  
    OP
       Nov 6, 2015
    @zhangwei google 搞的是 for 全人类的,我做的只针对某个人 哈哈~
    主要是 google 要处理的东西很多, 这个东西调用一些开源类库的 api 就好了。 我已经站在巨人的肩上了
    RangerWolf
        4
    RangerWolf  
    OP
       Nov 6, 2015
    @9hills 反正我的网易邮箱各种推送消息啊~ 比如脸书也会跟我推送~
    yylzcom
        5
    yylzcom  
       Nov 6, 2015
    Google 应该已经实现了这样的功能,就是不知道效果是否符合楼主的预期
    因为在某邮件里看到“这封邮件在垃圾文件夹里因为你曾经放入垃圾文件夹里”/“这封邮件不在垃圾箱里因为你曾经阅读(打开?)类似的邮件”,用词肯定不准确,不是原话,但是大致如此哈。

    当时看到挺震惊的,国内的服务商连最基本的内容过滤都还做不好(光靠关键词进行内容过滤肯定做不好)。
    RangerWolf
        6
    RangerWolf  
    OP
       Nov 6, 2015
    @yylzcom 其实我虽然常用 gmail ,但是为了方便一直让网易代收进来的
    确实不知道 google 有这种功能~ 多谢!
    wissen
        7
    wissen  
       Nov 6, 2015
    就是和 Gmail 的 Important 标签差不多吧
    oott123
        8
    oott123  
       Nov 7, 2015 via Android
    _(:з」∠)_ 难道不是直接贝叶斯完事
    pupboss
        9
    pupboss  
       Nov 7, 2015
    阮一峰在 11 年就做完了,这算什么 idea
    chairuosen
        11
    chairuosen  
       Nov 7, 2015   1
    地球人会想 “万一过滤错了呢” ,所以每天还是要到垃圾箱翻一翻
    RangerWolf
        12
    RangerWolf  
    OP
       Nov 7, 2015
    @oott123 算是方法之一啊
    RangerWolf
        13
    RangerWolf  
    OP
       Nov 7, 2015
    @pupboss 自己的想法放出来就是怕这种自己孤陋寡闻再造轮子 多谢
    RangerWolf
        14
    RangerWolf  
    OP
       Nov 7, 2015
    @chairuosen 那 google 网易的邮件过滤 也有相同的问题啊
    haog
        15
    haog  
       Nov 7, 2015
    不看的退订或者过滤。这叫 human learning
    azuginnen
        16
    azuginnen  
       Nov 7, 2015 via Android   1
    pg02 年的贝爷撕
    zonghua
        17
    zonghua  
       Nov 7, 2015 via iPhone
    一点都不智能
    yiciyuansky
        18
    yiciyuansky  
       Nov 7, 2015
    这种算法只能过滤掉一部分订阅的邮件吧(就是有频率的那种),但是推送的广告才是大家真正不愿意看的邮件。。
    Changxu
        19
    Changxu  
       Nov 7, 2015
    感觉这个工作像在灌水(科研的角度),当然了一般也就广告不愿意看
    About     Help     Advertise     Blog     API     FAQ     Solana     3180 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 64ms UTC 13:39 PVG 21:39 LAX 06:39 JFK 09:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86