[原创] 女儿的学校照片 + 吐槽收费的要价 + 人工智能的解决方法 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
coolwulf
V2EX    问与答

[原创] 女儿的学校照片 + 吐槽收费的要价 + 人工智能的解决方法

  •  
  •   coolwulf 2018-10-24 05:07:18 +08:00 5638 次点击
    这是一个创建于 2552 天前的主题,其中的信息可能已经有所发展或是发生改变。

    又到了一年一度的学校 school picture 时节, 在北美这里有孩子的朋友可能知道, 一般这个时间就是家长得出(tu)钱(xie)的时候了。一般的 school picture 的要价是这样的:

    http://thyrsi.com/t6/394/1540328645x-1566684341.jpg

    这往往是便宜的,而且一般你家孩子不会只照一张俩张,有时候还会有和其他同学的合照和班级集体照。

    随口问了孩子妈,“我们今年买几张”。“全要吧”, 孩子妈头也不回的说。

    我简单一算,哎呀妈呀,这还不得好几大百 $ 下去了...

    有没有更好的解决方法?然后我想到了 AI, 想到了我那一堆躺在地下室吃灰的显卡 ... (前情提要请看我前面的帖子)

    首先我研究了一下 School Picture 提供网站上面提供的学生样品图片。这些样品图片一般是低解析度 (Low Resolution) 和加上了水印 (Watermark) 的给用户提供一个购买之前照片印象的图片。

    看了看这些图片,让我想到了使用 SRGANs 和其他的 In Painting Network 来解决这个问题的可能。好吧说干就干吧

    首先是原图: http://thyrsi.com/t6/394/1540328673x-1404814676.jpg

    使用 ImageNet 的数据,通过 SRGANs 来训练一个 AI 来提升图片的 resolution, 网络结构:

    这个网络大概训练了三天多,我看结果似乎还不错,够用了

    提升后的图片解析度达到了打印成 8 x 10 或者更大片副的要求,这里是 100% 的 before / after 比较: http://thyrsi.com/t6/394/1540328695x-1404814676.jpg

    接下来的问题是水印,我采用了 Nvidia 团队支持不同大小,形状的 Partial Convolution 的解决方法, 论文: http://thyrsi.com/t6/394/1540328723x1822611687.jpg

    训练的数据主要是 ImageNet 中的人物数据集,然后我又加上了 CelebA 这个专门的名人头像数据集来作训练

    总过花了快俩周的时间才 train 完 (汗,太慢了)。这个 AI 的结果还凑合,暂时可以用了,放一下结果图:

    http://thyrsi.com/t6/394/1540328739x1822611687.jpg

    当然结果还不够好,可能还需要手工做些 touchup. 不过我打算在继续强化一下这个网络,看看能否提高效果。

    然后准备写个简单的网站,这样方便远程使用,年底再去坐 Cruise 的时候看来是不需要再花大价钱买照片了...

    哈哈哈...

    当我正准备狂笑三声的时候,孩子妈劈头盖脸的问我 "孩子照片你不是说上周就挂家墙上的嘛?“, 我:"..."

    25 条回复    2018-10-24 20:56:25 +08:00
    klaksvik
        1
    klaksvik  
       2018-10-24 06:21:33 +08:00 via Android
    哈哈,楼主这个太赞了。
    green15
        2
    green15  
       2018-10-24 07:09:19 +08:00 via iPhone
    楼主的思路奇特,技术含量高……收徒弟吗? 23333
    xenme
        3
    xenme  
       2018-10-24 07:10:56 +08:00 via iPhone
    这结尾,
    DevRoss
        4
    DevRoss  
       2018-10-24 07:28:27 +08:00 via Android
    哈哈哈
    bearqq
        5
    bearqq  
       2018-10-24 07:29:40 +08:00 via Android
    拿女儿照片来骗点击量也是蛮拼的
    (滑稽
    OscarUsingChen
        6
    OscarUsingChen  
       2018-10-24 07:56:53 +08:00
    leoojiang
        7
    leoojiang  
       2018-10-24 08:04:44 +08:00 via iPhone
    考虑到一个问题:涉不涉及版权……
    coolwulf
        8
    coolwulf  
    OP
       2018-10-24 08:41:38 +08:00
    @OscarUsingChen 或许是的,不过我之所以训练这个网络不仅仅是为了去除 watermark, 还可以针对 loss information 的图片来做修复,对于有损伤的老照片之类的也可以使用。
    coolwulf
        9
    coolwulf  
    OP
       2018-10-24 08:48:46 +08:00
    确实,这个模型可以有其他的应用。
    Bryan0Z
        10
    Bryan0Z  
       2018-10-24 08:50:04 +08:00 via Android
    你这个好便宜,我们拍的毕业照,一张要 90 刀,最后听说是没人买
    harry890829
        11
    harry890829  
       2018-10-24 09:01:24 +08:00
    说起来,这样的话马赛克是否也……
    silencefent
        12
    silencefent  
       2018-10-24 09:07:36 +08:00
    在中国打印然后寄过去比美帝便宜
    sfree2005
        13
    sfree2005  
       2018-10-24 09:20:59 +08:00
    技术上佩服,但这涉及版权问题吧。如果对技术真的很感兴趣,大可用没有版权的图片,或者你已经购买了版权的图片玩玩。
    jetyang
        14
    jetyang  
       2018-10-24 09:50:33 +08:00
    孩子脸颊和下巴上还是可以看到很深的字母印记,还要继续加强
    SCaffrey
        15
    SCaffrey  
       2018-10-24 10:41:31 +08:00 via Android
    好厉害 Qrz
    可以考虑尝试更强大的 SR 网络(?)
    takato
        16
    takato  
       2018-10-24 10:48:32 +08:00
    那么重新 GAN 一个到底涉及版权吗?
    其实很难界定的,毕竟自然的物都遵循某种规则,而这种规则有版权吗?个人认为显然没有吧。。
    alexapollo
        17
    alexapollo  
       2018-10-24 10:49:54 +08:00
    @SCaffrey SRGAN 目前已经不错了
    tutustream
        18
    tutustream  
       2018-10-24 11:00:54 +08:00
    哈哈,LZ 在训练 AI 用 PS 么。
    KgM4gLtF0shViDH3
        19
    KgM4gLtF0shViDH3  
       2018-10-24 11:04:41 +08:00
    有个疑问,不能自己拍吗
    artandlol
        20
    artandlol  
       2018-10-24 11:31:36 +08:00
    amon
        21
    amon  
       2018-10-24 11:39:14 +08:00
    目的是去水印么?貌似有一些成熟的产品。
    dapp98230
        23
    dapp98230  
       2018-10-24 19:09:07 +08:00
    nb
    coolwulf
        24
    coolwulf  
    OP
       2018-10-24 20:56:00 +08:00
    @amon 训练这个网络的目的不仅仅是去水印,还可以 recover loss information, 可以用来修复旧照片等等. 水印如果有 ps layer, 确实不需要这种方法还去除。但很多时候的水印照片是没有 layer 的,比如你自己翻拍的,或是商家移除了图层的,这时候, deep learning 的智能填充才可以做到
    coolwulf
        25
    coolwulf  
    OP
       2018-10-24 20:56:25 +08:00
    @artandlol 你这个需要图片包含图层信息.
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2485 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 05:17 PVG 13:17 LAX 22:17 JFK 01:17
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86