coolwulf
V2EX  ›  问与答

[原创] 女儿的学校照片 + 吐槽收费的要价 + 人工智能的解决方法

  •  
  •   coolwulf · Oct 24, 2018 · 5956 views
    This topic created in 2760 days ago, the information mentioned may be changed or developed.

    又到了一年一度的学校 school picture 时节, 在北美这里有孩子的朋友可能知道, 一般这个时间就是家长得出(tu)钱(xie)的时候了。一般的 school picture 的要价是这样的:

    http://thyrsi.com/t6/394/1540328645x-1566684341.jpg

    这往往是便宜的,而且一般你家孩子不会只照一张俩张,有时候还会有和其他同学的合照和班级集体照。

    随口问了孩子妈,“我们今年买几张”。“全要吧”, 孩子妈头也不回的说。

    我简单一算,哎呀妈呀,这还不得好几大百 $ 下去了...

    有没有更好的解决方法?然后我想到了 AI, 想到了我那一堆躺在地下室吃灰的显卡 ... (前情提要请看我前面的帖子)

    首先我研究了一下 School Picture 提供网站上面提供的学生样品图片。这些样品图片一般是低解析度 (Low Resolution) 和加上了水印 (Watermark) 的给用户提供一个购买之前照片印象的图片。

    看了看这些图片,让我想到了使用 SRGANs 和其他的 In Painting Network 来解决这个问题的可能。好吧说干就干吧

    首先是原图: http://thyrsi.com/t6/394/1540328673x-1404814676.jpg

    使用 ImageNet 的数据,通过 SRGANs 来训练一个 AI 来提升图片的 resolution, 网络结构:

    这个网络大概训练了三天多,我看结果似乎还不错,够用了

    提升后的图片解析度达到了打印成 8 x 10 或者更大片副的要求,这里是 100% 的 before / after 比较: http://thyrsi.com/t6/394/1540328695x-1404814676.jpg

    接下来的问题是水印,我采用了 Nvidia 团队支持不同大小,形状的 Partial Convolution 的解决方法, 论文: http://thyrsi.com/t6/394/1540328723x1822611687.jpg

    训练的数据主要是 ImageNet 中的人物数据集,然后我又加上了 CelebA 这个专门的名人头像数据集来作训练

    总过花了快俩周的时间才 train 完 (汗,太慢了)。这个 AI 的结果还凑合,暂时可以用了,放一下结果图:

    http://thyrsi.com/t6/394/1540328739x1822611687.jpg

    当然结果还不够好,可能还需要手工做些 touchup. 不过我打算在继续强化一下这个网络,看看能否提高效果。

    然后准备写个简单的网站,这样方便远程使用,年底再去坐 Cruise 的时候看来是不需要再花大价钱买照片了...

    哈哈哈...

    当我正准备狂笑三声的时候,孩子妈劈头盖脸的问我 "孩子照片你不是说上周就挂家墙上的嘛?“, 我:"..."

    25 replies    2018-10-24 20:56:25 +08:00
    klaksvik
        1
    klaksvik  
       Oct 24, 2018 via Android
    哈哈,楼主这个太赞了。
    green15
        2
    green15  
       Oct 24, 2018 via iPhone
    楼主的思路奇特,技术含量高……收徒弟吗? 23333
    xenme
        3
    xenme  
       Oct 24, 2018 via iPhone
    这结尾,😄
    DevRoss
        4
    DevRoss  
       Oct 24, 2018 via Android
    哈哈哈
    bearqq
        5
    bearqq  
       Oct 24, 2018 via Android
    拿女儿照片来骗点击量也是蛮拼的
    (滑稽
    leoojiang
        7
    leoojiang  
       Oct 24, 2018 via iPhone
    考虑到一个问题:涉不涉及版权……
    coolwulf
        8
    coolwulf  
    OP
       Oct 24, 2018
    @OscarUsingChen 或许是的,不过我之所以训练这个网络不仅仅是为了去除 watermark, 还可以针对 loss information 的图片来做修复,对于有损伤的老照片之类的也可以使用。
    coolwulf
        9
    coolwulf  
    OP
       Oct 24, 2018
    确实,这个模型可以有其他的应用。
    Bryan0Z
        10
    Bryan0Z  
       Oct 24, 2018 via Android
    你这个好便宜,我们拍的毕业照,一张要 90 刀,最后听说是没人买
    harry890829
        11
    harry890829  
       Oct 24, 2018
    说起来,这样的话马赛克是否也……
    silencefent
        12
    silencefent  
       Oct 24, 2018
    在中国打印然后寄过去比美帝便宜
    sfree2005
        13
    sfree2005  
       Oct 24, 2018
    技术上佩服,但这涉及版权问题吧。如果对技术真的很感兴趣,大可用没有版权的图片,或者你已经购买了版权的图片玩玩。
    jetyang
        14
    jetyang  
       Oct 24, 2018
    孩子脸颊和下巴上还是可以看到很深的字母印记,还要继续加强
    SCaffrey
        15
    SCaffrey  
       Oct 24, 2018 via Android
    好厉害 Qrz
    可以考虑尝试更强大的 SR 网络(?)
    takato
        16
    takato  
       Oct 24, 2018
    那么重新 GAN 一个到底涉及版权吗?
    其实很难界定的,毕竟自然的物都遵循某种规则,而这种规则有版权吗?个人认为显然没有吧。。
    alexapollo
        17
    alexapollo  
       Oct 24, 2018
    @SCaffrey SRGAN 目前已经不错了
    tutustream
        18
    tutustream  
       Oct 24, 2018
    哈哈,LZ 在训练 AI 用 PS 么。
    KgM4gLtF0shViDH3
        19
    KgM4gLtF0shViDH3  
       Oct 24, 2018
    有个疑问,不能自己拍吗
    artandlol
        20
    artandlol  
       Oct 24, 2018
    amon
        21
    amon  
       Oct 24, 2018
    目的是去水印么?貌似有一些成熟的产品。
    dapp98230
        23
    dapp98230  
       Oct 24, 2018
    nb
    coolwulf
        24
    coolwulf  
    OP
       Oct 24, 2018
    @amon 训练这个网络的目的不仅仅是去水印,还可以 recover loss information, 可以用来修复旧照片等等. 水印如果有 ps layer, 确实不需要这种方法还去除。但很多时候的水印照片是没有 layer 的,比如你自己翻拍的,或是商家移除了图层的,这时候, deep learning 的智能填充才可以做到
    coolwulf
        25
    coolwulf  
    OP
       Oct 24, 2018
    @artandlol 你这个需要图片包含图层信息.
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3098 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 120ms · UTC 11:06 · PVG 19:06 · LAX 04:06 · JFK 07:06
    ♥ Do have faith in what you're doing.