2019年最火的科学论文蒙娜丽莎动起来什么样

2019-12-20 10:39:22  阅读:1534 来源:责任编辑NO。魏云龙0298

药明康德AI/报导

年尾将至,从各类盘点榜单看来,2019也是收成颇丰的一年,人工智能、疫苗、气候危机等是本年几大热词。“Altmetric百篇论文榜单”日前发布,该榜单包括了本年热议度高、评论规模广的100篇研讨本文旨在介绍榜单中的Top 1一种AI视频组成体系

蒙娜丽莎,或许只在人头攒动的卢浮宫曾与她远远对望,相视一笑,抑或是在网上看一睹其“奥秘”笑脸,转发了几个恶搞表情包。可曾想过,奥秘的蒙娜丽莎从传世名作中“复生”,并动起来了?这样的场景只在电影中见过,《哈利·波特》中格兰芬多休息室的胖夫人画像照进了实际。这项引起广泛注重的研讨便要从“会动”的蒙娜丽莎说起。

开口说话的蒙娜丽莎、焦虑的蒙娜丽莎,好像没那么高冷了(动图来历:Egor Zakharov, Aliaksandra Shysheya)

这是实在头部说话神经模型的少样本对立学习,没有3D建模,仅以一张静态图画就能练习制作出视频的技能,令人称奇。

本年5月,三星(Samsung)AI实验室以及俄罗斯斯科尔科沃立异中心(Skolkovo Innovation Center)的研讨人员发篇题为 “Few-Shot Adversarial Learning of Realistic Neural Talking Head Models” 的论文,概述了这种技能。该技能依据卷积神经网络(CNN),模型经过取得一个输入图画,然后可以模拟输出视频中方针方针的运动状况,也便是咱们在上图所看到的。该研讨5月预印宣布,6月正式被计算机视觉范畴尖端会议CVPR 2019录入。

其实此类主意和技能在此之前也不少见,已经有不少研讨人员从事该类研讨。2018年,华盛顿大学研讨人员共享了他们创立的“真假奥巴马”——ObamaNet,该技能运用神经网络分析了数百万帧的视频,来确认奥巴马的面部表情怎么改变。以及加州大学伯克利分校(University of California, Berkeley)研讨团队运用YouTube视频练习AI,从而生成可以做后空翻等杂技动作的模型。大大小小研讨不在少数,可为何独独这篇论文能招引外界注重呢?

该研讨的特别之处便在于,其AI体系不需求经过很多数据集的练习进程只需看一次需求输出方针方针动作的静态图片就可以运转。研讨人员将这种学习办法称为few-shot learning。在few-shot learning的基础上,研讨人员选用元学习对VoxCeleb2(包括许多名人头像的数据库)数据集进行元练习(meta learning)。经过元练习,AI则学习到了怎样快速生成图画的才能,而不是详细生成某一特定类别图画的才能。

图片来自:Pixabay

接着,研讨人员运用对立学习(adversarial learning),创立了对立神经网络,可以像“仿制粘贴”的进程那样,将静态图中的面部信息“仿制”到动图或视频中。它们别离是:

(1)嵌入式网络:可以将输入的静态图画中人像的眼耳口鼻等概括信息,转换为相关向量从而传给生成神经网络;

(2)生成神经网络:经过仿制人像的面部标志(landmark),终究组成人在动态视频中的面部表情;

(3)区分神经网络:别离搜集生成神经网络组成的面部图画、landmark和实在的动态视频的面部表情信息,经过对立的办法提高生成神经网络的生成才能以及本身的区分才能。

形象来说,生成神经网络是“造假方”,区分神经网络则是“打假方”,而嵌入式网络则像“爪牙”。一旦前两者才能到达平衡,依据对立学习的AI模型的才能也就过关了。

3种神经网络的“对立”示意图(图片来自:参考资料[1]

经过上述对立学习的进程,加之元学习的办法,终究的AI模型可以在视频数据集上经过学习小量的样本,到达较强的学习才能,并可以使用此学习才能快速找到处理其他同类问题的办法。因而,终究的AI模型可以灵敏的依据静态图片生成林林总总灵动的图画,并将这些图片装帧从而生成动态图画

除了蒙娜丽莎之外,这项研讨中,还有不少名人的静态头像也被研讨人员用来进行相关研讨。有穿越时空,与你进行科学对话的爱因斯坦。

图片来自:Egor Zakharov, Aliaksandra Shysheya

还有风情万千的玛丽莲·梦露重现魅力与光荣。

图片来自:Egor Zakharov, Aliaksandra Shysheya

从研讨和技能层面来看,这是AI视频组成体系的一次打破开展。从社会性视点来看,相同引发不少热议,有人担忧若是依据可观的转换率,视频通话是否因而会被造假?以假乱真会不会到达新高度?还有人表明未来流量艺人会否因而仅靠一张张美图便闯练影视圈?也有人在担忧人脸付出的安全性。更有脑洞大开着期望凭借此技能,与从前的中外智者进行平行时空的对话……

技能的更新迭代旨在便当造福人类,若是技能反而成为部分人的担负,并影响了社会秩序,那么技能合规有必要被注重。Deepfake技能引发了广泛谈论,让人“又爱又恨”,或许最近国家网信办出台的新规则,对AI技能换脸进行了清晰束缚,比如这样的行动或许可以大大削减部分人的担忧吧。

参考资料(可上下滑动检查)

[1] Few-Shot Adversarial Learning of Realistic Neural Talking Head Models Retrieved Dec 18, 2019 from https://arxiv.org/pdf/1905.08233v1.pdf

[2] Mona Lisa guest on TV? Researchers work out talking heads from photos, art Retrieved Dec 18, 2019 from https://techxplore.com/news/2019-05-mona-lisa-guest-tv-photos.html

[3] Samsung deepfake AI could fabricate a video of you from a single profile pic Retrieved Dec 18, 2019 from https:///news/samsung-ai-deepfake-can-fabricate-a-video-of-you-from-a-single-photo-mona-lisa-cheapfake-dumbfake/

[4] http:///a/315959168_129720

点“”,共享AI健康新动态

 
 
2019年最火的科学论文蒙娜丽莎动起来什么样_中华健康网

2019年最火的科学论文蒙娜丽莎动起来什么样

   日期:2019-12-20     作者:责任编辑NO。魏云龙0298    浏览:1534    评论:0    
核心提示:药明康德AI/报导年尾将至,从各类盘点榜单看来,2019也是收成颇丰的一年,人工智能、疫苗、气候危机等是本年几大热词。“Altmetr

药明康德AI/报导

年尾将至,从各类盘点榜单看来,2019也是收成颇丰的一年,人工智能、疫苗、气候危机等是本年几大热词。“Altmetric百篇论文榜单”日前发布,该榜单包括了本年热议度高、评论规模广的100篇研讨本文旨在介绍榜单中的Top 1一种AI视频组成体系

蒙娜丽莎,或许只在人头攒动的卢浮宫曾与她远远对望,相视一笑,抑或是在网上看一睹其“奥秘”笑脸,转发了几个恶搞表情包。可曾想过,奥秘的蒙娜丽莎从传世名作中“复生”,并动起来了?这样的场景只在电影中见过,《哈利·波特》中格兰芬多休息室的胖夫人画像照进了实际。这项引起广泛注重的研讨便要从“会动”的蒙娜丽莎说起。

开口说话的蒙娜丽莎、焦虑的蒙娜丽莎,好像没那么高冷了(动图来历:Egor Zakharov, Aliaksandra Shysheya)

这是实在头部说话神经模型的少样本对立学习,没有3D建模,仅以一张静态图画就能练习制作出视频的技能,令人称奇。

本年5月,三星(Samsung)AI实验室以及俄罗斯斯科尔科沃立异中心(Skolkovo Innovation Center)的研讨人员发篇题为 “Few-Shot Adversarial Learning of Realistic Neural Talking Head Models” 的论文,概述了这种技能。该技能依据卷积神经网络(CNN),模型经过取得一个输入图画,然后可以模拟输出视频中方针方针的运动状况,也便是咱们在上图所看到的。该研讨5月预印宣布,6月正式被计算机视觉范畴尖端会议CVPR 2019录入。

其实此类主意和技能在此之前也不少见,已经有不少研讨人员从事该类研讨。2018年,华盛顿大学研讨人员共享了他们创立的“真假奥巴马”——ObamaNet,该技能运用神经网络分析了数百万帧的视频,来确认奥巴马的面部表情怎么改变。以及加州大学伯克利分校(University of California, Berkeley)研讨团队运用YouTube视频练习AI,从而生成可以做后空翻等杂技动作的模型。大大小小研讨不在少数,可为何独独这篇论文能招引外界注重呢?

该研讨的特别之处便在于,其AI体系不需求经过很多数据集的练习进程只需看一次需求输出方针方针动作的静态图片就可以运转。研讨人员将这种学习办法称为few-shot learning。在few-shot learning的基础上,研讨人员选用元学习对VoxCeleb2(包括许多名人头像的数据库)数据集进行元练习(meta learning)。经过元练习,AI则学习到了怎样快速生成图画的才能,而不是详细生成某一特定类别图画的才能。

图片来自:Pixabay

接着,研讨人员运用对立学习(adversarial learning),创立了对立神经网络,可以像“仿制粘贴”的进程那样,将静态图中的面部信息“仿制”到动图或视频中。它们别离是:

(1)嵌入式网络:可以将输入的静态图画中人像的眼耳口鼻等概括信息,转换为相关向量从而传给生成神经网络;

(2)生成神经网络:经过仿制人像的面部标志(landmark),终究组成人在动态视频中的面部表情;

(3)区分神经网络:别离搜集生成神经网络组成的面部图画、landmark和实在的动态视频的面部表情信息,经过对立的办法提高生成神经网络的生成才能以及本身的区分才能。

形象来说,生成神经网络是“造假方”,区分神经网络则是“打假方”,而嵌入式网络则像“爪牙”。一旦前两者才能到达平衡,依据对立学习的AI模型的才能也就过关了。

3种神经网络的“对立”示意图(图片来自:参考资料[1]

经过上述对立学习的进程,加之元学习的办法,终究的AI模型可以在视频数据集上经过学习小量的样本,到达较强的学习才能,并可以使用此学习才能快速找到处理其他同类问题的办法。因而,终究的AI模型可以灵敏的依据静态图片生成林林总总灵动的图画,并将这些图片装帧从而生成动态图画

除了蒙娜丽莎之外,这项研讨中,还有不少名人的静态头像也被研讨人员用来进行相关研讨。有穿越时空,与你进行科学对话的爱因斯坦。

图片来自:Egor Zakharov, Aliaksandra Shysheya

还有风情万千的玛丽莲·梦露重现魅力与光荣。

图片来自:Egor Zakharov, Aliaksandra Shysheya

从研讨和技能层面来看,这是AI视频组成体系的一次打破开展。从社会性视点来看,相同引发不少热议,有人担忧若是依据可观的转换率,视频通话是否因而会被造假?以假乱真会不会到达新高度?还有人表明未来流量艺人会否因而仅靠一张张美图便闯练影视圈?也有人在担忧人脸付出的安全性。更有脑洞大开着期望凭借此技能,与从前的中外智者进行平行时空的对话……

技能的更新迭代旨在便当造福人类,若是技能反而成为部分人的担负,并影响了社会秩序,那么技能合规有必要被注重。Deepfake技能引发了广泛谈论,让人“又爱又恨”,或许最近国家网信办出台的新规则,对AI技能换脸进行了清晰束缚,比如这样的行动或许可以大大削减部分人的担忧吧。

参考资料(可上下滑动检查)

[1] Few-Shot Adversarial Learning of Realistic Neural Talking Head Models Retrieved Dec 18, 2019 from https://arxiv.org/pdf/1905.08233v1.pdf

[2] Mona Lisa guest on TV? Researchers work out talking heads from photos, art Retrieved Dec 18, 2019 from https://techxplore.com/news/2019-05-mona-lisa-guest-tv-photos.html

[3] Samsung deepfake AI could fabricate a video of you from a single profile pic Retrieved Dec 18, 2019 from https:///news/samsung-ai-deepfake-can-fabricate-a-video-of-you-from-a-single-photo-mona-lisa-cheapfake-dumbfake/

[4] http:///a/315959168_129720

点“”,共享AI健康新动态

 
打赏
 
更多>同类要闻
0条 [查看全部]  相关评论

推荐图文
推荐要闻
点击排行