首页
AI资讯
文章详情

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

2024-09-02
AI资讯
原创文章

34
0
0
0

0°

帅气的我简直无法用语言描述！

2792 文章
0 粉丝
0 关注

最近更新

1.「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

2.英伟达版ChatGPT来了，PC端部署，很GPU

3.ChatGPT要有记忆力了！

文章目录

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

一作是北大博士

羿阁 Pine 发自凹非寺

量子位 | 公众号 QbitAI

自拍的视频也能转换成高清动漫脸，这个AI能够在线玩了！

多达数十种肖像风格，并且支持高分辨率，生成的视频是酱婶的～

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

比如想生成“迪士尼”卡通风格：

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

又或者想生成游戏里的角色风格：

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

这是生成的皮克斯动画风格的效果：

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

这是南洋理工大学开源的一个叫VToonify的框架，目前在Huggingface和Colab上都可以运行，一作还是北大博士。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

看完上面的示例，是不是心痒痒了，下面有详细教程手把手教你怎么玩，还不快学起来！

在线可玩

VToonify的操作可以说非常简单易上手了。

首先，选取你喜欢的卡通风格，公主风、肌肉风、大眼特效……还有5种插图风供你选择。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

其次，上传包含正脸的视频（或图像），点击一键缩放，这一步是为了避免CPU/GPU过载，不过不用担心，不会对最后生成视频的质量有影响。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

除此之外，还可以对上传视频的尺寸进行裁剪或填充。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

接下来，只需等待十几秒，即可得到最终的高清版卡通肖像。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

而且，如果对“美颜程度”不满意，还可以后期调整。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

那么，如此神奇的效果，背后的原理是什么呢？

集成两种框架

要讲明白VToonify风格转移的原理，就不得不提到StyleGAN，很多图像风格迁移框架都是以这个模型为基础的。

基于StyleGAN的方法也被称作图片卡通化，它将人脸编码到潜在空间中，然后再将生成的代码应用到被艺术肖像数据集调整后的StyleGAN，最终生成不同风格的肖像图。

重要的是，它可以生成1024*1024高分辨率的图像。

但StyleGAN在调整肖像的风格时，需要在固定的尺寸下进行，而且不完整的面孔以及一些奇怪的手势都会对它的效果产生影响，因此StyleGAN对动态肖像是不太友好的。

这时，就需要再介绍另外一种图像转换框架了——采用卷积网络的图像转换框架，它能够很好地忽略在测试阶段图像大小和人脸位置的限制 （与StyleGAN完全互补了）。

说回VToonify，它集两个框架的大成于一身，成为一个全新的混合框架。

研究人员删除了StyleGAN固定大小的输入特性和低分辨率层，然后创建了创建了一个完全卷积的编码器生成器架构。

具体来说，就是将StyleGAN模型集成到生成器中，将模型和数据结合起来，从而它的样式修改特性由VToonify继承。

并且，作为生成器的StyleGAN对编码器进行训练，可以大大减少训练时间和难度。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

值得一提的是，该研究团队在今年3月就曾开发过一款图像风格转移AI：模仿大师（Pastiche Master），基于DualStyleGAN的框架，能够灵活控制风格并修改风格度。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

而这次研究团队推出VToonify，不仅继承了DualStyleGAN的优点，并且通过修改DualStyleGAN的风格控制模块将这些特性进一步扩展到视频。

研究团队

VToonify的研究团队全部来自南洋理工大学。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

论文一作杨帅，是南洋理工大学的研究员，主要研究方向是图像生成和图像编辑，本科和博士均就读于北京大学。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

通讯作者吕健勤，是南洋理工大学计算机科学与工程学院的副教授，也是香港中文大学客座副教授，其研究方向主要为计算机视觉和深度学习。

真人视频秒变高清动漫脸，数十种“滤镜”可选，无需注册在线可玩｜SIGGRAPH Asia 2022

以下是VToonify在线试玩链接，感兴趣的小伙伴们自己动手试试吧～

在线可玩：
[1]https://huggingface.co/spaces/PKUWilliamYang/VToonify?continueFlag=4b9ae61e5c13076ecd7ba4f70434f863
[2]https://colab.research.google.com/github/williamyang1991/VToonify/blob/master/notebooks/inference_playground.ipynb

论文原文：
https://arxiv.org/abs/2209.11224

参考链接：
[1]https://www.reddit.com/r/MachineLearning/comments/xyxe8w/r_vtoonify_controllable_highresolution_portrait/
[2]https://huggingface.co/PKUWilliamYang/VToonify?continueFlag=4b9ae61e5c13076ecd7ba4f70434f863
[3]https://twitter.com/ShuaiYang1991/status/1576937439528042499

华科副研究员以独作身份投中数学顶刊，曾因换方向重读博士7年

量子位「MEET 2023智能未来大会」启动，邀你共论智能产业穿越周期之道

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

关联网址

关联标签

相关文章

国产AI导演贼6，短视频镜头和物体各动各的｜港城大&快手&天大

国产AI导演贼6，短视频镜头和物体各动各的｜港城大&快手&天大

AI看视频自动找“高能时刻”｜字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”｜字节&中科院自动化所@AAAI 2024

你在直播间看到的高清1080P，可能还没720P画质好

你在直播间看到的高清1080P，可能还没720P画质好

「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

英伟达版ChatGPT来了，PC端部署，很GPU

英伟达版ChatGPT来了，PC端部署，很GPU