综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品 | Weibo AI工具导航-AI导航新方向

首页
AI资讯
文章详情

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

2024-10-15
AI资讯
原创文章

25
0
0
0

0°

帅气的我简直无法用语言描述！

2792 文章
0 粉丝
0 关注

最近更新

1.「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

2.英伟达版ChatGPT来了，PC端部署，很GPU

3.ChatGPT要有记忆力了！

文章目录

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

尚恩发自凹非寺
量子位 | 公众号 QbitAI

前不久跑男为了让“kunkun”原地消失，后期只能一帧一帧的抠图。

现在，只要编辑一帧，整个视频就跟着变！

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

就是点点kunkun，整集就自动消失的那种（手动狗头）。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

Adobe Research和英属哥伦比亚大学的研究人员发现，使用INVE（交互式神经视频编辑），只需在单帧上“画笔涂鸦”，就能自动应用改动到整个视频中。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

不仅可以编辑视频中的对象并保留空间和光影关系，甚至可以编辑移动对象的纹理色彩。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

网友惊呼：太牛了！

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

交互式神经视频编辑

INVE（Interactive Neural Video Editing）是一种实时视频编辑解决方案。

研究团队受到分层神经图集（LNA）的研究启发。测试发现，通过使用INVE，可以将稀疏帧编辑一致地传播到整个视频剪辑，辅助视频编辑过程。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

视频中的场景通常由非静态背景和一个或多个前景物体组成，运动轨迹也会不同。

早期的2D方法需要独立编辑每一帧，并使用帧间跟踪来协调整个视频。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

假如我们要把这个小狗头像放在车门上，按照传统方式，视频中车是往前移动的，为避免不出现溢出效果，就需要一帧一帧训练和测试反复编辑。

这种方式费时费力不说，还容易导致明显的视觉伪影。

而最近发展起来的分层神经图集（LNA）方法，可以通过一组分层神经网络2D图集对单个训练和测试，达到编辑整个视频的效果。

虽避免了逐帧编辑，但也有一些问题，比如处理速度较慢、对某些编辑用例支持不足。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

因此，研究团队基于LNA方法，通过学习图像图集和图像之间的双向函数映射，并引入矢量化编辑，使得在图集和图像中一致编辑成为可能。

同时，采用多分辨率哈希编码来改善模型的收敛速度。

如何实现

研究团队基于光流提取算法RAFT，在包含70帧且分辨率为768×432的视频上训练和测试模型。

首先，团队在每个训练批次中随机采样了10,000个视频像素，然后设定了一个模型参数值。

通过将GPU优化的Fully Fused MLP架构引入，仅迭代大约12,000个次数就完成训练，相比于LNA的300,000个迭代次数要少得多。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

测试显示该方法在单个NVIDIA RTX 4090 GPU上的渲染速度为24.81 FPS，对比LNA的渲染速度5.34 FPS，渲染速度快了近5倍。

经过相同数量的迭代训练，团队模型的重建、流场损失都比LNA更快地收敛。

此外，为实现点跟踪，团队选择逆映射的方法，允许添加跟踪单个/少数点的刚性纹理。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

团队提出“矢量化素描技术”，将多边形链直接映射到图集中，更精确地控制线条，从而减少计算成本并避免有视觉伪影。

再通过分层编辑，允许在图集之上叠加多个可编辑图层，使每个图层都可独立访问和编辑。

分层编辑支持多种类型的编辑，包括画笔涂鸦、局部调整、纹理编辑。

比如画笔涂鸦，就可以直接使用画笔工具草图涂鸦。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

比如纹理编辑，可以导入外部图形，跟踪和变形的运动对象。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

研究团队

作者团队由来自Adobe Research、英属哥伦比亚大学、AI Vector研究所和CIFAR AI组成。

第一作者是Jiahui Huang，目前是Adobe Research的研究工程师，硕士毕业于英属哥伦比亚大学。

综艺后期狂喜：编辑一帧，整个视频跟着变！比LNA渲染快5倍，Adobe联合出品

其他作者包括Kwang Moo Yi、Oliver Wang和Joon Young Lee，整个团队研究方向主要也是在计算机视觉、机器学习和视频编辑领域。

论文地址已贴，感兴趣的可以去看看。

论文传送门：
https://arxiv.org/abs/2307.07663

参考链接：
[1]https://twitter.com/_akhaliq/status/1681162394393886720/
[2]https://gabriel-huang.github.io/inve/

ChatGPT支持个人定制！告别大段提示词，只需先和它做好自我介绍

斯坦福校长因学术不端辞职！3篇顶刊论文面临撤稿，本人回应：对学生手下太过信任

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

关联网址

关联标签

相关文章

「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

「法外狂徒」ChatGPT！30年老律师用它旁征博引，结果被禁止执业

英伟达版ChatGPT来了，PC端部署，很GPU

英伟达版ChatGPT来了，PC端部署，很GPU

ChatGPT要有记忆力了！

ChatGPT要有记忆力了！

下一代Windows系统曝光：基于GPT-4V，Agent跨应用调度，代号UFO

下一代Windows系统曝光：基于GPT-4V，Agent跨应用调度，代号UFO

这个AI办公应用火了：简短提示词出PPT，打包GPTs帮你打工干活

这个AI办公应用火了：简短提示词出PPT，打包GPTs帮你打工干活