文件列表:
德邦证券:传媒:Sora发布有望加速AI视频技术迭代进程,持续关注AI应用的商业化落地.pdf |
下载文档 |
资源简介
>
投资要点:
从Sora效果来看,“一致性”迎来突破,“真实性”有望增强。2023年,基于Diffusion的视频生成模型密集发布,例如Gen-2、Pika、SVD等,但主要的瓶颈在于一致性,生成的人物和场景无法在每一帧中保持一致,因此应用落地有限。同时,模型单次生成的视频时长最长为18秒,虽然支持通过预测延长视频,但延长后的视频通常缺乏一致性和逻辑性。根据Sora发布的Demo,模型在一致性方面获得巨大突破。1)3D一致性:Sora可以生成摄像机动态运动的视频,随着摄像机的移动和旋转,人物和场景元素在3D空间中的移动会保持一致。2)长期连续性:Sora经常(并非总是)能够有效地模拟短距离和长距离依赖关系。例如,即使人、动物和物体被遮挡或离开画面,也能保持它们的存在。3)对象永恒性:Sora能在单个样本中生成同一角色的多个镜头,并在整个视频中保持其外观。真实性方面,当与物理世界产生互动,Sora有时可以模拟一些影响世界状态的简单动作。例如,画家可以在画布上留下新的笔触,并随着时间的推移而持续;或者一个人在吃一个汉堡时,留下咬痕。虽然目前Sora的模拟尚有局限,不能准确地模拟许多基本交互的
加载中...
已阅读到文档的结尾了



