×
img

国投证券:计算机行业周报:文生视频模型Sora有望引领AI新景气

发布者:wx****8c
2024-02-19
1 MB 13 页
互联网 国投证券
文件列表:
国投证券:计算机行业周报:文生视频模型Sora有望引领AI新景气.pdf
下载文档
OpenAI发布文生视频模型Sora,效果显著提升 近期,OpenAI发布新的文生视频模型Sora,其展示的效果相比其他的文生视频模型如Runway、Pika有了显著的提升。我们从几个维度来解读其创新之处: 从算法模型来看:OpenAI使用了Diffusion模型+Transformer的架构,通过构建含有时空信息的视觉patch,统一了不用时间长度、分辨率、宽高比的视频和图片训练数据,从而使得模型的训练数据得以大幅的丰富,同时输出结果可以实现不同分辨率和宽高比的视频。从生成的视频来看:Sora生成的内容有几个方面实现了对现有其他算法的超越:1)灵活的视频尺寸和更长的视频时长:Sora能够制作各种尺寸的视频,从宽屏的1920x1080到竖屏的1080x1920,同时具有更好的构图效果。从生成视频的时长来看,也从其他模型的4s提升至最高60s的视频时长。2)多模态的视频生成能力:除了文生图之外,Sora还可以实现图生视频、视频生成视频(即视频风格切换、环境变化和无缝衔接)等,具备丰富的多模态视频生成能力。3)视频时间线的灵活扩展:Sora还能将视频沿时间线向前或向后扩展。demo中的视频

加载中...

已阅读到文档的结尾了

下载文档

网友评论>