×
img

东吴证券:传媒行业点评报告:AGI里程碑:OPENAI发布视频生成模型SORA,多模态有望加速

发布者:wx****4e
2024-02-21
453 KB 3 页
影视 东吴证券
文件列表:
东吴证券:传媒行业点评报告:AGI里程碑:OPENAI发布视频生成模型SORA,多模态有望加速.pdf
下载文档
投资要点 事件:2月17日,OPENAI发布首个视频生成模型Sora,可实现文生视频、图生视频、扩展或补充视频等,最高可生成一分钟的高清视频,能生成具有多个角色、包含特定运动的复杂场景,表现出突破性的语义理解能力、复杂场景理解能力和一致性等。 视频生成能力显著突破,向着AGI目标再进一步。相比行业原有视频生成模型gen2、pika等,Sora在语义理解能力、复杂场景理解能力、一致性以及生成视频时长等方面取得明显突破。1)模型层面,Sora是一种扩散模型,从一个看起来像静态噪音的视频开始生成视频,通过多个步骤去除噪音,逐渐转换视频。Sora可以一次性生成整个视频,也可以扩展生成的视频。与GPT模型类似,Sora也采用了transformer架构,模型性能随着模型规模扩大而提高。新技术路径验证有望加速行业发展,算力需求有望增加。2)训练数据层面,Sora将视频和图像表示为更小的数据单元集合patch(类似于GPT中的token),通过统一数据表示方式,可在比以往更广泛的视觉数据上训练模型,包括不同的持续时间、分辨率和宽高比,最终生成的视频在这些维度也具有更高的灵活性。OpenAI未将Sor

加载中...

已阅读到文档的结尾了

下载文档

网友评论>