创作者亲自揭开Sora视效大片《气球人》真相：大量人工后期参与，被指广告宣传效果误导大众-AI奇点网

首页 > 资讯 > 文章

2024-04-29 16:29

创作者亲自揭开Sora视效大片《气球人》真相：大量人工后期参与，被指广告宣传效果误导大众

哈？OpenAI Sora火爆全网的短片《气球人》，竟然也是造假的？

背后艺术家团队的最新揭秘，可谓一石激起千层浪：原来，视频画面并非完全由AI系统逐帧自主生成，其中有大量视觉效果需要人类后期实现。

这下网友不干了，合着大家伙儿跟OpenAI玩真心，OpenAI背后却耍起心眼子来了：

他们含糊其辞，就是希望观众认为短片完全是AI生成的，这是不是有点不诚实了啊。

这不是人工智能生成的视频，而是使用了一些AI技术的视频。

还有网友直接开喷：误导性营销！这是误导性营销！

究竟是怎么个事儿，咱们还是具体捋一捋。

揭秘Sora大片工作流

尽管OpenAI一开始就介绍了，《气球人》这样的短片出自艺术家团队之手，他们只是把Sora开放给了艺术家使用，但官方并未提及短片具体是如何制作而成的。

现在，《气球人》背后的艺术家团队Shy Kids自己来了个大揭秘，内容包括：

视频片段一致性如何实现
如何处理Sora生成的视频素材
Sora生成视频的局限性及后期处理

保持一致性很困难

针对视频内容生成的一致性，《气球人》中主角形象的一致性可谓惊艳众人。

但实际上吧，据Shy Kids团队中负责后期制作的老哥Patrick Cederberg透露，想要实现这种前后一致并不是写写提示词就能成的。

Sora团队并没有提供任何的辅助编辑工具，来帮助实现不同镜头之间的主体一致性。

也就是说，哪怕提示词都是一样的，两次运行的结果也会有所不同。他们的做法是，尽可能详细地去对主角形象进行描述。

解释角色的服装以及气球的类型是我们解决一致性问题的方法，目前Sora还没有集成适当的功能来实现此类控制。即便如此，团队在用Sora生成视频素材时还是遇到了不少这样那样的问题。

比如，提示词里明明写了气球需要生成黄色的，但Sora最终给出的生成片段里，气球却可能是红色的。

视频素材处理

除了一致性的问题之外，Patrick Cederberg提到，在时间轴方面，Sora允许用户修改关键帧。但这种时间控制并不精准，无法保证一定能实现预想的效果。

另外，想要实现这个镜头：

即把镜头焦点从牛仔裤一路上移到气球头，也得人类自己后期裁切平移画面，因为Sora本身不会渲染这样的镜头：它总是倾向于把焦点集中在气球头上。

Patrick Cederberg还谈到，他们在写提示词时也遇到了一些问题：OpenAI在让艺术家试用Sora前，并没有考虑到真正的电影制作人是如何思考的。

简单来说，就是Sora对摄影术语（比如跟拍、平移等专业术语）的理解能力有限。老帕认为，这一点上Sora的体验感受其实不如Runway。

值得一提的是，尽管Sora原生支持生成1080P视频，但Patrick Cederberg他们实际上生成的素材都是480P的。他们是在后期使用Topaz等工具对视频素材进行了超分处理。

生成速度方面，根据Patrick Cederberg的回忆，每次输入提示词后，大概需要10-20分钟的时间。

视频后期

接下来，就到了网络舆情反应最强烈的部分——人为介入了后期。

前面已经说到，Sora本身还解决不了不同视频片段里一致性的问题。除了气球不一定符合设定，或许是因为训练数据的原因，Sora还喜欢自动给气球加上奇奇怪怪的人脸。

给主角“气球人”生成一个其实并不需要的人头。

此外，Sora还很坚定地认为，气球就得带根绳儿。

总而言之，这些细节的问题，都需要Patrick Cederberg上手丢到Adobe AE里，进行后期处理。

另外，尽管Shy Kids发现“35mm胶卷”这样的关键词很好用，能让Sora生成的视频画面风格更一致，但艺术家们仍需要为最后的成片做调色，为画面添加颗粒和闪烁效果，以使整部影片画面更加协调统一。

Patrick Cederberg还提到了一个有意思的细节——Sora真的很喜欢慢镜头。

他说：

我不知道为什么，但有很多镜头看上去都是0.5倍速和0.75倍速。因此我们需要对大量画面进行调速，免得影片看上去像个大型慢动作项目。

那么，Sora生成的视频素材有多少最终被用在了影片里?

“数学很差”的Patrick Cederberg估计了一下，大概是300:1。换而言之，300个片段只有1个能用的。

除了上述提及的问题外，在音频方面，Sora目前还不能生成音效，因此旁白和音乐都是团队自己加上去的。

版权争议

为了不侵犯其他影视作品的版权，OpenAI给Sora上了一些安全护栏限制：

比如，你不能撰写提示词「35mm胶卷，未来宇宙飞船中，一名男子拿着光剑靠近」，那样Sora大概率是会直接拒绝生成，因为这画面光看文字就太像《星球大战》的场景，“西半球最强法务”可不是闹着玩的。

此外，包括像什么专有的导演风格「阿罗诺夫斯基式镜头」和「希区柯克变焦」等待，也是不行的。

三人团队在2周制作完成

但瑕不掩瑜地说，抛开外界舆情带起的风波，Shy Kids团队对于Sora视频模型的整体表现还是很满意的。毕竟，制作《气球人》这样一个高质量短片，最后只用了他们三个人大约1.5~2周的工作时间。

团队认为，现在，对于专业的电影团队来说，Sora当然还有很大进步空间，但对于大部分人而言，Sora已经足够惊艳。

用Patrick Cederberg自己的话说：我觉得人们应该将Sora变成视频创作工作流里的一部分。

不少网友对此表示认同，认为Sora这样的视频生成AI系统，是对现有的创作工作流很好的补充。

比如，Adobe就将Sora等视频模型集成进Adobe Pr软件里，就是一个很不错的主意。但“我厌倦了OpenAI精美包装的案例营销”。

?相关阅读：

Adobe重磅官宣：OpenAI视频模型Sora与Premiere Pro合体，剪辑师喜获最强AI工具

Adobe重磅官宣：包括Adobe Firefly自研模型，以及OpenAI Sora、Runway Gen-2、Pika一系列的第三方视频模型，都将在Premiere Pro剪辑软件上推出。

还有网友不满的点在于，爆火的“人工智能生成视频”背后，其实存在着大量的人类工作，他们投入了数百个小时的工作量，却被“AI一句话生成”掩盖了真实的价值。

4

查看相关话题： #Sora #OpenAI #AI视频

相关文章

知名AI科技媒体

作者已发布 131 篇文章

近期文章

更多

OpenAI满血版o1剧透：数学代码能力再破天花板，已开启测试评估

OpenAI满血版o1剧透：数学代码能力再破天花板，已开启测试评估

「国产Sora」最新升级！《沙丘》级大片视效，人人都能免费体验

「国产Sora」最新升级！《沙丘》级大片视效，人人都能免费体验

我们用豆包视频大模型，生成了AI版的《红楼梦》MV

我们用豆包视频大模型，生成了AI版的《红楼梦》MV

中国版Sora来了！一键生成16秒1080P的AI视频，清华团队直面对标OpenAI

上一篇

苹果5月7日新品发布活动产品曝光：旗下首款AI平板电脑，新一代iPad Pro将直接搭载M4处理器

下一篇