OpenAI 技术长穆拉蒂(Mira Murati)接受《华尔街日报》专访证实,文字转成影片的 AI 新模型"Sora"将在今年稍晚提供大众使用。
OpenAI 上个月首度展示 Sora 强大功能,透过简短或详细文字叙述,或是提供静态图片,Sora 就能产生具有多个角色、不同运镜和背景细节的 1080p 影片,影片最长可达 60 秒。OpenAI 只向少数电影製作人员、视觉艺术家、设计师先行测试,这让一些 Sora 生成影片在 X(前身为 Twitter)等社群平台曝光,成果品质令人惊豔。
OpenAI 不仅将向大众提供这款新工具,更计划整合影片音效,使影片场景逼真,不再是无声电影。
由于 AI 工具还无法準确产生影像,OpenAI 允许用户编辑 Sora 生成影片中的内容,"我们试图弄清楚如何使用这项技术来做为人们编辑和创作的工具",穆拉蒂告诉《华尔街日报》。
当被问及 OpenAI 使用哪些资料训练 Sora 时,穆拉蒂并未正面回答,似乎迴避这个问题。"我不会详细介绍它使用的数据,但是来自公开可用或获得许可的数据",她表示无法确定 Sora 是否有用 YouTube、Facebook、Instagram 的影片,仅证实 Sora 有用来自 Shutterstock 图库的内容,是因 OpenAI 与该公司有合作关係。
穆拉蒂还告诉《华尔街日报》,运算 Sora 所消耗的电力相当昂贵,OpenAI 试图让这款新工具能有类似 DALL·E 的成本结构,再提供大众使用。
年末迎来美国总统大选,世界各地也有多场选举即将举行,人们渐渐加深对生成式 AI 工具产生错误资讯的担忧。对此穆拉蒂指出,Sora 上线后可能无法製作公众人物影像,与 DALL·E 的政策类似,且 Sora 生成影片会有浮水印,与真实拍摄影片有所区分。
OpenAI Made AI Videos for Us. These Clips Are Good Enough to Freak Us Out.(首图来源:OpenAI)