OpenAI 首席技术官:文生视频工具 Sora 数月内将公开发布,拟支持生成音频

IT之家3月13日消息,《华尔街日报》当地时间13日(今天)刊登了OpenAI首席技术官米拉・穆拉蒂的专访。Sora将于今年推出,“可能需要几个月,”她说。

穆拉蒂表示,除了让Sora向公众开放之外,OpenAI还计划添加音频生成功能,这可能会让场景更加真实。此外,该公司计划允许用户自行编辑Sora生成的内容“因为人工智能工具并不总是能产生准确的结果。”她表示,该公司正在努力寻找方法,让用户能够自行编辑和创建音频和视频内容。

当被问到OpenAI用什么数据来训练索拉时,穆拉蒂并没有给出非常具体的答案:“我不打算详细说明所使用的数据的细节,但是这些数据是公开的或者是获得许可的数据。”同时,她不确定是否使用了YouTube、Facebook和Instagram的视频,仅表示Sora使用的内容来自Shutterstock,因为双方有合作关系。

此外,穆拉蒂还表示,Sora发布后,“很有可能”无法生成含有公众人物的视频,而且视频还会带有AI水印。

综合IT之家此前报道称,Sora核心团队三名成员最近访问了WVFRM播客频道,他们还表示Sora还处于反馈获取阶段,“还不是产品,短期内不会向公众开放。。”

不久前的3月10日,另一家文森特视频平台Pika宣布推出新功能,用户可以在Pika生成的视频中无缝生成并集成声音。可以通过文字提示,描述你想要的声音,也可以直接让皮卡根据视频内容自动生成声音。