参考消息网5月20日报道据英国《金融时报》网站5月17日报道,在视频生成领域,中国人工智能(AI)企业领先于美国竞争对手。视频生成是生成式AI的一个关键战场,正迅速被广告、电子商务和娱乐等行业广泛采用。

总部位于北京的字节跳动和快手等企业正在利用海量的短视频库训练其系统,从而使其相对于美国竞争对手拥有了显著优势。

报道认为,这一转变标志着人工智能竞赛出现分化:尽管开放人工智能研究中心(OpenAI)、谷歌和Anthropic公司在大语言模型和编程等领域仍占据主导地位,但根据开发者和多个使用排行榜的数据,它们的视频生成工具在质量和可用性方面落后于中国产品。

报道指出,训练视频模型需要海量的高质量视频素材,而在这一领域,中国平台因拥有短视频应用程序及其产生的数据而具有优势。一些专家指出,中国企业在获取受版权保护的素材方面也更为积极。

制作AI生成内容的初创公司Director AI创始人本·蒋(音)说:“我们试用过的大多数美国模型在视频生成方面表现都不是很好。”他表示,更为严格的内容管控限制了美国工具,往往导致其生成的内容逼真度较低。

Director AI主要使用快手开发的可灵,同时也根据任务和成本的考量,在字节跳动的Seedance2.0和初创公司稀宇科技的海螺AI之间切换使用。

本·蒋说:“归根结底,关键在于生成内容的质量,以及模型对提示词的遵循程度。”他补充说,得益于近期的技术进步,这类工具的使用体验已变得更为顺畅,尤其是在音频同步和声音稳定性方面。

报道称,对于创作者而言,这些改进已在重塑内容制作流程。格鲁吉亚的独立AI电影制作人兼剪辑师乔治·万表示:“Seedance 2.0彻底改变了我的创作自由度。”他还说:“它在处理剧烈的镜头角度变化和快速运动时,仍能保持角色面部特征和光线对比度不丢失。大多数AI模型在物体高速运动时会出现画面晃动或漂移。”

在Arena平台发布的最佳视频生成模型排行榜中,可灵、Seedance 2.0和HappyHorse 1.0均取得了高分。该榜单是基于这个独立平台的用户投票汇编而成的。此类评估被认为比大多数模型基准测试系统更为可靠,因为那些基准测试系统常被AI实验室优化,未必能真实反映模型在实际应用中的表现。

报道指出,谷歌的Veo 3模型也具有竞争力。专家指出,得益于能够获取优兔视频素材,该模型具备一定优势,但在内容上对开发者设置了更多的安全防护与限制。

一些开发者和创作者表示,相对宽松的内容限制使中国AI模型在实际使用中更加便捷。本·蒋指出,美国的工具“经常会报错”,且往往在未作进一步解释的情况下,便以违反使用条款为由拒绝用户的请求。(编译/王海昉)

原文:toutiao.com/article/7641782931077218867/

声明:该文仅代表作者本人观点