TikTok风靡全球现在中国公司正在利用人工智能进一步发展视频

股市 2025-08-11

中国以视频为主的娱乐界为企业提供了大量数据，他们现在正在大力开发赚钱的人工智能工具，用于制作广告和电影剪辑。

在研究公司人工分析（Artificial Analysis）过去两个月推出的文本到视频生成人工智能模型中，TikTok的母公司字节跳动（ByteDance）位居第一和第三。谷歌分别位居第二和第四，而总部位于北京的短视频应用快手的可灵AI排名第五。

瑞银证券（UBS Securities）中国互联网分析师熊薇（Wei Xiong）表示，尽管人工智能行业的其他领域出现了一些整合，但“人工智能视频生成模型的竞争还处于较早阶段，一些中国公司已成为这一领域的早期领导者。”

她说：“我们相信，通过提高制作效率、降低创作障碍和开启新的货币化模式，人工智能视频生成有可能重塑内容行业。”

有了这样的人工智能工具，用户可以上传一张或多张图像，并指示人工智能根据它们生成视频片段。其他工具允许用户输入文本，人工智能将从中生成视频剪辑。

这家总部位于北京的公司上周在上海举行的世界人工智能大会上声称，从广告商到电影动画师，已有超过2万家企业使用可灵AI来制作视频。最新版本“可灵 2.1”可以自动添加与人工智能生成的视频相匹配的相关音效。

它不仅适用于中国的用户。

“无论是用户规模还是商业收入，海外都占了大部分。”可灵AI运营主管曾玉申（Zeng Yushen）告诉CNBC。她说，该公司计划在日本、韩国和欧洲等地加强对该工具的支持。

“这是我们观察到的，人工智能大模型越来越全球化。”她说，“人们似乎并不关心这是哪个国家的产品。”

快手声称，今年前三个月，可灵AI的收入超过1.5亿元人民币（合2083万美元），而在此期间，生成AI工具的每日广告支出为3000万元人民币。该公司尚未宣布何时发布第二季度业绩。曾玉申拒绝分享可灵AI的模型培训成本。

虽然生产成本的降低意味着一个“相当大”的市场，但瑞银的熊薇表示，“目前的模型能力仍然受到片段长度、运动一致性和可控性的限制。”

除了特朗普政府限制中国获得训练人工智能模型所需的先进半导体外，中国视频人工智能公司还面临来自美国的竞争。

亚马逊（Amazon）和谷歌（Google）已经推出了从图像或文本生成视频的工具。这些版本发布之际，微软（Microsoft）支持的OpenAI于12月向ChatGPT用户推出了其视频生成模型Sora，这是在2024年2月公布其功能近一年后。

然而，可灵AI已经在2024年6月向公众推出。用户订阅和购买积分来生成视频。

竞争对手Vidu，是总部位于北京的初创公司“生数”（Shengshu）的视频大模型，大约12个月前向全球用户推出了一款工具。今年3月左右，该公司表示，预计基于用户订阅费的年收入将达到2000万美元。

“中国企业倾向于首先找出一个商业‘痛点’……”咨询公司DGA-Albright Stonebridge Group的合伙人兼中国高级副总裁保罗·特里奥罗（Paul Triolo）表示：“这对人工智能应用来说是一个挑战。”

他指出，中国初创公司3DStyle如何使用生成式人工智能来设计新的服装款式，并将其与互联网连接的自动化制造相结合。

特里奥罗表示，美国公司也一直在将人工智能应用于特定行业，但中国企业往往能够更快地整合人工智能，因为它们面临着竞争非常激烈的环境，并且可以从“非常合格”的本地软件工程师中招聘。

*“人工智能作为电影制作人”*

中国电商巨头阿里巴巴上周发布了最新版本的视频代人工智能模型通义万相Wan2.2，也走在了潮流的前列。该公司声称，通过开源模式，用户可以控制照明、一天中的时间、色调、相机角度、帧大小、构图和焦距。

开源允许用户免费下载模型，并使用它定制产品（如果不是商业化的话）。阿里巴巴称，自今年2月将“Wan”模型系列开源以来，这些模型在“Hugging Face”平台和中国一个名为“魔搭社区（ModelScope）”的类似平台上的下载量已超过540万次。

纽约大学法学院兼职教授温斯顿·马（Winston Ma）表示：“电影中的人工智能时代已经结束，我们已进入人工智能作为电影人的时代。” 他指出，中国 14 亿人口为本土企业提供了 “海量” 的观影数据可供研究利用。

“就像TikTok在移动互联网时代凭借短视频席卷全球市场一样，中国人工智能公司很可能在视觉数字娱乐领域引领生成式人工智能革命。”温斯顿·马说，他是《数字战争：中国科技力量如何塑造人工智能、区块链和网络空间的未来》一书的作者。

*化身和游戏*

中国企业也在开发人工智能工具，而不仅仅是制作视频。

在过去的一周，百度宣布其最新的人工智能数字人类技术——在6月份超过6小时的互动直播环节中，该技术推动了765万美元的销售额——将于10月份发布，用于更广泛的行业应用。

在3D可视化方面，腾讯发布了混元世界模型，用于创建场景的数字全景图像，该模型由文本和视觉提示生成。视觉效果使用“网格”文件格式，玩家开发者可以使用它来编辑图像的特定部分。

Niko Partners研究与洞察总监丹尼尔·艾哈迈德（Daniel Ahmad）表示：“除了支持腾讯的内部开发团队，该平台还展示了腾讯标准化高保真游戏资产生成并扩大其在中国游戏开发领域影响力的雄心。”

Niko发现，中国超过一半的游戏开发工作室已经使用人工智能来生成内容，减少开发时间和成本。

但游戏开发反映了大规模使用人工智能生成视频和图像的更广泛挑战。

艾哈迈德说：“虽然人们对AI的兴趣很高，但我们已经看到一些游戏对这项技术的执行很差。”

TikTok风靡全球 现在中国公司正在利用人工智能进一步发展视频