视频模型赛道“热闹”起来了,但变现仍不容易...
近一个月,多款视频模型新品发布,包括生数科技视频模型Vidu更新至可一键生成32秒视频,支持音视频合成与4D生成;MiniMax发布海螺Hailuo-02,支持最高1080P、最长10秒的超清视频端到端生成;百度(9888.HK)发布首个图生视频大模型MuseSteamer,面向包括广告商在内的专业视频内容创作者。
但在过去几年,这一赛道并不被市场看好。
对比AI领域目前正被资本追捧的Agent(智能体),视频模型热度并不算太高。瑞银(UBS)研报认为,视频模型领域的竞争不会像大语言模型领域的竞争那样激烈,主要是受视频模型训练所需的视频语料内容所限。但同时,目前市面上由大厂与明星创业公司组成的战队,正在基础模型效率提高的背景下,加快产品更新与商业化落地。
视频模型“热起来了”,但变现不容易
近一个月的视频模型产品更新之前,Sora的热度已带动一批新品面世。包括2024年上半年的爱诗科技PixVerse、Runway Gen-3、Luma Dream Machine,下半年的生数科技Vidu、智谱清影、字节跳动PixelDance、MiniMax海螺等。
一方面,视频模型你追我赶。据AGI-Eval(上海交通大学、同济大学等高校和机构合作发布的大模型评测社区),2024年12月,PixVerse-V3、可灵1.5、Video-01的得分(评测维度包括视频-文本一致性、视频质量、运动质量等)超越Sora。
但同时,受限于技术成熟度、商业化、成本高等因素,视频模型的创业热度并不及AI应用层,主要由大型互联网/科技企业组成,由爱诗科技、生数科技、Pika、Runway、MiniMax等明星创业公司补充。
此前,MiniMax创始人闫俊杰表示,视频类工作复杂度比文本更难,上下文文本很长,一个5秒的视频就有几M(兆字节,MB)大小,但文本领域,5秒看100个字的大小可能都不到1K(千字节,KB),这是几千倍的存储差距。该差距带来的挑战便是如果通过基本文本构建的底层基础设施来处理、清洗、标注数据。另外,闫俊杰称,视频开源内容没那么多,需要付出的耐心更大。
首个被称为“中国版Sora”的生数科技也在今年进行了更新,此前轮次中,蚂蚁集团、BV百度风投、启明创投等机构押注生数。对于投资人对视频模型的判断,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军对记者表示,早期孵化看团队质量,中后期看团队技术与商业化能力。
一位一级市场关注AI领域的投资人对记者表示,近期一家刚披露千万月活用户规模的视频模型平台,尝试向一级市场讲述做视频模型领域TikTok的“故事”,但投资人暂未买账,“成本压力与商业变现之间的鸿沟太大了,”该投资人称。
曾参与投资Perpleixty 、Character.ai、Mistral、Harvy以及Pika等AI 初创公司的硅谷Solo VC 投资人Elad Gil(埃拉德・吉尔)此前表示,现今模型类型琳琅满目,但从资金角度来看,大部分投资可能会流向模型公司,因为它们资金需求更大。但在数量上,行业将看到更多应用程序开发公司,而非基础模型公司。
探索收费模式
具体落地方式上,目前大模型收费模式主要包括API、订阅、广告、定制化四种。从AI产品商业化程度来看,B端变现模式更加清晰,C端在国内市场多以免费为主,海外市场以付费模式为主。
视频模型也主要分为To C端与To B端两种服务模式,前者主要提供付费订阅服务,如快手可灵、字节即梦、智象未来(HiDream.ai)等,通过免费版、标准版、高级版、尊享版等不同等级订阅服务收费,价格每月数元到数百元不等。后者主要通过API接口和解决方案服务形式收费,如快手可灵、生数科技、爱诗科技等,服务领域涵盖影视、互联网、营销广告等,每月收费数十元至数万元不等。
6月6日,快手披露可灵AI在正式上线的第十个月(即今年三月)突破一亿美元ARR(年化收入运行率),月度付费金额在今年四月和五月连续突破一亿元人民币。除了可灵AI,其他视频模型厂商暂未披露明确的营收数据,头部平台以数千万美元的ARR规模为主。以可灵AI为例,据高盛研报,2P(专业内容创作者)/2C订阅收入占可灵AI总收入的70%,2B API调用占30%。
生数产品方面,朱军表示,目前主要有SaaS和MaaS两种形态,前者数千万C端用户,主要是专业和半专业创作者做内容。B端产品目前已经落地于广告、影视、文旅等场景。
MiniMax视频模型商业化也分为B端与C端。前者通过提供API接口服务,将视频生成能力输出给企业客户,支持多种应用场景,如影视制作、广告创意、教育内容生成等。后者支持用户通过简单指令生成高质量视频,平台提供会员积分制在内的多种付费方案。今年6月下旬,MiniMax官方披露,从去年8月底发布海螺视频至今,已帮助创作者生成超过3.7亿个视频。
据研究机构Fortune Business Insights报告显示,2024年全球AI视频生成器市场规模达6.148亿美元,预计到2032年将增长至25.629亿美元,2025年至2032年间的年均复合增长率达20.0%,而大语言模型的预估增长率约35.92%。
在可预见的增速范围内,朱军认为今年视频大模型商业化就会加快,市场对视频类消费与需求非常广阔,这也是视频赛道与文字赛道不一样的地方。目前行业最头部视频大模型平台都有各自的特色与商业化路径,没有走到类似大语言模型那样“卷”的状态,暂时也不会出现一家独大的局面。

【广告】全网项目交流群
扫码进QQ群,获取最新项目资讯
文档于: 2025-07-05 16:17 修改
标签:
评论列表
视频模型赛道“热闹”起来了,但变现仍不容易...
近一个月,多款视频模型新品发布,包括生数科技视频模型Vidu更新至可一键生成32秒视频,支持音视频合成与4D生成;MiniMax发布海螺Hailuo-02,支持最高1080P、最长10秒的超清视频端到端生成;百度(...