印度AI视频生成成本降至1/20,还能准确画纱丽和排灯节
印度是个视频优先的市场,但现有AI视频模型对印度人口规模来说太贵。Peak XV的董事总经理Rajan Anandan说,成本是印度采用AI的最大门槛。
班加罗尔初创公司Avataar AI刚发布了一款视频模型Varya,试图同时解决成本和文化适配两个问题。
Varya基于阿里巴巴的开源模型Wan 2.2,通过蒸馏技术压缩优化。生成一段视频只需4个推理步骤,而Wan 2.2需要50步。在NVIDIA H200 GPU上,生成一段5秒720p视频,Varya用时45秒,Wan 2.2需要1230秒——相差27倍。
速度提升直接压低了价格。Avataar计划对托管服务按秒收费,每秒视频定价0.48印度卢比(约0.005美元)。相比之下,Veo、Kling、Luma、Runway等竞品通常每秒收费0.10美元或更高——价差约20倍。
文化适配是另一个卖点。该公司用精选数据训练模型,使其能识别印度食物的样式、纱丽和库尔塔等传统服装、本地建筑风格以及排灯节等节日。生成的视频不再是千篇一律的西方风格画面。
Varya将以开放权重模型形式发布在印度政府的AI Kosh门户上,同时公开训练数据。开发者可以自行托管或修改模型,无需依赖云服务。Avataar也计划向企业客户提供Varya,并愿意与Higgsfield、Adobe Firefly等视频工具合作。现在任何人都可以通过文本提示或参考图像在Avataar网站上免费试用。
Avataar是印度政府“India AI Mission”选中的12家初创公司之一。该计划投入约12亿美元补贴GPU算力,入选公司需公开模型。印度IT部长Ashwini Vaishnaw表示,印度目标到2028年吸引2000亿美元AI投资,并将在六个月内把GPU容量翻倍以上。
印度AI模型开发速度整体慢于美国、欧洲和中国,仅少数初创公司发布模型,且多为大语言模型或语音模型。行业资深人士认为,印度不应在基础模型上竞争,而应专注应用和开发者生态系统。Varya的路径——利用开源模型蒸馏,快速推出低成本本地化产品——正是这一思路的体现。
Varya如何控制质量仍不透明。蒸馏必然带来能力损失,它生成的视频在逼真度和连贯性上能否接近昂贵模型,目前没有公开对比。开放权重也可能带来滥用风险,比如生成虚假信息或不当内容。另外,训练数据中的“文化准确性”如何落地,仍需更详细的说明。
成本下降和文化适配,正在把AI视频生成从奢侈品变成工具。印度这个视频优先的市场,或许会成为第一个验证这一逻辑的地方。