印度AI视频生成成本降至1/20，还能准确画纱丽和排灯节

📅 2026 年 6 月 12 日 📖 约 3 分钟 TechCrunch AI开源商业

印度是个视频优先的市场，但现有AI视频模型对印度人口规模来说太贵。Peak XV的董事总经理Rajan Anandan说，成本是印度采用AI的最大门槛。

班加罗尔初创公司Avataar AI刚发布了一款视频模型Varya，试图同时解决成本和文化适配两个问题。

Varya基于阿里巴巴的开源模型Wan 2.2，通过蒸馏技术压缩优化。生成一段视频只需4个推理步骤，而Wan 2.2需要50步。在NVIDIA H200 GPU上，生成一段5秒720p视频，Varya用时45秒，Wan 2.2需要1230秒——相差27倍。

速度提升直接压低了价格。Avataar计划对托管服务按秒收费，每秒视频定价0.48印度卢比（约0.005美元）。相比之下，Veo、Kling、Luma、Runway等竞品通常每秒收费0.10美元或更高——价差约20倍。

文化适配是另一个卖点。该公司用精选数据训练模型，使其能识别印度食物的样式、纱丽和库尔塔等传统服装、本地建筑风格以及排灯节等节日。生成的视频不再是千篇一律的西方风格画面。

Varya将以开放权重模型形式发布在印度政府的AI Kosh门户上，同时公开训练数据。开发者可以自行托管或修改模型，无需依赖云服务。Avataar也计划向企业客户提供Varya，并愿意与Higgsfield、Adobe Firefly等视频工具合作。现在任何人都可以通过文本提示或参考图像在Avataar网站上免费试用。

Avataar是印度政府“India AI Mission”选中的12家初创公司之一。该计划投入约12亿美元补贴GPU算力，入选公司需公开模型。印度IT部长Ashwini Vaishnaw表示，印度目标到2028年吸引2000亿美元AI投资，并将在六个月内把GPU容量翻倍以上。

印度AI模型开发速度整体慢于美国、欧洲和中国，仅少数初创公司发布模型，且多为大语言模型或语音模型。行业资深人士认为，印度不应在基础模型上竞争，而应专注应用和开发者生态系统。Varya的路径——利用开源模型蒸馏，快速推出低成本本地化产品——正是这一思路的体现。

Varya如何控制质量仍不透明。蒸馏必然带来能力损失，它生成的视频在逼真度和连贯性上能否接近昂贵模型，目前没有公开对比。开放权重也可能带来滥用风险，比如生成虚假信息或不当内容。另外，训练数据中的“文化准确性”如何落地，仍需更详细的说明。

成本下降和文化适配，正在把AI视频生成从奢侈品变成工具。印度这个视频优先的市场，或许会成为第一个验证这一逻辑的地方。

阅读原文

📚 相关主题开源商业

📬 订阅 AI Pulse