AI Pulse

两位创始人离开高盛和Meta,为被忽视的市场构建语音AI

两位创始人离开高盛和Meta,为被忽视的市场构建语音AI

这两位创始人离开高盛和Meta,为被忽视的市场构建语音AI

客户支持和服务是目前语音AI最热门的领域之一。但构建一个听起来像真人且响应无明显延迟的产品,在某些市场比其他市场要困难得多——而大多数主要玩家在设计之初并未考虑非洲和中东。

去年成立的初创公司AethexAI旨在弥合这一差距,已获得300万美元的种子前轮融资,由4DX Ventures领投,Enza Capital、Dorm Room Fund、Mojo Ventures和Stanford GSB 26 Fund参与投资。个人投资者包括斯坦福大学教师、电信高管以及来自Anthropic的AI研究人员。

该公司没有使用Vapi和LiveKit等现有编排工具,而是从头构建了自己的小模型和编排层,以处理目标市场所说的英语、法语和阿拉伯语的本地化方言——这一决策正如我们将要看到的,是由在该地区运营的特殊需求驱动的。

该公司还推出了面向企业的平台,供企业试用其技术并注册服务,同时为开发人员提供API和SDK,以便他们试用其模型。

这家初创公司由Mariama Diallo和Ayooluwa Odemuyiwa创立。CEO Diallo曾在高盛工作,后来加入YC支持的ModelML担任产品和增长职位。CTO Odemuyiwa毕业于加州理工学院,在Meta工作过,并就读于斯坦福商学院,之后联合创立了这家公司。两人希望为新兴市场构建产品,并开始寻找机会。

全球各地的企业都在竞相采用AI工具来自动化部分运营。但这并不总是奏效。创始人发现,在埃及,一个呼叫中心自动化了相当一部分通话,但由于效果不佳而回退了系统。非洲的几个支持中心告诉他们,寻找和雇用工程师以合适成本自动化通话是一个长期的难题。

“我们在这个地区的自动化通话中看到的延迟和抖动非常严重。如果我们采用编排方式,可能不得不使用托管在区域外的大型模型,从而导致更高的延迟。我们意识到,要让这个方案奏效,我们必须使用非常小的模型,并在每一步削减延迟,”Odemuyiwa就公司自建模型和编排层的决定告诉TechCrunch。

部署最新模型的AI实验室通常花费数百万美元进行训练和获取数据。AethexAI为这两个问题找到了解决方案。它没有追求尽可能大的模型,而是决定小模型足以解决延迟问题同时保持准确性,并开发了自己的Kora系列,参数范围从3亿到17亿。这只是LLM规模的零头,而这正是关键所在。

为了训练这些模型,这家初创公司使用了来自呼叫中心合作伙伴的匿名录音。它还将硬盘驱动器运送到非洲各地的广播电台,以收集更多音频数据。为了控制成本,它建立了一个由大学生组成的贡献者网络,用于注释数据和发音本地名字。结果,这家初创公司表示,它现在每天处理超过17000次通话。

在业务方面,公司谨慎地为初次接触语音AI的客户提供引导流程,提供现场演示和研讨会,帮助他们确定自动化的最佳用例。

“我们总是告诉客户,我们不能现在为所有人提供一切。我们规模很小。当我们开始与一家公司交谈时,我们要求他们挑选一个对他们最重要的用例来开始,”Diallo说。

这家初创公司愿意与所有行业合作,但目前其大部分用例涉及债务催收、客户激活或KYC(了解你的客户验证,银行和电信公司使用的标准身份检查流程)的通话。公司正在按合同招聘前置部署工程师,以服务本地市场,并与电信提供商建立渠道合作伙伴关系,以处理语音AI通话的电话通信。该公司表示,即插即用的解决方案在这里根本行不通。

4DX Ventures的联合创始人兼管理合伙人Walter Baddoo认为,非洲和中东市场与大多数语音AI公司服务构建所依据的市场根本不同。

“非洲和中东的企业处理的通话量约为西方同行的三倍,因为语音仍然是客户互动的主要渠道,”他说。“现有系统是为西方市场构建的,其特点是高端GPU基础设施、标准英语和欧洲语音环境,以及美国和欧洲常见的企业工作流程。当企业需要处理方言、语码转换和非正式语音模式,并且需要在其现有电话基础设施和实际价格点内运行的系统时,这就造成了真正的差距。”

换句话说,虽然ElevenLabs、Deepgram、Sierra和Cognigy等公司正在快速全球扩张,但它们最初构建的市场与正在进入的市场并不总是一回事。像AethexAI这样的初创公司押注,这些差距——专门针对本地方言的模型、本地合作伙伴关系、为区域构建的基础设施——代表着巨头既没有动机也没有架构来填补的市场空白。

阅读原文

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部