AI Pulse

AI客服表现可像网站分析一样量化,无需翻日志

很多公司用AI客服回答用户问题,但想判断它好不好,只能等投诉或者工程师一条条翻日志。这很被动,还费资源——扫一遍日志并不能直接告诉你AI准不准、有没有卡住。等发现问题时,流失率已经上去了。

Voker就是冲着这个局面来的。它是一个给AI Agent用的分析平台,产品经理、分析师、业务团队都能自助查看对话数据,不用再提交工单等工程师。

核心功能分三层:性能智能、意图识别、业务影响。

性能智能负责跟踪AI说了什么,检测知识缺口和异常,还能看趋势变化。Voker自动从对话里把用户意图分类出来,识别用户没得到想要东西时发出的纠正信号,再判断Agent到底有没有帮用户解决问题。这些指标能在用户跑路之前就发现摩擦点。

更关键的是,Voker试着把Agent的表现和业务结果连上。把对话数据和你已有的用户数据关联起来,产品团队就能尝试量化AI投入和转化、留存或者收入的关系了。虽然Voker没说哪些业务指标开箱即用,但方向摆在那。

集成方面,Voker支持OpenAI、Anthropic、Gemini这些主流模型,也兼容任何LLM框架。配了轻量级的Python和TypeScript SDK,两行代码就装好。数据完全归你,还能自托管。这些设计能让企业少犹豫。

Voker还有个特点:生态友好。它能跟Langfuse、Langsmith、PostHog这些现有工具一起干活,而不是取代它们。这也说明它更偏业务分析层,而不是调试或者日志那一层。

定价分三档:免费版每月2000事件(大约133次对话,平均每场对话15个事件),保留30天。Starter版80美元/月,能处理2万事件,保留90天。Agent First版400美元/月,支持200万事件,保留1年。不同规模的团队都能找到合适档位。

目标客户是每月对话超过1000次的团队,特别是那些需要复杂多轮对话和跨职能协作的产品团队。True Classic的CEO Ben Yahalom、Dutch的CTO Carlos Moreno这些人已经给出了正面评价。

这是AI Agent生态里一个正在被填上的缺口。过去衡量AI表现没有标准工具,现在这个方向开始成型了。

📎 阅读原文 · voker.ai

📬 订阅 AI Pulse

每天两次更新,不错过重要信号

▲ 回到顶部