视频拖进桌面应用,自动转文字生成摘要,全在本地完成
你导入一个视频链接或本地文件,OpenBrief 会用 yt-dlp 下载视频,再用本地的 Whisper、Parakeet 或 Qwen3-ASR 做语音转文字。转录完成后,它生成一篇带时间戳的 Markdown 风格摘要。你可以在摘要或完整转录上直接提问,就像跟那期播客或课程对话。
摘要还能通过文本转语音朗读出来,支持 Supertonic 3 和 Qwen3-TTS 两种模型。大语言模型方面,你可以选 OpenAI GPT、Anthropic Claude、Google Gemini 或 OpenRouter DeepSeek——本地模型(Gemma 4)还在路上。
开发环境需要 Node.js ^22.21.0、pnpm 11.0.9、Rust 和 Cargo,以及 Tauri v2 的平台依赖。项目采用 AGPL v3.0 许可证,仓库里还包含了 Next.js 网页应用、TanStack Start 和 Expo 的移动应用壳,以及 Worker 入口点——不过目前主力还是桌面端。
路线图上还有一些没落地的功能:视频帧和片段的语义搜索、语音克隆、通过网页或移动端分享摘要、支持 PDF 和 HTML 文档、导出闪卡。这些说明开发者清楚现在的局限,也给了人继续关注的理由。