面壁智能开源多语言语音模型VoxCPM2 — 高质量声音克隆不再是闭源专属
面壁智能这周放出 VoxCPM2:一个 20 亿参数、支持 30 种语言的开源 TTS(文本转语音)模型,这意味着高质量的声音克隆门槛正被大幅拉低。
相关推荐
同分类:ai_tools
WhisperOpenAI
16GB 显存已够本地跑 Whisper,大模型语音转写开始从云端回到个人电脑
实测显示,RTX 5060 Ti 16GB 可在本地运行 OpenAI 的 Whisper 语音识别模型,1 小时中文音频约 10-12 分钟完成转写。值得关心的是,语音转写这类成熟 AI 能力,正在从按次付费的云服务,回到可控、便宜、重隐私的个人电脑。
6月4日·juejin.cn
VulpinePython
一位开发者把 Python 改写给模型看,AI 编程开始补“输入层”短板
一位开发者用约 1.3 万个 Python 文件测试,把面向人类阅读的代码编译成更适合大模型处理的表示形式,令输入 token 降低约 14%,且 99.8% 能无损还原。值得关心的是,AI 编程的瓶颈可能不只在模型能力,也在模型“读代码”的方式。
6月3日·www.reddit.com
B站AI Agent
2.8万元摸索出一套AI编程法,真正稀缺的开始不是代码而是文档
一位独立游戏开发者用约2.8万元试出一套 AI 编程流程,核心结论不是“AI 会写代码”,而是需求、文档和人工审查变得更重要。这值得关心,因为它提示我们:AI 进入工作流后,管理复杂任务的方式正在先变。
6月2日·juejin.cn
verizoncustomer-service
Verizon 公开重估客服成本
Verizon CEO 公开表示 AI 可替代“大比例”客服岗位,这不是单一企业裁员口径,而是大规模服务业开始把 LLM 从实验预算切到 core opex。真正被重估的不是客服人数,而是每次客户交互的 token 成本、升级路径与人机协同边界。
6月4日·www.bloomberg.com
broadcomai-chip
博通跌的不是15%,是预期
博通盘前跌超15%不是因为 AI 芯片生意差,而是供给侧叙事第一次被公开 guidance 约束:当市场把 AI infra 当作无限需求代理,低于预期本身就会重定价容量、客户集中度与估值倍数。
6月4日·36kr.com
EndavaOpenAI
Endava 把软件交付改成 AI 代理协作流,外包行业开始从拼人力转向拼流程
Endava 正把 ChatGPT Enterprise、Codex 和 AI 代理嵌入软件交付流程。值得关心的不只是提效,而是软件外包行业的竞争逻辑开始变化:过去比的是人天和成本,现在更可能比谁能把需求、开发、测试和知识沉淀做成可复制流程。
6月4日·openai.com