三张显卡跑Agent集群 — 本地AI的瓶颈从显存转向编排
相关推荐
基于 #llama.cpp 推荐
llama.cppllama-server
llama.cpp 把网页界面做成可安装应用,本地大模型离日常使用又近了一步
llama.cpp 已合并 PWA(渐进式网页应用,可像原生 App 一样安装运行)支持。它不是模型能力升级,却直接改善本地大模型的打开、更新和常用体验。值得关心的是,开源 AI 的竞争正在从“能不能跑”转向“能不能长期用”。
6月12日·www.reddit.com
AWSAWS Context
AWS 推出 Context 服务,把企业数据关系织成图谱,Agent 落地开始拼治理而非模型
AWS 在纽约峰会上发布即将上线的 AWS Context,核心是把分散在数仓、数据库和业务规则里的信息自动整理成可治理的知识图谱,供 Agent 调用。值得关心的是,大模型竞争正从“谁更聪明”转向“谁能接上企业真实数据且可控”。
6月17日·aws.amazon.com
智谱GLM-5.2
智谱把 GLM-5.2 重点押注长流程任务,大模型竞争开始从会答题转向会干活
智谱放出一个明确信号:GLM-5.2 不再主打“答得更像人”,而是强调长流程任务能力,也就是让模型连续完成多步工作。值得关心的是,这意味着国内大模型竞争点,正从参数和榜单,转向真实业务里的执行稳定性。
6月17日·www.reddit.com
AWSAmazon Bedrock
AWS 给 AI Agent 加了“按步骤安检”接口,安全开始从统一拦截走向细粒度治理
AWS 发布 Bedrock Guardrails 新接口,可在 AI Agent(会分步骤调用工具、反复执行任务的系统)运行中按环节做安全检查,并返回分数供企业自定义拦截规则。我们判断,这不是功能增量,而是 Agent 商业化进入“可审计、可运营”阶段的基础设施补课。
6月17日·aws.amazon.com
GLM-5.2WebDev Arena
GLM-5.2冲到网页开发榜第二,但国产模型离真正商用还差一段路
GLM-5.2在面向网页开发能力的公开榜单冲到第二,说明国产大模型在代码生成这条最容易变现的赛道上继续逼近头部。但榜单成绩不等于企业可用,稳定性、集成成本和真实业务流程适配,才是更值得关心的下一关。
6月16日·www.reddit.com
NVIDIABlackwell
英伟达包揽 MLPerf 训练榜第一,算力竞争开始从芯片转向系统能力
MLPerf Training 6.0 中,英伟达在全部测试项目提交成绩,并同时拿下大规模训练速度和单加速器效率第一。值得关心的不是又赢了一次,而是 AI 算力竞争正从单颗芯片参数,转向整套系统与软件协同能力。
6月16日·developer.nvidia.com