你的独立站正在悄悄追踪每位访客 — 这个免费脚本帮你关掉
相关推荐
最新文章
llama.cppllama-server
llama.cpp 把网页界面做成可安装应用,本地大模型离日常使用又近了一步
llama.cpp 已合并 PWA(渐进式网页应用,可像原生 App 一样安装运行)支持。它不是模型能力升级,却直接改善本地大模型的打开、更新和常用体验。值得关心的是,开源 AI 的竞争正在从“能不能跑”转向“能不能长期用”。
6月12日·www.reddit.com
muxichina-gpu
沐曦赴港,不只是融资
沐曦筹划 H 股上市,表面是融资与全球化,实质是中国 GPU 供应链进入资本密集赛段:真正被定价的不是故事,而是量产、客户验证与持续供货能力。
6月12日·36kr.com
Moonshot AIKimi K2.7 Code
Kimi K2.7 Code 把推理开销再降 30%,国产代码 Agent 开始比拼交付效率
Kimi K2.7 Code 在 K2.6 基础上把“思考 token”使用量再降约 30%,同时强化长流程编程任务完成度。值得关心的不只是模型更会写代码,而是国产大模型竞争正从刷榜,转向谁能更便宜、更稳定地完成真实软件工程流程。
6月12日·www.reddit.com
华为openPangu 2.0
华为发布 openPangu 2.0 并宣布开源,国产大模型开始补生态短板
6 月 30 日起,华为将逐步开源 openPangu 2.0 的模型权重、训练与推理代码。比参数规模更值得关心的是,它同时押注昇腾算力与鸿蒙生态,说明国产大模型竞争正从“谁更大”转向“谁能把软硬件和开发者体系真正连起来”。
6月12日·www.reddit.com
EAGLE3llama.cpp
EAGLE3 并入 llama.cpp,开源大模型推理开始更务实地追求提速
EAGLE3 经过半年开发正式并入 llama.cpp,核心意义不是又多了一个术语,而是开源社区在大模型推理提速上走向更务实路线:不只靠更强硬件,而是靠更聪明的生成流程,把本地部署的可用性再往前推一步。
6月12日·www.reddit.com
Claude SonnetLocalLLaMA
两天跑掉 5000 万 token 省下 151 美元,本地模型开始适合重度开发者
一位开发者两天内用了约 5000 万输入 token、49 次编程会话,按 Claude Sonnet 的公开价格计算约值 151 美元。这件事值得关心,不是因为“本地部署”突然更强了,而是高频、长上下文场景已经开始逼近成本分界点。
6月12日·www.reddit.com