Content generation failed
Qwen 3.6 35B Runs "Browser OS" Locally — Open- Source Models Are Closing the Gap
相关推荐
基于 #Qwen 推荐
QwenEAGLE3
Qwen 也开始适配 EAGLE3:本地大模型提速仍是小步快跑,不是代际跃迁
Reddit 上一则开发进展显示,Qwen 正在尝试适配 EAGLE3(用于提升大模型生成速度的方法)。这不是产品发布,但值得关心:本地模型竞争正从“谁更聪明”转向“谁跑得更快、更省资源”。
6月14日·www.reddit.com
HereticHeretic Grimoire
9KB 备份一个大模型版本,Heretic 想把模型下架风险变成可重建问题
Heretic 发布 Grimoire 机制,把模型的“可复现信息”压成约 9KB 文本文件保存到本地。它不是把大模型真的缩小,而是把模型下架、平台封禁的风险,转成日后可重建的问题。这值得关心,因为模型分发正从“托管在哪”转向“能否被复现”。
6月14日·www.reddit.com
DeepSeekDeepSeek v4 Pro
1.6 万亿参数没换来头部成绩,DeepSeek v4 Pro 的看点已不只在模型本身
DeepSeek v4 Pro 以 1.6 万亿参数进入开源大模型第一梯队,但讨论焦点并不在“是否最强”,而在“为何这么大却只跑出中上成绩”。这件事值得关心,因为大模型竞争正从参数和榜单,转向推理成本、硬件适配与商业可用性。
6月13日·www.reddit.com
GLM-5.2MIT
GLM-5.2 下周开源且可商用,中国大模型开始把牌打到生态位
r/LocalLLaMA 上流出的信息只有一句:GLM-5.2 将在下周发布,开放权重并采用 MIT 许可。消息虽短,但判断并不难:这不是一次普通发版,而是中国大模型公司把竞争重点从“谁更强”转向“谁更容易被用起来”。
6月13日·www.reddit.com
Hugging FaceLocalLLaMA
开发者开始讨论模型“种子站”——开源大模型分发正暴露单点风险
一则 Reddit 讨论把问题挑明了:大量开源模型仍集中托管在 Hugging Face,这让“开源”在分发层面并不真正分散。值得关心的不是论坛情绪,而是模型供应链开始从“能不能做出来”转向“能不能稳定拿到”。
6月13日·www.reddit.com
MiniMaxMiniMax M3
MiniMax M3 因兼容性退回密集注意力,开源热度高但本地部署还不成熟
MiniMax M3 的社区版本近期被发现因暂不支持稀疏注意力而“退回密集注意力”,这意味着推理时计算成本明显上升。值得关心的是,大模型参数做得更大不等于普通人就能更方便地用上,部署生态反而成了下一道门槛。
6月13日·www.reddit.com