返回首页
Qwen3.6
找到 3 篇关于此标签的文章
Qwen3.6NVIDIA
RTX 5000 48G 显卡让 Qwen3.6 满血跑——本地高精度 AI 有了甜点配置
一张 48G 显存的 RTX 5000 显卡,让 Qwen3.6 27B 模型在不严重压缩下实现 20 万 token 长文本与 80 TPS 生成速度。这意味着花约 5 万人民币即可本地部署不降智的 AI 助手,避开云端隐私风险与低配压缩导致的错误累积。
May 51 分钟
UnslothQwen3.6
Qwen3.6 GGUF Benchmarks
Un sloth claims top KLD-vs-disk-space performance for Qwen3.6-35B-A3B quants in 21 of 22 pareto frontier comparisons.
Apr 173 分钟
Qwen3.6LM Studio
PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.
Qwen3. 6 引入 preserve_thinking 参数,可在多轮对话中保留推理上 下文,修复 KV cache 失效问题,对 Agent 场景影响显著。
Apr 161 分钟