返回首页

NVIDIA

找到 12 篇关于此标签的文章

Hugging FaceNVIDIA

Hugging Face 披露百大热门硬件配置 — 本地 AI 跑起来,还是靠消费级显卡

Hugging Face 首次公开平台最热门的 100 个硬件配置,揭示本地 AI 部署的真实硬件偏好。消费级显卡仍是主流,这比厂商参数表更能说明 AI 落地的真实门槛在哪里。

5d ago1 分钟
NVIDIAExtreme Co-Design

NVIDIA 提出 Agent 系统极限协同设计 — 基础设施层要重新来过

NVIDIA 本周发文提出「极限协同设计」,核心判断是 Agent 系统复杂性已超出传统架构的承载能力,从芯片到软件必须从头协同优化。这不只是技术主张,更是基础设施话语权的提前卡位。

6d ago1 分钟
NVIDIA智能座舱

NVIDIA 把 AI Agent 装进汽车 — 智能座舱从听指令走向会思考

NVIDIA 发布车载 AI Agent 全栈方案,用"云到车"架构把大模型能力装进汽车。车企智能座舱竞赛从比语音识别准确率,升级为比谁能让孩子主动思考和规划——但成本和安全认证仍是落地障碍。

6d ago1 分钟
Qwen3.6NVIDIA

RTX 5000 48G 显卡让 Qwen3.6 满血跑——本地高精度 AI 有了甜点配置

一张 48G 显存的 RTX 5000 显卡,让 Qwen3.6 27B 模型在不严重压缩下实现 20 万 token 长文本与 80 TPS 生成速度。这意味着花约 5 万人民币即可本地部署不降智的 AI 助手,避开云端隐私风险与低配压缩导致的错误累积。

May 51 分钟
APEXQwen

APEX量化新增25款模型:百亿参数AI塞进家用显卡,算力门槛正被抹平

开源项目APEX推出针对MoE模型的新量化方案,一个月新增25款以上压缩模型,并推出极低体积的I-Nano层级。这让原本需企业级算力的百亿参数AI,现在单张家用显卡即可运行,大幅降低本地部署成本。

May 51 分钟
YCGPU

GPU 跑 Agent 利用率仅三四成 — 专用推理芯片的窗口正在打开

YC 指出当前 GPU 跑 Agent 工作流利用率仅 30-40%,根因是芯片架构与 Agent 循环分支模式错配。专用推理芯片的创业机会由此而生,但生态锁定与需求演化仍是硬风险。

May 51 分钟
NVIDIAcuOpt

英伟达用 AI Agent 优化供应链 — 大模型开始抢运筹学专家的饭碗

英伟达推出 cuOpt Agent 技能,用大模型解决传统运筹学建模慢、难调整的痛点。这标志着 AI Agent 正式切入供应链决策核心,从聊天走向干苦活,值得传统管理者关注。

May 41 分钟
NVIDIARTX A5000 Pro

NVIDIA 48GB 显存专业卡 A5000 Pro 上架 — 本地跑大模型不用再切双卡了

NVIDIA RTX A5000 Pro Blackwell 48GB 显卡售价约 4500 美元,单卡即可运行 Qwen 27B 量化模型。对想本地部署 AI 的中小企业,这比双卡方案更简洁,但性价比仍需仔细算账。

May 41 分钟
NVIDIALyra2

英伟达新模型将单张照片变无限3D世界—生成式AI开始接管虚拟场景基建

英伟达发布 Lyra2 模型,能从单张照片生成连续且不崩坏的无缝 3D 世界。这标志着生成式 AI 从“画一张图”进化到“造一个空间”,游戏和影视行业的资产制作流程正面临重写。

May 31 分钟
NVIDIARTX 5080

RTX 5080 跑本地编程模型引热议 — 消费级显卡开始抢云端 AI 的活

r/LocalLLaMA 社区热议 RTX 5080+64GB RAM 跑量化编程模型的最佳方案。开发者认真考虑把 AI 编程助手从云端搬回家,消费级硬件正成为 AI 编程的新基础设施,值得非技术背景的管理者关注。

May 21 分钟
NVIDIAGemma

NVIDIA 自研 4 位量化把 26B 模型塞进消费显卡 — 精度损失不到 1%

NVIDIA 发布 NVFP4 量化版 Gemma-4-26B,压缩至 18.8GB 可在消费显卡运行,6 项基准测试精度损失均不超过 0.7%。4 位量化正从妥协变成优选,但这也是 NVIDIA 生态锁定的一步棋。

May 11 分钟
NVIDIAAITune

NVIDIA 开源 AITune:自动为 PyTorch 模型选择最快推理后端

NVIDIA 开源推理优化工具 AITune,可自动对多个推理后端进行基准测试,并为 PyTorch 模型选出最优配置,显著降低工程团队的手动调优成本。

Apr 121 分钟