返回首页

大模型

找到 7 篇关于此标签的文章

minGPTAndrej Karpathy

有人用《西游记》训练出百万参数GPT — 理解大模型黑盒正成为新刚需

有开发者用《西游记》做语料,在个人GPU上训练出百万参数的小型中文GPT。这不仅是极客玩法,更反映出产业界对打破大模型黑盒、掌握底层原理的迫切需求。

May 51 分钟
Transformer注意力机制

读懂 Transformer 注意力机制——大模型能长记性全靠这套 2017 年的老引擎

注意力机制是大模型底层的关键原理,通过给重要信息分配高权重解决了AI健忘问题。搞懂它不是为了写代码,而是看懂大模型长文本的能力边界和背后的算力账单。

May 31 分钟
大模型Agent

拆解大模型血缘图谱:从LLM到Agent,核心都是在给上下文打补丁

技术圈天天造词,从RAG到MCP让人眼花。本文梳理了大模型核心概念的演进逻辑:LLM只会文字接龙,后续所有技术都是在给它补课。看懂这条线,就不会被新名词忽悠。

May 21 分钟
Anthropic军事AI

Anthropic’s Mythos: What It Is and What It Is Capable of

美 军已将Anthropic的Mythos模型用于伊朗战争打击决策,AI 军事化拐点正在重塑全球科技供 应链与合规风险格局,传统制 造业出口商必须重新评估技术合作边 界。

Apr 171 分钟
AI推理算力成本

潜在空间推理:AI算力成本即将再次断崖式下跌

AI推理成本或将再降一个数量级,依赖高价大模型API的企业需重新评估其AI采购策略与竞争护城河。

Apr 121 分钟
智能座舱汽车行业

智能座舱同质化危机:大模型上车重塑200款车型竞争格局

200多款车型座舱界面相似度超95%,大模型上车正在打破这一僵局——谁先建立差异化人机体验,谁就能在价格战之外开辟新战场。

Apr 121 分钟
本地部署推理加速

本地部署122B大模型跑出198字/秒:算力租赁商的末日倒计时

两张消费级GPU在本地跑出企业级推理速度,按字收费的云AI算力租赁模式正面临颠覆——老板该续约还是自建?

Apr 101 分钟