返回首页
大模型
找到 7 篇关于此标签的文章
minGPTAndrej Karpathy
有人用《西游记》训练出百万参数GPT — 理解大模型黑盒正成为新刚需
有开发者用《西游记》做语料,在个人GPU上训练出百万参数的小型中文GPT。这不仅是极客玩法,更反映出产业界对打破大模型黑盒、掌握底层原理的迫切需求。
May 51 分钟
Transformer注意力机制
读懂 Transformer 注意力机制——大模型能长记性全靠这套 2017 年的老引擎
注意力机制是大模型底层的关键原理,通过给重要信息分配高权重解决了AI健忘问题。搞懂它不是为了写代码,而是看懂大模型长文本的能力边界和背后的算力账单。
May 31 分钟
大模型Agent
拆解大模型血缘图谱:从LLM到Agent,核心都是在给上下文打补丁
技术圈天天造词,从RAG到MCP让人眼花。本文梳理了大模型核心概念的演进逻辑:LLM只会文字接龙,后续所有技术都是在给它补课。看懂这条线,就不会被新名词忽悠。
May 21 分钟
Anthropic军事AI
Anthropic’s Mythos: What It Is and What It Is Capable of
美 军已将Anthropic的Mythos模型用于伊朗战争打击决策,AI 军事化拐点正在重塑全球科技供 应链与合规风险格局,传统制 造业出口商必须重新评估技术合作边 界。
Apr 171 分钟
AI推理算力成本
潜在空间推理:AI算力成本即将再次断崖式下跌
AI推理成本或将再降一个数量级,依赖高价大模型API的企业需重新评估其AI采购策略与竞争护城河。
Apr 121 分钟
智能座舱汽车行业
智能座舱同质化危机:大模型上车重塑200款车型竞争格局
200多款车型座舱界面相似度超95%,大模型上车正在打破这一僵局——谁先建立差异化人机体验,谁就能在价格战之外开辟新战场。
Apr 121 分钟
本地部署推理加速
本地部署122B大模型跑出198字/秒:算力租赁商的末日倒计时
两张消费级GPU在本地跑出企业级推理速度,按字收费的云AI算力租赁模式正面临颠覆——老板该续约还是自建?
Apr 101 分钟