GLM-5 开源：从代码到工程， Agentic Engineering 时代最好的开源模型

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 152 days ago, the information mentioned may be changed or developed.

今天，我们上线并开源 GLM-5 。

学界与业界正逐渐形成一种共识，大模型从写代码、写前端，进化到写工程、完成大任务，即从“Vibe Coding”变革为“Agentic Engineering”。

GLM-5 正是这一变革的产物：在 Coding 与 Agent 能力上，取得开源 SOTA 表现，在真实编程场景的使用体感逼近 Claude Opus 4.5 ，擅长复杂系统工程与长程 Agent 任务。

在全球权威的 Artificial Analysis 榜单中，GLM-5 位居全球第四、开源第一。

更大基座，更强智能

GLM-5 全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础：

参数规模扩展：从 355B （激活 32B ）扩展至 744B （激活 40B ），预训练数据从 23T 提升至 28.5T ，更大规模的预训练算力显著提升了模型的通用智能水平。
异步强化学习：构建全新的“Slime”框架，支持更大模型规模及更复杂的强化学习任务，提升强化学习后训练流程效率；提出异步智能体强化学习算法，使模型能够持续从长程交互中学习，充分激发预训练模型的潜力。
稀疏注意力机制：首次集成 DeepSeek Sparse Attention ，在维持长文本效果无损的同时，大幅降低模型部署成本，提升 Token Efficiency 。

Coding 能力：对齐 Claude Opus 4.5

GLM-5 在编程能力上实现了对 Claude Opus 4.5 的对齐，在业内公认的主流基准测试中取得开源模型 SOTA 分数。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型 SOTA 分数，性能超过 Gemini 3 Pro 。

2026 年，大模型需要从“会写”走到“会完成”，尤其是端到端完成大型任务。GLM-5 是一个“系统架构师”，它不仅为开发精美的 Demo 而生，更为稳定交付生产结果而生。

在内部 Claude Code 评估集合中，GLM-5 在前端、后端、长程任务等编程开发任务上显著超越 GLM-4.7 （平均增幅超过 20%），能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务，使用体感逼近 Opus 4.5 。

Agent 能力：SOTA 级长程任务执行

GLM-5 在 Agent 能力上实现开源 SOTA ，在多个评测基准中取得开源第一：在 BrowseComp （联网检索与信息理解）、MCP-Atlas （工具调用和多步骤任务执行）和 τ²-Bench （复杂多工具场景下的规划和执行）均取得最佳表现。

在衡量模型经营能力的 Vending Bench 2 中，GLM-5 获得开源模型第一的表现。Vending Bench 2 要求模型在一年期内经营一个模拟的自动售货机业务，GLM-5 最终账户余额达到 4432 美元，经营表现接近 Claude Opus 4.5 ，展现了出色的长期规划和资源管理能力。

这些能力是 Agentic Engineering 的核心：模型不仅要能写代码、完成工程，还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系，成为真正的 Agentic Ready 基座模型。

国产芯片支持线上推理集群

GLM 系列模型受到全球开发者喜爱，在 GLM Coding Plan 全球爆量后，我们不得不启动限售活动。本次 GLM-5 的上线依托众多国产芯片有力保障了线上服务的稳定和高效。

目前，GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速，GLM-5 在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。

Agentic Engineering 典型场景

点击或在浏览器输入：showcase.z.ai，即可查看所有案例。

开源与使用方式

即日起，GLM-5 在 Hugging Face 与 ModelScope 平台同步开源，模型权重遵循 MIT License 。

GLM-5 已经纳入 Max 用户套餐，Pro 将尽快在 5 天内支持，接下来我们将逐步扩大范围，尽力让更多用户体验并使用 GLM-5 。GLM Coding Plan 支持 Claude Code 、OpenCode 等主流开发工具。

GLM Coding Plan 同步升级 Agentic Engineering 体验：

官方适配 OpenClaw：仅需简单几步即可完成配置，快速开启 Agent 工作流；
Pro / Max 用户限量赠送 AutoGLM-OpenClaw：支持将云端个人 AI 助手接入飞书，实现办公场景的长任务执行；
新增 GLM in Excel 权益：原生适配 Excel 环境的 AI 插件，支持在侧边栏以自然语言交互，深度赋能数据处理与表格工作流（ Beta 期仅 Max 用户可享套餐抵扣）。

93 replies • 2026-02-15 02:57:55 +08:00

shakaraka

Feb 12

试用套餐有不

shakaraka

Feb 12

code plan 的试用 GLM-5 的

Tink

Feb 12 via Android

lite 和 pro 都不支持

donggua997

Feb 12

比参数没输过，实际体验没赢过。

enano

Feb 12

开了 lite 像路边一条

whbbxw

Feb 12

你们自己用自己的模型吗？ 4.6 和 5.3 也参与一下测试吧。

donggua997

Feb 12

你真的确定配与 gpt 、gemini 、claude 放一起比吗？？？

mashimaroinfo1

Feb 12

篇幅好长, 能力几何?

opeth

Feb 12

先看看隔壁帖子对你们 coding plan 的背刺的吐槽吧

hugodotlau

Feb 12

来吹半天都没点福利抽奖么？这广告真白看了

zhuangpipi

Feb 12

不涨价还想购入，涨价确实性价比比较低了

qaq13037

Feb 12

跑分嘎嘎猛，实际用起来差很多

iorilu

Feb 12

我一直奇怪, 100 多可以上车正规的 google one 会员, 用 antigravity 不比这个强, 更别说谷歌还有很多其他 ai 服务?

flowerwow0316

Feb 12 via Android

你说是就是了

Muninn

Feb 12

现在这个价格完全没有竞争力了。更何况口碑已经完全坏了，超卖，水军营销，限速，降智，随意修改订阅协议，毫无诚信，吃相难看。

ProphetN

Feb 12

吃相太难看了，国产模型商永久拉黑这家吧。

iden

Feb 12

...评论哪儿来的那么大偏见。刷分不都是闭源模型常见的操作吗？
众所周知开源模型刷分风险更低，也能被吐槽高分低能？

tlerbao

Feb 12

吹你家死牛逼

Plutooo

Feb 12

是蒸馏模型吗

felixcode

PRO

Feb 12

用起来怎么样，能不能和 gpt 和 opus 比，自己心里没数吗？

phrack

Feb 12

虽然不咋样收费还贵

但是开源我就喜欢，等显存便宜了 1TB 我也买得起的时候本地试试

mogutouer

Feb 12

4.5 都废了，你怎么不对比同时代的 opus 4.6 ？

Dream4U

Feb 12

蒸馏对齐

jqknono

Feb 12

从 300B 涨到 700B, 涨价还算合理吧, 重要的是模型效果.

unifly

Feb 12

咋一个个都这么大戾气，不会是跟贴机器人吧，凡是跟老美有竞争的，网上舆论没有不被骂的……嘿嘿

felixcode

PRO

Feb 13

@bridgemindai
BridgeMind 发的测评和榜单，就这还在这腆着脸吹？

kneo

Feb 13 via Android

多个选择总是好的，没必要喷这么狠吧。我在 hackernews 上经常看老外盛赞中国开源模型，说现想跑本地大模型只能靠中国的开源模型。虽然比不上闭源模型，但只要和自己比是在进步，对他们来说就是个好消息。

longxk

Feb 13 via Android

LITE 套餐我明明记得之前写着支持最新模型，结果现在偷偷改成支持历史模型，这种毫无诚信可言的公司的产品也必然是注水严重。

jokcylou

Feb 13 via Android

@kneo v 站站不起来的人可太多了，不会念国产一点点好的，国产往死里挑刺国外往死里舔，老传统了

maolon

Feb 13

@unifly 你自己搜下他们最近干了啥就知道为什么骂了，看样子割韭菜没割到你头上说话就是轻松，啥事都来个什么大国叙事 smh

securityCoding

Feb 13 via Android

@maolon 宏大叙事的基本没脑子🤣，付费用户条款随意改不喷留着过年

maolon

Feb 13

@securityCoding 还真是留着过年 😂，过年前都要给用户添波堵你们智谱是有水平的

8e47e42

Feb 13

@jokcylou Yes this - 我是真的看不懂，但凡人有护照也不至于这样

ckzx

Feb 13

这就是一家骗子公司。。我也上当买了 LITE 。当时也写了支持最新的。

gux928

Feb 13 via iPhone

我也买了 lite 。让子弹飞两天看看。

AlexHsu

Feb 13

不如 minimax2.5

FH0

Feb 13

之前开过你们家的 Max 套餐，GLM 4.7 的速度很慢

EasonYan

Feb 13

Lite 套餐不让用。不过无所谓，4.7 都慢得没法用，就算让用 5 也不想用了。

EeveeRibbon

Feb 13

@unifly #25 GLM4.6 我是真掏钱用过的，还好没买年费，从此以后我不信任 GLM 的任何模型了

MaxwellX

Feb 13

之前买了 lite 的协议是给更新最新版模型的,现在又不给更新了,还经常来这里打广告,败好感啊

secretbytes

Feb 13

怎么感觉有点像某个手机品牌，都是参数如何如何牛逼，跑分如何如何，等你买回去了，就会发现一坨。要是你说它不好，还有人出来说它才多少钱啊，你拿它跟 XXX 比

felixcode

PRO

Feb 13

不好好做产品只知道吹的，不管产品质量只顾吹国产的，非蠢即坏。

LunarEcho24

Feb 13

吹的有点过了

zxjxzj9

Feb 13

@unifly 我看用过 GLM 的就没有不骂的，怎么都是国产 minimax 和 qwen 还有 kimi 好评就很多呢？尤其是 minimax ，人家股价也高说明真金白银看好，只不过没有那么多宣传罢了。

crackidz

Feb 13

@secretbytes

你这样说发烧手机可就急眼了

justdoit123

Feb 13

试用了下，响应真的太慢了啊，这个真的有点不能忍。是不是试用套餐的缘故？

gouLang

Feb 13

2.12 号买的 lite 还增加了周限额, 5 小时限额里跑满, 就是周限额的 20%, 也就是说一周只能跑 25 个小时, 平均每天只能跑满 5 个小时的量, 这能用来工作? 年费还升价了这么多, 太痛了

manwhatcanisay

Feb 13

广告帖为什么不放在“推广" 这又不是隔壁，没有“国产替代”

Feb 13

GLM-5 和 minimax2.5 比较，当然是 GLM-5 胜出，两个都多用过几次就知道

xiangqiankan

Feb 13

GLM5 不错的我已经把我的主力模型从 gemini3pro 切换成了 glm5

hihanley

Feb 13

该骂，超卖，水军营销，限速，降智，随意修改订阅协议，毫无诚信，吃相难看

cat9life

Feb 13

这个帖子我今天在不同地方看到多次了

namonai

Feb 13

@jokcylou 你先出点真金白银买个订阅再看看？不好用就是不好用，和是不是国产的有什么关系？国产是免死金牌？招笑，幼稚

PersueYan

Feb 13

@iorilu 家庭订阅吗？

jimrok

Feb 13

编程这个赛道广告是没有用的，一个程序员只有本科生水平，嘴巴叫的再大声自己厉害，也不会有公司给你一个博士生的薪水。

unifly

Feb 13

@namonai 估计你自己就是国产的吧，哈哈，是不是感到很沮丧？

Nexora

Feb 13

这是来找网暴的吗

wojiugaiming

Feb 13 via Android

我用了，推荐大家使用，真的很好用。使用效果图如下： https://imgur.com/a/S6nS8zk

wojiugaiming

Feb 13 via Android

@wojiugaiming 好像回帖不显示图片，我再补充一下

namonai

Feb 13

@unifly 是的，花了钱买了垃圾。那又如何？总比你这种根本没有回复你、却主动凑上来挨骂的人来得好。连钱都没花、用都没用过，就在这里扯什么老美，说别人是跟帖机器人，来维护你的可怜的不知所云的、沾沾自喜的、到了外网都要规避敏感词的、脆弱的、盲目的自尊心。怎么，不好用你要给我退钱吗？专门贴上来找骂的吗？

miusmile

Feb 13

我严重怀疑，你在骗我的铜币🐶

iorilu

Feb 13

@PersueYan 正规路子就是直接买 google one 会员, 以前包年 99 刀

现在可能涨了

不想花很多钱, 就找咸鱼拼车, 100 左右, 因为一个人可以邀请 5 个人一起用

unifly

Feb 13 via Android

@namonai 你也就这素质了，我安卓开发零基础，用 glm5 很顺利搞出了有自己一直想要功能的 app ，期间编译几乎不报错，我很满意，当然这两天服务器比较拥挤，体验不太好，至于你后面说的，算啦，观念不同，懒得理论…

namonai

Feb 13

@unifly 好好好，零基础小白玩转大模型开发是吧，怪不得怪不得，合理了。

Muninn

Feb 13

该骂就是该骂，竟然还有人打着国产模型的旗号辩护，这跟国产模型有关系吗？你看有这么多人骂 Kimi 和 Minimax 吗？ Kimi 就那么点额度，两下就用完，大家也就吐槽下，不会骂。人家没干什么不诚信的事啊。

unifly

Feb 13

@namonai 自己动手，丰衣足食，开开心心，咋，非程序员就不能用大模型么？你咋戾气这么重呢？

securityCoding

Feb 13 via Android

@maolon 你为啥喷我啊😢

molika

Feb 13 via iPhone

买了 pro 计划。看 tokens 现在缩水了差不多三倍。之前差不多 tokens 显示额度百分之五左右现在百分之 20 。之前我自己高频率用也没到 20% 现在随便就到 30%多了

wojiugaiming

Feb 13 via Android

@unifly 你自己问题，什么都要带上老美

xFrye

Feb 13

@unifly 差不多得了，他自己改了用于协议，搞得老套餐都用不了新模型，这也怪到美国头上？

MartinZBE

Feb 13

用的 4.7Max 套餐差很多呢(将一个 python 项目改为 Rust 项目 10 分钟后就 break 了,人家 Cousor 免费版都能在 3 次提示 vibe 的情况下,半小时内完成任务. 而且那个购买服务的饥饿营销策略很恶心.

unifly

Feb 13

@xFrye 好吧，商业操守的问题之前没经历没调查，咱不评论，从我使用角度看，个人认为 glm5 产品力还是不错的。
@wojiugaiming 是啊，咱不抵制人家，人家各种禁止使绊子，我还想买个完全体的 5090 耍耍呢，奈何人家不愿意啊，如果大家合作愉快，国内算力足够，凭诸位的聪明才智牛马精神，我相信咱的模型能力不会比不过人家，总比动不动被 Claude 封禁强多了？对不

psirnull

Feb 13

minimax m2.5 更快

wojiugaiming

Feb 13 via Android

@unifly 你用国产显卡啊，国产显卡不能用？

mns

Feb 13

自己卖的 coding plan ，lite 和 pro 不给用，有啥脸宣传？

felixcode

PRO

Feb 13

@unifly
商业操守的问题, 是最严重的问题，被你轻飘飘带过。
然后开始怪别人使绊子。
真有你的。

technode

Feb 13

所以 lite 不让用是因为技术太领先了吗？还是运营的脑子坏掉了

unifly

Feb 13

@felixcode 商业操守跟使绊子咋还搅合一块儿了，你跑题了。得，你慢慢反思吧，去跟有道德、有操守的圣贤公司玩儿吧，希望你能多找到几个……

unifly

Feb 13

@wojiugaiming 不是，我说 glm5 挺好的，你很难受么？

jokcylou

Feb 13 via Android

@namonai 你才怕不是来招笑的吧，谁给你的自信说我没买的，我是智谱的早期用户，从最开始的垃圾用起，到 4.5-4.7 现在的 5 。我是不想提国产耐不住 v 站一堆对国产吹毛求疵的啊，看不惯双标而已，你别应激

gotoschool

Feb 13

glm 就是垃圾啊特别垃圾巨垃圾

iamnotcodinggod

Feb 13

没用过 glm 哈，对模型质量没有概念。
但是如果打广告有排行榜的话，那 glm 肯定是当之无愧的第一名。

lithiumii

Feb 13 via Android

你们广告太多了，全平台国内国外到处都是。
虽然模型也不是不能用

namonai

Feb 13

@jokcylou minimax 是国产的吧？ kimi 是国产的吧？ deepseek 是国产的吧？卖 coding plan 的不止 GLM 一家吧？怎么，那么多家卖 coding plan 的供应商，怎么就 GLM 挨骂了？我还是前一阵刚买的 Pro 年费，忍着白天工作时间的龟速，不到半个月，额度也下调了，续费的价格也涨了，权益也被修改了。不该说？说了就是双标？

最新的 GLM-5 模型到底占用多少额度，发布多少天了，官方有明确的数字吗？连 Pro/Max 的额度都是写在 QA 里的，没有明确的文档标注，这个 QA 还是随时在偷偷修改的。看看隔壁家的 minimax ，能用多少条、每个模型占用多少额度，清清楚楚、明明白白，哪个正经的模型厂商会连额度都标不明白？

最起码的额度都模棱两可的，鸡贼得很。还是上市公司。还打算在沪市继续上市。怎么，不能说？说了就是双标？国产这两个字碰到你的玻璃心了？

cabing

Feb 13

很棒。主要是用得起，勉强能用也行。花美刀还是很贵。。

youshangdemajia

Feb 13

不明确说额度很正常吧，Antigravity 和 Codex 都没说具体的数字，反正它们可以随便降低，用户也只能骂街。
现在成本这么高，大如谷歌，不搞小动作也顶不住。

wojiugaiming

Feb 14 via Android

@unifly 哦，glm5 精神股东。有你这种人，本来对 glm5 没感觉，现在嘛，赶紧倒闭的

user1284

Feb 14

已购买 lite 套餐的用户禁止使用,还有脸打广告? 哪怕你限量呢, 这种态度, 几天后到期后我反正不续, 本身就是拿来分配简单任务 agent,核心 agent 还是 claude,gemini 模型, 用哪家对我来说都一样

unifly

Feb 14 via Android

@wojiugaiming 你咋这么幼稚，别回我了，我也不会再回你，拜拜

wwhc

Feb 14

支持开源模型，希望能尽快开源 air 版本

bli22ard

Feb 14

这直接注册不了，验证码提示出错

wojiugaiming

Feb 14 via Android

@unifly 你咋那么幼稚？哪里得出结论我难过？ glm 有如此劣质用户，可见这公司什么样子。另外你也不用回了，再回你就是侮辱全人类

gigishy

Feb 15 via iPhone

我看了标题直接看评论，发现我又防止被骗了几分钟😂

GLM-5 开源：从代码到工程， Agentic Engineering 时代最好的开源模型

更大基座，更强智能

Coding 能力：对齐 Claude Opus 4.5

Agent 能力：SOTA 级长程任务执行

国产芯片支持线上推理集群

Agentic Engineering 典型场景

开源与使用方式

1. 官方 API 接入

2. 在线体验

3. 开源链接

4. Agent

5. Blog