林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理_纳雍网站建设_网站建设公司_网站建设设计制作_seo优化
3月27日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。
文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。
林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量 Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是,Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。
针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励***(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。
来源:凤凰网科技返回搜狐,查看更多
同类文章排行
- 从现在看,沙特当年35亿买东风三的投资是不是划算的?
- 「刚醒来就累了」为什么有的人好像天生精力差?作为低能量人,我们该如何给自己「开源节能」?
- 如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
- 为什么现在的药品名都不直接写明治什么病,而是用一堆奇怪的音译名?
- 印度钢产量世界第二、发电量世界第三,印度成为世界工厂是不是已经从将来时变成进行时?
- 如何看待22岁中国游客从泰国豪华酒店21层坠楼身亡?
- 2025 年 6 月,Rust 在 GUI 方面有何大的进展? 你最看好哪个框架?
- 怎么提高自己的系统设计和架构理论水平?
- 如何看待“京东外卖停止补贴后,日单量跌至两万单”这件事?
- 一个好的 AI 产品,应该至少满足哪几点条件?
最新资讯文章
- Golang 的 Web 框架该怎么选择?Web 开发又该怎样学?
- 中国发动机是技术落后,还是材料技术没有攻克?
- PHP现在真的已经过时了吗?
- 有什么快速挣钱的正规路子?
- 为什么小米造车可以叫小米,而华为不可以用华为品牌造车?
- LevelDB/RocksDB是如何保证MemTable写入的原子性的?
- Node.js是谁发明的?
- 飞天茅台散瓶批发价跌破 2000 元,背后什么原因?收藏茅台还能增值吗?
- 以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的?
- 老板说我设计了一周的海报还是不行,我到底该怎么学啊?
- 我国新一代载人飞船「梦舟」零高度逃逸飞行试验成功,该实验有怎样的意义?「梦舟」在未来会发挥哪些作用?
- 几年前吹得神乎其神的福建舰电磁弹射为什么现在销身匿迹了?
- 为什么不成立一个***经济特区?
- 北京日报点名批评“苏超”过度娱乐化,它是否管的太宽了?为什么无良媒体不会被查封取缔?
- 鸿蒙电脑应用开发和鸿蒙手机是一样的吗?
- 有一个乌克兰的朋友问我,中国人凭什么能享受和平,我该怎么说?
- 如果你产检时发现孩子有严重的病,你会留下他还是打掉?
- Mac mini M4,有必要升级24G内存吗?
- 如何部署Prometheus监控K8S?
- 日本AV对中国人的毒害有多大?




