来源:张小珺访谈《独家对话罗福莉:AI范式已然巨变!》
视频:https://www.bilibili.com/video/BV1iVoVBgERD
整理时间:2026-05-01
访谈背景
- 访谈对象:罗福莉,小米大模型团队负责人,主导 MiMo-V2 系列模型研发,曾供职阿里达摩院、DeepSeek
- 核心节点:2026 年大模型行业迎来范式巨变,从 Pre-train(预训练)主导的 Chat 时代,全面转向 Post-train(后训练)主导的 Agent 时代
- 触发变量:Claude Opus 4.6、OpenClaw 等技术突破引发全行业技术逻辑重构
一、核心观点:范式已然巨变
2026年大模型竞争已进入“第二幕”,发生了根本性的范式转移:
| 维度 | Chat时代(2023-2025) | Agent时代(2026起) |
|---|---|---|
| 竞争焦点 | 预训练(Pre-train)主导 | 后训练(Post-train)主导 |
| 入场券 | 模型参数规模 | 1T参数的基座模型 |
| 核心能力 | 对话、文本生成 | 决策、工具调用、多步复杂任务 |
二、技术判断与行业洞察
1. OpenClaw的”觉醒”时刻
罗福莉将开源Agent框架 OpenClaw 视为”划时代的Agent框架”。她亲身体验后,认为其通过以下设计,能有效弥补模型的能力短板:
- 精细的上下文编排
- 持久记忆机制
- 多模型调度能力
这些设计 激发了中层模型的上限,让它们在许多场景下能达到接近顶尖模型的水平。
2. Code的关键泛化力
编程(Code)被认为是具有极强泛化能力的场景。原因在于代码数据天然具备:
- 长上下文 - 需要理解代码的前后依赖
- 强关联 - 函数调用、模块引用关系复杂
在此基础上的训练,能让模型更好地处理Agent所需的长程、复杂任务。
3. 后训练成为赛点
在新范式中,后训练(特别是强化学习RL的Scaling)变得与预训练同等甚至更加重要。
竞争的关键在于:能否在多样的Agent框架中,让模型端到端地稳定完成高复杂度任务。
4. 算力资源分配重构
算力(卡)的调配比例发生巨变:
| 时代 | 研究 | 预训练 | 后训练 |
|---|---|---|---|
| Chat时代 | 3 | 5 | 1 |
| Agent时代(合理) | 3 | 1 | 1 |
| 顶尖团队 | 1 | 1 | 1 |
后训练的算力权重迎来爆发式提升,从预训练的辅助环节,升级为决定产品竞争力的核心研发主线。
5. 对多模态的再思考
罗福莉表示,在Agent可以优雅编排多个专业模型的范式下,**”多模态是否促进智能”本身已不关键**。
当前更重要的是:模型能否在Agent框架内有效”行动”,而多模态理解是行动的必要条件之一。
三、组织与文化:创新如何诞生
小米大模型团队的实践
团队约100人,但没有严格的职级和固定小组划分。罗福莉认为任何层级和规范都是对创造力的约束,平权有利于所有人平等贡献智慧。
核心管理理念
- 热爱驱动:通过让成员深度体验新技术(如强制使用OpenClaw)来激发内在热情
- 频繁碰撞:团队内沟通频繁、思想碰撞激烈
- 招人标准:更看重好奇心、热爱和潜力,而非已有的大模型经验
“环境比经验更重要” —— 良好的环境能让人快速习得所需技能。
对模糊性的容忍
Agent范式下的后训练和RL基础设施工作,需要比预训练时代更高的敏捷性和对模糊性的容忍度。团队必须具备快速开发、适配新系统的能力。
四、个人洞见与未来展望
AI训练AI即将到来
罗福莉预见,AI将能先吸收人类智能,再通过自我迭代产生更强智能,实现”左脚踩右脚”式的提升。
这可能在 一两年内 发生。
AGI路线图
她预测,按照当前路径,AGI可能在两年内实现:
- 第一阶段:首先颠覆工作模式
- 第二阶段:随着机器人等硬件进步,改变生活模式
开源的意义
她坚信 开源是加速AGI进程的关键,有利于促进Agent框架、芯片、能源等整个生态的繁荣。
中美竞争态势
她判断,国内拥有1T基座模型的团队,与国外顶尖模型(如Claude Opus 4.6)的代差可能只有两三个月。
接下来两三个月团队的应变和进化速度将至关重要。
五、行业深度解读
1. 范式转移的本质
| 维度 | Chat时代 | Agent时代 |
|---|---|---|
| 核心矛盾 | 基础模型通用能力不足 | 如何把模型能力转化为Agent生产力 |
| 资源倾斜 | 所有资源向基座能力倾斜 | 释放模型能力、实现规模化落地 |
| 技术重心 | 预训练是绝对核心 | 后训练(强化学习)成为核心引擎 |
2. Anthropic路径成为共识
Anthropic的核心路径——通过RLHF/RLAIF等强化学习技术实现模型能力提升——恰恰命中了Agent时代的核心需求:
- 模型可控性
- 对齐性
- 复杂推理能力
- 工具调用能力
3. 行业决胜窗口期
大模型行业的迭代周期已从 **”年”压缩至”月”**。
未来2-3个月,谁能最快落地新范式,谁就能在新赛道抢到先发优势。
4. 长期Scaling的核心焦虑
“不会在1T水平上走太久”的判断,本质是行业对Scaling Law的深度反思。
下一阶段的竞争,核心是找到Scaling的第二曲线:
- 继续堆参数量?
- Scaling数据质量?
- 强化学习迭代轮次?
- 多模态融合能力?
- Agent闭环能力?
访谈完整大纲
| 时间戳 | 主题 |
|---|---|
| 00:01:31 | OpenClaw引发的行业巨变 |
| 00:23:32 | 群体智能对Agent框架的提升 |
| 00:40:46 | 2026作为生产力变革之年的核心逻辑 |
| 01:01:00 | Agent的自进化与自迭代能力 |
| 01:18:54 | MiMo-V2的技术布局:觉醒和伏击 |
| 01:44:39 | 1T模型仅为行业入场券的深层判断 |
| 01:51:48 | 大模型研发团队的组织平权 |
| 02:02:11 | 大模型训练的核心细节与成本拆解 |
| 02:08:18 | 大模型另类架构的探索与可能性 |
| 02:21:47 | AI发展与人类生存危机的核心探讨 |
| 02:38:27 | 技术迭代下「每天否认昨天的自己」的研发常态 |
| 02:47:49 | 过去3年AI行业的完整进化史复盘 |
| 03:05:09 | 当下行业共识与头部竞争格局 |
| 03:19:00 | 技术成长中「环境比经验更重要」的核心观点 |
相关资源
- 公众号:语言即世界 language is world
- 视频:Bilibili 访谈视频
- 联系方式:xiaojunzhang@lisw.ai
⚠️ 本内容不作为投资建议
本文由 AI 辅助整理,欢迎讨论交流。