2026-05-01

独家对话罗福莉：AI范式已然巨变

来源：张小珺访谈《独家对话罗福莉：AI范式已然巨变！》
视频：https://www.bilibili.com/video/BV1iVoVBgERD
整理时间：2026-05-01

访谈背景

访谈对象：罗福莉，小米大模型团队负责人，主导 MiMo-V2 系列模型研发，曾供职阿里达摩院、DeepSeek
核心节点：2026 年大模型行业迎来范式巨变，从 Pre-train（预训练）主导的 Chat 时代，全面转向 Post-train（后训练）主导的 Agent 时代
触发变量：Claude Opus 4.6、OpenClaw 等技术突破引发全行业技术逻辑重构

一、核心观点：范式已然巨变

2026年大模型竞争已进入“第二幕”，发生了根本性的范式转移：

维度	Chat时代（2023-2025）	Agent时代（2026起）
竞争焦点	预训练（Pre-train）主导	后训练（Post-train）主导
入场券	模型参数规模	1T参数的基座模型
核心能力	对话、文本生成	决策、工具调用、多步复杂任务

二、技术判断与行业洞察

1. OpenClaw的”觉醒”时刻

罗福莉将开源Agent框架 OpenClaw 视为”划时代的Agent框架”。她亲身体验后，认为其通过以下设计，能有效弥补模型的能力短板：

精细的上下文编排
持久记忆机制
多模型调度能力

这些设计 激发了中层模型的上限，让它们在许多场景下能达到接近顶尖模型的水平。

2. Code的关键泛化力

编程（Code）被认为是具有极强泛化能力的场景。原因在于代码数据天然具备：

长上下文 - 需要理解代码的前后依赖
强关联 - 函数调用、模块引用关系复杂

在此基础上的训练，能让模型更好地处理Agent所需的长程、复杂任务。

3. 后训练成为赛点

在新范式中，后训练（特别是强化学习RL的Scaling）变得与预训练同等甚至更加重要。

竞争的关键在于：能否在多样的Agent框架中，让模型端到端地稳定完成高复杂度任务。

4. 算力资源分配重构

算力（卡）的调配比例发生巨变：

时代	研究	预训练	后训练
Chat时代	3	5	1
Agent时代（合理）	3	1	1
顶尖团队	1	1	1

后训练的算力权重迎来爆发式提升，从预训练的辅助环节，升级为决定产品竞争力的核心研发主线。

5. 对多模态的再思考

罗福莉表示，在Agent可以优雅编排多个专业模型的范式下，**”多模态是否促进智能”本身已不关键**。

当前更重要的是：模型能否在Agent框架内有效”行动”，而多模态理解是行动的必要条件之一。

三、组织与文化：创新如何诞生

小米大模型团队的实践

团队约100人，但没有严格的职级和固定小组划分。罗福莉认为任何层级和规范都是对创造力的约束，平权有利于所有人平等贡献智慧。

核心管理理念

热爱驱动：通过让成员深度体验新技术（如强制使用OpenClaw）来激发内在热情
频繁碰撞：团队内沟通频繁、思想碰撞激烈
招人标准：更看重好奇心、热爱和潜力，而非已有的大模型经验

“环境比经验更重要” —— 良好的环境能让人快速习得所需技能。

对模糊性的容忍

Agent范式下的后训练和RL基础设施工作，需要比预训练时代更高的敏捷性和对模糊性的容忍度。团队必须具备快速开发、适配新系统的能力。

四、个人洞见与未来展望

AI训练AI即将到来

罗福莉预见，AI将能先吸收人类智能，再通过自我迭代产生更强智能，实现”左脚踩右脚”式的提升。

这可能在 一两年内 发生。

AGI路线图

她预测，按照当前路径，AGI可能在两年内实现：

第一阶段：首先颠覆工作模式
第二阶段：随着机器人等硬件进步，改变生活模式

开源的意义

她坚信 开源是加速AGI进程的关键，有利于促进Agent框架、芯片、能源等整个生态的繁荣。

中美竞争态势

她判断，国内拥有1T基座模型的团队，与国外顶尖模型（如Claude Opus 4.6）的代差可能只有两三个月。

接下来两三个月团队的应变和进化速度将至关重要。

五、行业深度解读

1. 范式转移的本质

维度	Chat时代	Agent时代
核心矛盾	基础模型通用能力不足	如何把模型能力转化为Agent生产力
资源倾斜	所有资源向基座能力倾斜	释放模型能力、实现规模化落地
技术重心	预训练是绝对核心	后训练（强化学习）成为核心引擎

2. Anthropic路径成为共识

Anthropic的核心路径——通过RLHF/RLAIF等强化学习技术实现模型能力提升——恰恰命中了Agent时代的核心需求：

模型可控性
对齐性
复杂推理能力
工具调用能力

3. 行业决胜窗口期

大模型行业的迭代周期已从 **”年”压缩至”月”**。

未来2-3个月，谁能最快落地新范式，谁就能在新赛道抢到先发优势。

4. 长期Scaling的核心焦虑

“不会在1T水平上走太久”的判断，本质是行业对Scaling Law的深度反思。

下一阶段的竞争，核心是找到Scaling的第二曲线：

继续堆参数量？
Scaling数据质量？
强化学习迭代轮次？
多模态融合能力？
Agent闭环能力？

访谈完整大纲

时间戳	主题
00:01:31	OpenClaw引发的行业巨变
00:23:32	群体智能对Agent框架的提升
00:40:46	2026作为生产力变革之年的核心逻辑
01:01:00	Agent的自进化与自迭代能力
01:18:54	MiMo-V2的技术布局：觉醒和伏击
01:44:39	1T模型仅为行业入场券的深层判断
01:51:48	大模型研发团队的组织平权
02:02:11	大模型训练的核心细节与成本拆解
02:08:18	大模型另类架构的探索与可能性
02:21:47	AI发展与人类生存危机的核心探讨
02:38:27	技术迭代下「每天否认昨天的自己」的研发常态
02:47:49	过去3年AI行业的完整进化史复盘
03:05:09	当下行业共识与头部竞争格局
03:19:00	技术成长中「环境比经验更重要」的核心观点

Hexo