独家对话罗福莉:AI范式已然巨变

来源:张小珺访谈《独家对话罗福莉:AI范式已然巨变!》
视频:https://www.bilibili.com/video/BV1iVoVBgERD
整理时间:2026-05-01


访谈背景

  • 访谈对象:罗福莉,小米大模型团队负责人,主导 MiMo-V2 系列模型研发,曾供职阿里达摩院、DeepSeek
  • 核心节点:2026 年大模型行业迎来范式巨变,从 Pre-train(预训练)主导的 Chat 时代,全面转向 Post-train(后训练)主导的 Agent 时代
  • 触发变量:Claude Opus 4.6、OpenClaw 等技术突破引发全行业技术逻辑重构

一、核心观点:范式已然巨变

2026年大模型竞争已进入“第二幕”,发生了根本性的范式转移:

维度 Chat时代(2023-2025) Agent时代(2026起)
竞争焦点 预训练(Pre-train)主导 后训练(Post-train)主导
入场券 模型参数规模 1T参数的基座模型
核心能力 对话、文本生成 决策、工具调用、多步复杂任务

二、技术判断与行业洞察

1. OpenClaw的”觉醒”时刻

罗福莉将开源Agent框架 OpenClaw 视为”划时代的Agent框架”。她亲身体验后,认为其通过以下设计,能有效弥补模型的能力短板:

  • 精细的上下文编排
  • 持久记忆机制
  • 多模型调度能力

这些设计 激发了中层模型的上限,让它们在许多场景下能达到接近顶尖模型的水平。

2. Code的关键泛化力

编程(Code)被认为是具有极强泛化能力的场景。原因在于代码数据天然具备:

  • 长上下文 - 需要理解代码的前后依赖
  • 强关联 - 函数调用、模块引用关系复杂

在此基础上的训练,能让模型更好地处理Agent所需的长程、复杂任务。

3. 后训练成为赛点

在新范式中,后训练(特别是强化学习RL的Scaling)变得与预训练同等甚至更加重要

竞争的关键在于:能否在多样的Agent框架中,让模型端到端地稳定完成高复杂度任务。

4. 算力资源分配重构

算力(卡)的调配比例发生巨变:

时代 研究 预训练 后训练
Chat时代 3 5 1
Agent时代(合理) 3 1 1
顶尖团队 1 1 1

后训练的算力权重迎来爆发式提升,从预训练的辅助环节,升级为决定产品竞争力的核心研发主线。

5. 对多模态的再思考

罗福莉表示,在Agent可以优雅编排多个专业模型的范式下,**”多模态是否促进智能”本身已不关键**。

当前更重要的是:模型能否在Agent框架内有效”行动”,而多模态理解是行动的必要条件之一。


三、组织与文化:创新如何诞生

小米大模型团队的实践

团队约100人,但没有严格的职级和固定小组划分。罗福莉认为任何层级和规范都是对创造力的约束,平权有利于所有人平等贡献智慧。

核心管理理念

  • 热爱驱动:通过让成员深度体验新技术(如强制使用OpenClaw)来激发内在热情
  • 频繁碰撞:团队内沟通频繁、思想碰撞激烈
  • 招人标准:更看重好奇心、热爱和潜力,而非已有的大模型经验

“环境比经验更重要” —— 良好的环境能让人快速习得所需技能。

对模糊性的容忍

Agent范式下的后训练和RL基础设施工作,需要比预训练时代更高的敏捷性和对模糊性的容忍度。团队必须具备快速开发、适配新系统的能力。


四、个人洞见与未来展望

AI训练AI即将到来

罗福莉预见,AI将能先吸收人类智能,再通过自我迭代产生更强智能,实现”左脚踩右脚”式的提升。

这可能在 一两年内 发生。

AGI路线图

她预测,按照当前路径,AGI可能在两年内实现

  1. 第一阶段:首先颠覆工作模式
  2. 第二阶段:随着机器人等硬件进步,改变生活模式

开源的意义

她坚信 开源是加速AGI进程的关键,有利于促进Agent框架、芯片、能源等整个生态的繁荣。

中美竞争态势

她判断,国内拥有1T基座模型的团队,与国外顶尖模型(如Claude Opus 4.6)的代差可能只有两三个月

接下来两三个月团队的应变和进化速度将至关重要。


五、行业深度解读

1. 范式转移的本质

维度 Chat时代 Agent时代
核心矛盾 基础模型通用能力不足 如何把模型能力转化为Agent生产力
资源倾斜 所有资源向基座能力倾斜 释放模型能力、实现规模化落地
技术重心 预训练是绝对核心 后训练(强化学习)成为核心引擎

2. Anthropic路径成为共识

Anthropic的核心路径——通过RLHF/RLAIF等强化学习技术实现模型能力提升——恰恰命中了Agent时代的核心需求:

  • 模型可控性
  • 对齐性
  • 复杂推理能力
  • 工具调用能力

3. 行业决胜窗口期

大模型行业的迭代周期已从 **”年”压缩至”月”**。

未来2-3个月,谁能最快落地新范式,谁就能在新赛道抢到先发优势。

4. 长期Scaling的核心焦虑

“不会在1T水平上走太久”的判断,本质是行业对Scaling Law的深度反思。

下一阶段的竞争,核心是找到Scaling的第二曲线:

  • 继续堆参数量?
  • Scaling数据质量?
  • 强化学习迭代轮次?
  • 多模态融合能力?
  • Agent闭环能力?

访谈完整大纲

时间戳 主题
00:01:31 OpenClaw引发的行业巨变
00:23:32 群体智能对Agent框架的提升
00:40:46 2026作为生产力变革之年的核心逻辑
01:01:00 Agent的自进化与自迭代能力
01:18:54 MiMo-V2的技术布局:觉醒和伏击
01:44:39 1T模型仅为行业入场券的深层判断
01:51:48 大模型研发团队的组织平权
02:02:11 大模型训练的核心细节与成本拆解
02:08:18 大模型另类架构的探索与可能性
02:21:47 AI发展与人类生存危机的核心探讨
02:38:27 技术迭代下「每天否认昨天的自己」的研发常态
02:47:49 过去3年AI行业的完整进化史复盘
03:05:09 当下行业共识与头部竞争格局
03:19:00 技术成长中「环境比经验更重要」的核心观点

相关资源

⚠️ 本内容不作为投资建议


本文由 AI 辅助整理,欢迎讨论交流。