本文整理了 GitHub 上在大模型、深度学习、NLP 和计算机视觉领域的顶级开发者与研究员,涵盖他们的代表项目、研究方向和 GitHub 账号信息,并补充了中国顶级人工智能研究机构和研究员信息。
检索说明
- 信息来源:GitHub 官方话题、仓库贡献者、Hugging Face Canonical Maintainers 页面、开源社区文章、各机构官方网站
- 检索时间:2026 年 3 月
- 标注说明:
@用户名表示 GitHub 官方用户名(已验证)
一、大模型与深度学习
1. Andrej Karpathy
| 项目 | 链接 | 描述 |
|---|---|---|
| nanoGPT | https://github.com/karpathy/nanogpt | 最简 GPT 实现,200 行代码即可运行 |
| micrograd | https://github.com/karpathy/micrograd | 自动微分引擎 |
| nn-zero-to-hero | https://github.com/karpathy/nn-zero-to-hero | 从零开始的神经网络教程 |
| autoresearch | https://github.com/karpathy/autoresearch | AI 驱动的自主研究框架 |
研究方向:LLM 实现、训练工程化、深度学习教育
2. Hugging Face 核心团队
GitHub 组织:@huggingface
核心项目:
- Transformers(150k+ stars)
- Diffusers
- Datasets
主要维护者
| 成员 | GitHub | 主要负责模型 |
|---|---|---|
| Sylvain Gugger | @sgugger | BERT, Funnel, ELECTRA, DeBERTa |
| Patrick von Platen | @patrickvonplaten | BERT, GPT-2, XLM-RoBERTa, Wav2Vec2, Blenderbot, BART, CLIP |
| Lysandre | @lysandre | RoBERTa, XLM-RoBERTa, TAPAS |
| Niels Roge | @nielsr | DEiT, DETR, ViT, LayoutLM, BEiT |
| Ydshieh | @ydshieh | Transfo-XL, XLNet, BigBird, Reformer, Longformer |
| Valhalla | @valhalla | GPT-2, CLIP, Blenderbot, MBart, BART, RAG, DPR |
| Sanchit Gandhi | @sanchit-gandhi | Wav2Vec2, HuBERT, XLSR, XLS-R |
| Nima | @nima | OpenAI 模型协调(CLIP) |
| Nateraw | @nateraw | Microsoft 模型(WavLM, LayoutLM, BEiT, DeBERTa) |
| Anton-l | @anton-l | Microsoft 模型维护 |
| Reimers | @nreimers | sentence-transformers |
3. FastAI 团队
GitHub 组织:@fastai
| 成员 | GitHub | 角色 |
|---|---|---|
| Jeremy Howard | @jph00 | 创始人 |
| Rachel Thomas | @rachelt | 核心开发者 |
核心项目:
4. Mark Wu(微软亚研院)
| 项目 | 链接 | 描述 |
|---|---|---|
| VALL-E X | https://github.com/MarkWuNLP/MarkWuNLP | 跨语言语音合成模型 |
| WavLM | https://github.com/microsoft/WavLM | 语音处理预训练模型 |
研究方向:语音合成、大语言模型
5. Ian Magnusson(艾伦 AI 研究所)
| 项目 | 描述 |
|---|---|
| OLMo 预训练数据工具 | 大模型预训练数据处理 |
研究方向:语言模型鲁棒性、任务适配
二、自然语言处理(NLP)
1. 邱锡鹏(复旦大学)
成就:ACL、EMNLP 等顶会论文 60+ 篇,汉王青年创新奖
代表项目:
GitHub:@xpqiu
2. 李纪为(香侬科技)
成就:斯坦福大学 NLP 博士,ACL 审稿人
代表项目:
- TexSmart - 腾讯文本理解工具
- 香侬科技开源项目集
3. Sebastian Raschka
| 项目 | 链接 | 描述 |
|---|---|---|
| Python Machine Learning | https://github.com/rasbt/python-machine-learning-book | 机器学习经典教材代码 |
| LLMs-from-scratch | https://github.com/rasbt/LLMs-from-scratch | 从零构建大语言模型 |
研究方向:深度学习、LLM 实现
4. Jay Alammar
| 项目 | 链接 | 描述 |
|---|---|---|
| Visualizing Neural Networks | https://github.com/jalammar | 神经网络可视化教程 |
| The Illustrated Transformer | 博客文章 | Transformer 架构可视化详解 |
研究方向:AI 教育、模型可视化
5. Yann LeCun(Meta AI)
GitHub:@yannlecun
代表项目:
- PyTorch 核心贡献者
- 深度学习理论研究
研究方向:深度学习、计算机视觉、自监督学习
三、计算机视觉
1. Ross Girshick(Meta AI)
成就:R-CNN 系列算法发明者,CVPR 最佳论文奖
代表项目:
- Detectron2 - Meta 目标检测框架
- maskrcnn-benchmark
GitHub:@rbgirshick
研究方向:目标检测、实例分割
2. Kaiming He(MIT)
成就:ResNet 作者,CVPR 最佳论文奖,何恺明
代表项目:
GitHub:@KaimingHe
研究方向:计算机视觉、自监督学习、视觉表征学习
3. Ross Wightman(Hugging Face)
| 项目 | 链接 | 描述 |
|---|---|---|
| timm | https://github.com/huggingface/pytorch-image-models | PyTorch 图像模型库(30k+ stars) |
GitHub:@rwightman
研究方向:图像分类、迁移学习、模型优化
4. Joseph Redmon(YOLO 作者)
代表项目:
- YOLO - 实时目标检测系统
研究方向:实时目标检测、Darknet 框架
5. Alexey Bochkovskiy(YOLOv4 作者)
| 项目 | 链接 | 描述 |
|---|---|---|
| YOLOv4 | https://github.com/AlexeyAB/darknet | YOLOv4 实现 |
GitHub:@AlexeyAB
研究方向:目标检测、YOLO 系列优化
6. OpenCV 团队
GitHub 组织:@opencv
核心项目:
- OpenCV(75k+ stars)- 计算机视觉库
四、工具与框架
1. PyTorch 团队(Meta AI)
GitHub 组织:@pytorch
| 成员 | GitHub | 角色 |
|---|---|---|
| Soumith Chintala | @soumith | 联合创始人 |
| Adam Paszke | @apaszke | 联合创始人 |
核心项目:
- PyTorch(85k+ stars)
- TorchVision
- TorchAudio
2. TensorFlow 团队(Google)
GitHub 组织:@tensorflow
核心项目:
- TensorFlow(185k+ stars)
- Keras
- TensorBoard
3. Lightning AI 团队
GitHub 组织:@Lightning-AI
| 成员 | GitHub | 角色 |
|---|---|---|
| William Falcon | @williamFalcon | 创始人 |
核心项目:
- PyTorch Lightning - PyTorch 高级封装
4. Weights & Biases 团队
GitHub 组织:@wandb
核心项目:
- wandb - 机器学习实验跟踪
五、中国顶级人工智能研究机构
1. 北京智源人工智能研究院(BAAI)
简介:中国领先的人工智能研究机构,专注于大模型、通用人工智能等前沿领域
代表成果:
- 悟道大模型(WuDao):中国首个万亿参数大模型
- 天演平台:AI 模型训练与评估平台
- FlagOpen 飞智开源体系:大模型开源技术体系
2. 中国科学院自动化研究所
简介:国内人工智能领域历史最悠久、综合实力最强的研究机构之一
代表成果:
- 紫东太初大模型:多模态大模型
- 中科视拓:人脸识别与计算机视觉
- 脑图谱研究:脑科学与类脑智能
3. 北京大学人工智能研究院
简介:国内顶尖高校 AI 研究机构,在计算机视觉、NLP、机器学习等领域实力雄厚
代表成果:
- 鹏程·盘古大模型:华为与北大联合研发
- 多模态学习研究:视觉-语言预训练模型
- AI 安全与伦理研究
4. 清华大学智能产业研究院(AIR)
简介:张亚勤院士领衔,聚焦智慧交通、智慧医疗、AI+IoT 等领域
代表成果:
- 智能交通系统:自动驾驶、车路协同
- 智慧医疗:AI 辅助诊断、药物研发
- AI 芯片与边缘计算
官网:https://air.tsinghua.edu.cn
5. 南京大学人工智能学院
简介:周志华教授创立,国内首个专注于 AI 本硕博培养的学院
代表成果:
- AutoML 研究:自动化机器学习
- 集成学习理论
- AI 基础理论教育
6. 浙江大学计算机学院(AI 方向)
简介:在计算机视觉、CAD&CG、AI 系统等领域具有国际影响力
代表成果:
- CAD&CG 国家重点实验室
- 视觉智能研究:图像生成、视频分析
- AI 芯片与系统
7. 上海科技大学信息科学与技术学院
简介:年轻但发展迅速,在机器学习、智能系统等领域有特色
代表成果:
- 智能视觉中心:计算机视觉与深度学习
- 机器人与自动化
官网:https://sist.shanghaitech.edu.cn
8. 商汤科技(SenseTime)
简介:中国领先的 AI 独角兽企业,计算机视觉领域全球领先
代表成果:
- SenseParrots 深度学习平台
- OpenMMLab 开源体系:MMDetection、MMSegmentation 等
- 书生大模型(InternLM):大语言模型
9. 百度研究院
简介:国内最早布局 AI 的科技企业之一,在 NLP、自动驾驶等领域领先
代表成果:
- 文心一言(ERNIE Bot):大语言模型
- 飞桨(PaddlePaddle):深度学习框架
- Apollo 自动驾驶平台
10. 中国高校 AI 学科排名(参考)
| 排名 | 高校 | 特色 |
|---|---|---|
| 1 | 清华大学 | AI 综合实力最强 |
| 2 | 北京大学 | 计算机视觉、NLP |
| 3 | 浙江大学 | 计算机视觉、CAD&CG |
| 4 | 上海交通大学 | 机器学习、计算机视觉 |
| 5 | 南京大学 | 机器学习理论 |
| 6 | 复旦大学 | NLP、知识图谱 |
| 7 | 中国科学技术大学 | 语音、NLP |
| 8 | 哈尔滨工业大学 | NLP、语音 |
| 9 | 北京航空航天大学 | 机器人、AI 系统 |
| 10 | 西安电子科技大学 | 计算机视觉、模式识别 |
六、中国 AI 领域顶级学者(部分)
计算机视觉与模式识别
| 学者 | 所属机构 | 研究方向 |
|---|---|---|
| 朱松纯 | 北京大学人工智能研究院 | 通用人工智能、计算机视觉、统计建模 |
| 查红彬 | 北京大学智能学院 | 计算机视觉、模式识别 |
| 王晓刚 | 商汤科技 | 深度学习、计算机视觉 |
| 林达华 | 商汤科技 | 人工智能基础设施、大模型 |
自然语言处理
| 学者 | 所属机构 | 研究方向 |
|---|---|---|
| 周志华 | 南京大学人工智能学院 | 机器学习、人工智能基础理论 |
| 刘洋 | 清华大学智能产业研究院 | 自然语言处理、智慧医疗 |
| 邱锡鹏 | 复旦大学 | 自然语言处理、预训练模型 |
| 屠可伟 | 上海科技大学 | 自然语言处理、语言结构表示 |
机器学习与理论
| 学者 | 所属机构 | 研究方向 |
|---|---|---|
| 周志华 | 南京大学人工智能学院 | 机器学习、集成学习、AutoML |
| 林宙辰 | 北京大学智能学院 | 机器学习 |
| 俞扬 | 南京大学人工智能学院 | 演化学习、强化学习 |
| 钱超 | 南京大学人工智能学院 | 演化学习、启发式搜索 |
类脑智能与脑机接口
| 学者 | 所属机构 | 研究方向 |
|---|---|---|
| 余肇飞 | 北京大学人工智能研究院 | 类脑计算、神经网络 |
| 潘纲 | 浙江大学计算机学院 | 脑机接口、类脑计算 |
| 唐华锦 | 浙江大学计算机学院 | 神经形态计算、类脑智能芯片 |
AI 交叉应用
| 学者 | 所属机构 | 研究方向 |
|---|---|---|
| 吴飞 | 浙江大学计算机学院 | 人工智能、多媒体分析 |
| 詹仙园 | 清华大学智能产业研究院 | 深度强化学习、智能交通 |
| 石野 | 上海科技大学 | 具身智能、生成式模型 |
| 邵子瑜 | 上海科技大学 | 决策智能、网络与 AI |
七、检索方法
GitHub 精准搜索技巧
1 | # 按用户名搜索 |
官方维护者页面
- Hugging Face Maintainers:https://huggingface.co/hf-maintainers
GitHub Topics 导航
八、统计摘要
| 领域 | 开发者数量 | 代表性项目数 |
|---|---|---|
| 大模型与深度学习 | 15+ | 20+ |
| NLP | 8+ | 10+ |
| 计算机视觉 | 10+ | 15+ |
| 工具框架 | 5 | 5+ |
| 中国研究机构 | 10+ | 30+ |
| 中国顶级学者 | 20+ | - |
九、使用建议
关注维护者:对于感兴趣的项目,建议直接关注其主要维护者,获取最新动态
学习路径:
- 入门:Andrej Karpathy 的 nn-zero-to-hero
- 进阶:FastAI 的 fastbook 和 Dive into Deep Learning
- 实战:Hugging Face Transformers 和 timm
贡献指南:选择 Star 数高且活跃的项目,从文档完善和 bug 修复开始贡献
中国 AI 研究:
- 关注智源研究院、中科院自动化所等顶级机构的最新成果
- 学习周志华、朱松纯、吴飞等顶级学者的经典论文和著作
- 参与国内顶级会议(CCF-A 等)和开源项目
参考来源
- GitHub Topics - Deep Learning
- Hugging Face Maintainers
- OpenCV Official Repository
- 北京智源人工智能研究院
- 中国科学院自动化研究所
- 北京大学人工智能研究院
- 清华大学智能产业研究院
- 南京大学人工智能学院
- 浙江大学计算机学院
- 商汤科技
- 百度研究院
- 上海科技大学信息学院
持续更新中,欢迎补充遗漏的开发者、机构和项目信息。如有问题或建议,请留言讨论。