清华大学自动化系研究员,清华大学导航与控制研究所机器人控制实验室主任,无人系统中心类脑机器人交叉中心主任,加速进化首席科学家。研究方向为融合“类脑芯片”及“类脑计算”构建人工通用智能研究平台、基于类脑计算的机器人控制,成果发表于Nature封面,获得2019年度中国科学十大进展及“科技创新2030”计划的资助。
1997年,本田公司人形双足机器人阿西莫(ASIMO)的亮相如同一颗火种,点燃了全球机器人研发的热潮。正是在这股浪潮中,中国的人形机器人研究踏上了充满荆棘与挑战的征程。二十余载岁月流转,当初的同行者或转行、或离场,清华大学自动化系研究员赵明国却初心不改,在中国人形机器人研究之路上深耕至今。自2000年起在清华大学开启机器人研究生涯,到如今兼任加速进化首席科学家,他始终站在中国机器人研究的前沿阵地。“二十年过去,仍在坚持的仅有我一人”,这句看似轻描淡写的话语,背后是一位学者二十年如一日对具身智能科研事业的赤诚与执着。
“2000年左右,我到访清华大学,恰逢我国开始兴起对机器人的研究,我有幸结识了清华陈恳老师,他邀请我到清华从事博士后机器人项目研究,我欣然接受。”2000年,赵明国在清华大学开启了自己的机器人研究生涯。彼时的中国人形机器人研究尚处于蹒跚学步阶段,技术薄弱、人才匮乏,科研环境异常艰苦,但赵明国却一头扎进了这片未知的、“投入与产出不成正比”的研究领域。
2003年,赵明国入职清华大学自动化系,主要研究机器人的步态控制与行走,当时自动化系计划在本科生培养中增加机器人相关内容。在此背景下,2004年赵明国创立“清华火神队”——一支机器人足球队。
谈及早期研究困境,赵明国坦言,机器人研究领域长期存在着“没钱、没产出”的现实难题,因而按多数人的选择标准,很少有学生愿意投身其中。即便如此,仍有少数对机器人抱有热爱的学生跟随赵明国的步伐不断坚守,“总会有那么几个学生喜欢机器人,他们不在乎产出、成绩也不错。”
在机器人研究最冷寂的年代,赵明国选择深耕双足机器人控制系统,探索被动动力学行走,尝试将类脑计算引入机器人领域,每一个研究方向都堪称是当时学界鲜有人涉足的“无人区”。实验室里,无数个日夜,团队成员们围着简陋的机器人模型反复调试代码、优化算法。在经费最拮据的时期,课题组甚至出现了“没啥经费、做的成果也不好”的绝望处境,但赵明国始终相信“20年的发展趋势其实就在5年一重复,关键是你能否在低谷时守住方向”。这种坚持源于他对技术趋势的长期判断,也源自他对清华团队持之以恒、深度准备的自信。
RoboCup有“机器人世界杯”之称,自1997年创办以来,每年吸引超过60个国家和地区的队伍参与,在机器人和人工智能领域具有广泛影响力。2005年,清华火神队首次参加RoboCup机器人世界杯比赛。此后,几乎每年比赛,赵明国都会带队参加,机器人软硬件技术在一次次实战中不断得到迭代发展。由于人形机器人领域研究成本较高、技术难度较大,有能力参与RoboCup类人组成人尺寸组别比赛的队伍并不多,清华火神队可以说是中国的代表性队伍。早年间,每次出国比赛师生都要省吃俭用,买不起新的性能稳定的机器人,只能小心翼翼地用旧机器人比赛。尽管如此,清华火神队却依旧凭借扎实的技术,常年在全球赛中保持前三名 的成绩。
赵明国常对团队说:“科研就像在黑暗中摸索,我们要做的就是不断试错,直到找到那束光。”正是这种长期主义的坚守,让团队最终迎来了技术突破与产业转化的契机。回看过往,赵明国说,这种坚持不仅是对科研的热爱,更是一种使命感:一定要让中国的人形机器人技术在世界舞台上占有一席之地。
2023年8月,曾担任清华火神队第三任队长的程昊创立加速进化,召集许多火神队前队员担任研发人员,并邀请导师赵明国担任首席科学家。程昊不仅具备扎实的技术功底,还拥有在创业与互联网大厂积累的商业化经验。加速进化公司的核心团队凭借在机器人、软件、芯片和商业化等全方位的经验,开始打造人形机器人、操作系统、开发工具等软硬件平台,致力于打破人形机器人技术壁垒,将高校科研成果向产业化转化,开启新征程。大约一年后,加速进化第一个人形机器人产品T1问世,并很快在足球赛场上展露头角。
针对行业内“概念炒作大于技术实质”的现象,赵明国指导加速进化团队“始终坚持以问题导向驱动技术突破”。在人形机器人的技术体系中,运动控制是最核心的难题,也是加速进化的攻坚重点。早在强化学习成为行业显学之前,赵明国的团队就在双轮自行车项目中尝试过这一技术路线。当时,虽然因技术成熟度等问题选择暂缓推进,但这种前瞻性的探索也彰显了他作为资深学者的远见。
如今,在加速进化的机器人运动控制研发中,深度强化学习(DRL)技术发挥着至关重要的作用。具体而言,就是通过构建庞大的仿真环境,让机器人在虚拟世界中经历无数次的训练与失败,逐渐学习到最优的步态控制策略。最终,无论是平坦路面还是崎岖地形,机器人都能通过不断优化自身行为,实现稳定的全向运动。
模型预测控制器(MPC)和全身控制算法(WBC)的应用,更进一步提升了机器人的运动能力。赵明国指出,当前人形机器人最核心的底层挑战在于运动控制的优化与适应性突破——传统方法将机器人运动视为机械轨迹规划,而团队早在七八年前就将其重新定义为“多目标优化问题”,即通过模型预测控制(MPC)框架将全身关节运动、地面碰撞力学、姿态保持等复杂约束转化为可求解的数学模型,实现了从工程师直觉驱动到机理建模驱动的跨越。这种将质心、动量等抽象物理概念与末端执行器控制解耦的方法,使机器人在多任务协同(如行走同时保持平衡)时具备了可解释性与可行性。另外,全身控制算法(WBC)则实现了机器人全身关节的协同控制,让其在行走的同时,还能灵活完成抓取、搬运等复杂动作。在每年一度的机器人足球比赛中,加速进化的机器人正是依靠这些先进技术,在赛场上灵活走位、精准射门,展现出了强大的运动控制能力。
面对高自由度系统带来的优化难题,团队进一步引入强化学习(RL)技术,通过数据驱动弥补传统优化算法在环境适应性上的不足。“过去依赖预设轨迹的机械控制,如今通过RL在仿真中学习动态策略,即使条件变化也能在线求解”,这种从模型依赖到数据-模型融合模式的转变正是赵明国预判的技术拐点。2023年,ChatGPT3.0轰动世界的技术突破意味着大模型与机器人运动控制的结合似乎正在重构具身智能的底层逻辑。赵明国强调,当前行业正经历从低级机械控制到复杂优化控制,再到AI智能控制的三阶跃迁,而团队早在5年前就布局的“优化+RL”混合架构已经能够实现机器人运动误差小于0.5毫米的精准控制,为具身智能的底层技术迭代奠定了标准。
这种对技术演进路径的精准把握源自赵明国对行业“从机械思维到AI思维”转型的深刻洞察。他指出,20年前的机器人控制依赖工程师经验,10年前进入优化控制阶段,而如今必须拥抱AI。“真正的行业引领者,需要在技术浪潮中始终锚定底层问题,而非追逐表面热点。”赵明国说。
“人形机器人领域有史以来从未像现在这样机遇与挑战并存。”赵明国说,在应用场景的选择上,团队曾面临马拉松机器人、100米竞速机器人等短期曝光项目的诱惑,但最终还是决定将企业发展的主要力量聚焦于更具产业价值的方向。赵明国认为,“跑马拉松或竞速100米虽能露脸或发表文章,但对产业帮助有限”。
为何选择机器人足球这个赛道?赵明国认为,机器人足球是一个综合性的AI挑战。与传统的棋类游戏不同,机器人足球具有动态、实时、信息不完整、非符号化和分布式等特点。在机器人足球比赛时,机器人需要在复杂的动态环境中实现全身运动,非常考验机器人的自主导航与协作、多模态感知与决策等多种能力。通过参与比赛,不仅能够检验机器人的技术水平,还能推动相关技术的快速进步,为未来人形机器人在更多领域的应用奠定基础。因此,团队最终确立了通用模型优先的策略,致力于将机器人足球等场景中积累的技术(如动态行走、多传感器融合)抽象为通用解决方案,“希望把踢足球的技术等级转化为通用模型,解决80%的同类问题”。这种从具体场景到底层技术的提炼,正是加速进化推动产品落地的核心逻辑。
2025年3月,在RoboCup德国公开赛成人组决赛中,使用加速进化T1机器人的中国清华火神队迎来高光时刻。赛场上,一台T1机器人提前“预判”了对手的封锁路线,巧妙绕开比自己高出一头的对手,率先触球射门得分,最终以9:0的比分零封夺冠。8月17日,2025世界人形机器人运动会5V5足球决赛中,中国清华火神队的机器人球员们以1:0的成绩,战胜德国队,斩获冠军。这些胜利不仅证明了加速进化T1机器人的卓越性能,更让公司在科研教育领域声名远扬。
2025年3月,清华火神队在RoboCup机器人世界杯德国公开赛类人组(Humanoid League)成人尺寸(AdultSize)组别的决赛中,以9:0的绝对优势战胜东道主德国Sweaty队,零封夺冠(来源:清华大学微信公众号)
在科研教育领域之外,加速进化也在积极探索更为丰富的商业应用场景。他们尝试将机器人足球赛对标电竞赛事进行商业运作,与多家企业合作举办赛事,通过广告投放、品牌合作等方式实现商业价值转化。在文旅互动展演场景中,T1机器人凭借出色的运动能力和表演能力,成功成为文旅活动的焦点;在科技主题展览中,T1机器人能够与游客互动,解答问题、介绍展览内容,为游客带来全新的科技体验,拓展了人形机器人的市场边界。
面对工厂、家庭等复杂场景落地的挑战,加速进化正在加大研发投入,针对不同场景需求进行技术攻关。值得关注的是,团队在技术转化中同样注重商业标准的建立。“当前机器人领域的算法多针对单一问题,我们要从根上解决共性问题”,这种思路也吸引了MIT、伯克利等国际团队的关注,“他们开始学习我们的方法并索要源代码”,侧面印证了技术路线的前瞻性。赵明国强调:“做通用型基础技术,对产业发展、社会价值的影响力,远大于单点技术突破。”这种将科研与产业深度结合的理念,正推动加速进化在教育科研、商业应用等多元场景中实现技术落地与生态构建的双重突破。
而针对行业内盲目跟风制定标准的现象,赵明国强调分级的本质是技术路线图的纲领。正是在这种战略眼光的指引下,赵明国呼吁,人形机器人领域应该像智能驾驶一样建立技术分级体系。这套基于“人机二元关系递减”的技术分级逻辑也为行业发展提供了清晰的方法论,核心逻辑是人的干预逐步减少,机器自主性逐级增加 ——L0阶段机器人依赖本体传感器与预设模型(如仅靠陀螺仪和关节力矩间接估算状态),属于“盲走”状态;L1加入视觉等外部感知,能对静态目标(如静止的足球)做出反应;L2实现多机器人协作(如双人传球);L3可应对动态对抗场景;L4则达到完全自主决策。这种分级并非简单功能叠加,而是基于人机耦合度递减的科学推演。赵明国指出,当前机器人行业多数仍停留在L0阶段(如跳舞机器人易摔倒、踢滚动足球失败),甚至连基础的动态平衡问题都未解决,却盲目追求L4级目标,就导致了大量资源错配的问题。
以足球机器人为例,L0阶段需攻克“全向行走与动态平衡”,L1需实现“视觉引导下的动态踢球”,L2需完成“多机协作传球”,每个层级都需扎实的技术积累。这种分级体系不仅能指导研发节奏,还能避免行业陷入“伪智能”陷阱——例如部分团队用预设模型模拟“跑酷跳跃”,却无法应对环境变化,本质仍是L0水平。基于此,赵明国进一步提出“分级与复杂度矩阵”的战略工具,将技术难度与AI程度划分为25个格子,主张以“之字形路径”推进——先在L0解决基础运动控制,再尝试L1的视觉踢球,回头优化L0的抗干扰能力,再进军L2的协作决策。这种迭代策略能确保技术根基稳固,避免步子太大导致的系统崩溃。
赵明国认为,尽管机器人场景更复杂,但通过明确“人机二元关系”的递减路径,行业可在25年内实现从L0到L4的跨越,而不是陷入“每年追热点却无实质突破”的怪圈。
目前,加速进化团队已初步完成L0到L2的分级定义,正在通过机器人足球赛验证分级标准的可行性,力争为行业建立可复制的技术演进框架。正如自动驾驶从L0(全人工控制)到L4(完全自动驾驶)的演进,本质是“人的脚、手、眼、脑逐步解放”的过程,这一逻辑在机器人领域同样适用。这种分级体系不仅有助于科研人员明确研究目标,也能为企业的技术研发和产品规划提供指导,推动整个行业的健康发展。在赵明国的引领下,加速进化正推动人形机器人行业朝着创新活跃、协同发展的方向迈进。
从孤军奋战的坚守者到行业生态的构建者,赵明国用二十年时间书写了一段中国人形机器人研究的传奇。在这条充满挑战的道路上,他始终保持着对科研的热爱与执着,以创新为笔,以坚守为墨,描绘着人形机器人领域的壮丽画卷。未来,加速进化在赵明国及其科研团队的共同努力下,必将继续突破技术瓶颈,拓展应用边界,为中国人形机器人产业发展注入源源不断的动力。
清华大学是国内最早开展人工智能教学和科研的高校之一。自20世纪70年代至今,学校在人工智能人才培养和科学研究方面积淀深厚,始终注重理论研究与实际应用的深度融合,众多清华人已成为推动我国人工智能领域科研创新与产业发展的中坚力量。
2025年8月出版的《水木清华》AI专刊(2025年第3-4期合刊),特别报道了近50个具有广泛影响力的清华校友AI企业及平台,以及多位院士、教授、行业专家对人工智能时代多维度的思考与建议,展现了清华人在引领智能变革、赋能经济社会创新发展中的重要作用与贡献。IM电竞IM电竞