海若镜 采访 海若镜、巴芮
在清华无锡研究院智能产业创新中心,张亚勤院士在盛夏时节接受了采访。他抵达时,立即提议降低室内温度。
在谈话中,张亚勤对当前围绕具身智能和人工智能投资创业的热潮表示,需要“降温”,并呼吁“更冷静些,不要急躁”。
五年前,张亚勤创立了清华大学智能产业研究院(AIR)。该研究院汇集了多位在人工智能产业拥有丰富经验的知名教授。据了解,AIR的首届博士生已顺利毕业,其孵化的十家公司已累计获得约150亿元人民币的融资,总估值达到1500亿元人民币。其中,华深智药和它石智航等独角兽企业在资本市场获得了高度关注。
尽管1500亿元的估值是一个显著的数字,张亚勤强调AIR的首要任务是进行科学研究,公司孵化只是自然而然的衍生结果,并且多数公司仍处于“证明自身能力”的阶段。
作为中国工程院院士和国内最年轻的IEEE fellow之一,张亚勤曾经历技术革命与资本周期的起伏。他认为,当前人工智能的发展阶段类似于1998年至1999年的互联网时代,正处于大规模投资基础设施(包括电力、算力和算法)的关键时期。他相信,从长远来看,人工智能产业具有巨大的潜力,并指出“人工智能本身没有泡沫,但早期的人工智能公司可能会存在泡沫”。他预测,未来万亿市值的巨头可能并非当前备受瞩目的公司。
到2026年,“物理人工智能”已成为技术开发和资本投资的热点。在过去五年里,张亚勤及其团队已在自动驾驶、具身智能仿真和工业能效人工智能等领域布局了多家公司。对于“趁着市场热潮积极融资”的普遍做法,他直言,过多的融资可能导致业务分散,最终耗尽资金却未能转化为实际业绩。
近年来,张亚勤每年都会就人工智能的发展趋势提出预测。例如,在2024年6月,他提出了开发新的AI算法体系的需求,包括世界模型和Agent,以实现效率的百倍提升。他解释了当前AI与1998年互联网的相似之处,讨论了面向物理世界AI数据缺失的问题,以及VLA和世界模型技术路线的结合方式,并分享了对教授创业的看法。
自2024年起,AIR每年6月在无锡举办“太湖对话”论坛,今年已是第三届。以下是论坛前夕张亚勤与暗涌Waves的对话内容(已编辑)。
第一部分:教授重回创业前沿,但多数不适合担任CEO
暗涌:三年前,投资界还在反思“不投教授”。在新一轮具身智能和AI创业热潮中,科学家又重新站在了舞台中央,您如何看待“教授创业”?
张亚勤:本轮AI创业高度依赖技术,因此教授的技术能力和创新理念至关重要。目前,中国涌现出一批高水平教授,他们能够引领世界级的、主流的创新,而不再仅仅是跟随。科学家创业有三种模式:第一种是教授全职投入创业,离开学术界;第二种是教授以学术研究为主,将优秀的研究成果和技术转化为企业,但不直接管理公司,由市场化团队运营;第三种是教授仍在高校任职,同时管理多家公司。第三种模式通常难以成功。
暗涌:第一、二种模式是否更好?投资人可能更倾向于投资全职创业的教授。
张亚勤:第一种模式已有成功案例。例如,高通公司由两位麻省理工学院的教授创立;AIR的彭建教授全职创立了华深智药,在AI制药领域取得了优异成绩。然而,**绝大多数教授并不适合运营一家公司,即使全职投入,教授担任CEO创业的失败率也远高于普通创业者。这一点在中美两国都是普遍现象。**将研究转化为技术,再将技术转化为产品并实现规模化推广,这中间存在巨大的鸿沟。极少有人既精通前沿研究,能从零到一,又熟悉市场和商业化运作,能从一到N。
AIR教授创业大部分遵循第二种模式:科学家凭借其卓越的研究和技术,作为联合创始人或首席科学家参与孵化企业,以技术入股。同时,企业聘请具备商业和工程管理能力的CEO,按照市场化方式运营。这种模式能够发挥教授的优势,并兼顾企业的实际发展需求,是一种相对理想的模式。
暗涌:全职创业一旦成功,回报会非常丰厚。
张亚勤:全职创业的风险同样巨大,可能最终商业运作不成功,科研也受到影响。来到AIR的教授绝大多数是出于科研目的,希望将有价值的基础研究成果产业化,并最好有团队协助他们完成产业化。我也更倾向于在学校进行科研工作和人才培养,我们学院有三位博士生曾获得清华特等奖学金。AIR的定位是一家科研机构,而非孵化器。孵化器通常会同时孵化大量项目,依靠风险投资机制和规模效应取胜,而我们每年仅孵化一两个公司。
暗涌:AIR的目标之一是为行业输送CTO和顶级架构师,您认为培养这类人才的核心要素是什么?
张亚勤:核心在于在成长过程中培养产品和系统思维。仅仅在校园里,缺乏真实场景和数据,博士生可以完成算法研究和论文撰写。但关键在于验证这些研究成果能否在实际系统中运行。这也是AIR成立的初衷之一。我们与字节跳动、阿里巴巴、百度、比亚迪等二十多家大型企业合作,通过联合实验室等方式开展科研项目。AIR的许多学生有机会到这些大公司实习,参与最前沿的研发系统,并进行规模化验证。
暗涌:适合担任创业公司CEO的人才非常稀缺。您会帮助孵化公司寻找CEO吗?您偏好什么样的CEO画像?
张亚勤:创业初期,在技术孵化阶段,教授可以兼顾部分公司管理工作。最困难的是下一步,即找到一位CEO来搭建工程团队和商业模式。目前我们孵化的多数企业正处于从第一阶段向第二阶段过渡的“证明自己”的时期。**理想情况下,我希望能为每个团队匹配一位合适的CEO,但实际上,我真的无法做到(笑)。**
CEO不一定是职业经理人,也可以是连续创业者,或者是科研团队中的年轻骨干。目前AI领域的人才相对容易找到,难得的是那些在产业界有深厚根基,既具备产业经验又能理解部分AI技术的人。最关键的是这个人必须拥有极其坚定的信念,因为创业过程中一定会遇到诸多困难,有些人会在艰难时刻动摇。没有信念,几乎不可能成功。
我想再次强调,不能将创业想得过于简单。像1500亿元这样的估值数字,其实意义不大。企业最终需要依靠技术实现商业化,产生收入和利润,并建立起核心竞争力。
第二部分:AI并非泡沫,但AI公司可能存在泡沫
暗涌:创业公司获得高估值,这应被视为阶段性成果,但您似乎对此保持高度警惕?
张亚勤:我看到的是一种风险。市场期望越高,你需要证明的东西就越多,这个阶段必须保持清醒。在学院里,我常常会给学生泼冷水,(在他们成立公司前)会反复追问:你们到底要解决什么问题?人工智能能解决什么?谁来为你们的产品付费?短期内获得高估值,并不能代表已经成功。
例如,**当前机器人赛道拥有数百家公司,但可能在三到四年后,只会剩下约20家。大模型赛道,最终国内可能也只会剩下三到四家。**我们经历过互联网泡沫,当时资本市场的狂热程度甚至超过现在,但许多明星公司迅速从市场上消失了。
暗涌:这种审慎的态度,是否与“趁着市场好,多融资”的逻辑相悖?
张亚勤:创业确实需要充足的资金,但资金并非最关键的因素。创业公司本来就是九死一生,必须高度聚焦。如果尚未想清楚就获取大量资金,试图“什么都干”,那么在更多情况下,结果将是资金耗尽,业务却未能取得实质性进展。当一家企业拥有真正优秀的产品、独特的技术、强大的团队和清晰的发展前景时,自然会吸引到投资者。
暗涌:人人都谈论AI和具身智能行业的泡沫,但大家仍旧义无反顾地涌入。这种氛围与上一轮互联网创业有相似之处,但又存在显著差异。
张亚勤:不同之处在于,大多数互联网公司在初期并没有规模化收入,而本轮AI领域的头部公司收入增长迅速。例如OpenAI和Anthropic的收入增速达到了前所未有的水平,这增强了市场对AI的信心。然而,我并不确定这种高增长能否持续。
目前全球几家科技巨头在数据中心和芯片等领域投入巨大,这也是基于对未来的高度预期——认为这些投入能够带来回报。这些巨额投入最终能否转化为订单和收入,仍有待验证。**未来两到三年将是关键的观察期,如果(巨头的)收入增长未能达到当前预期的指数曲线,这个循环就会受到影响。**大公司会受到冲击,而小型企业则会更加敏感。
暗涌:如果以互联网技术周期来类比,您认为现在AI大致处于哪个阶段?
张亚勤:可能相当于1998年或1999年,互联网刚刚兴起,雅虎备受追捧的时期。互联网本身并非泡沫,但早期许多互联网企业存在泡沫。从长远来看,人工智能产业不会有泡沫,但人工智能公司和其估值可能会存在泡沫。短期的资本炒作没有实际意义。企业经营者仍需专注于核心业务,愿意承担艰苦的工作,并用实际成果证明自身价值。
第三部分:让机器人先承担繁重、危险的工作
暗涌:您此前提到,机器人尚未迎来“ChatGPT时刻”,通用机器人可能还需要10到15年。这期间的关键瓶颈是什么?
张亚勤:通用家庭服务机器人确实还需要很长时间,可能超过十年。然而,在特定场景下执行具体任务的机器人则可以更快实现。例如,自动驾驶本质上是“驾驶机器人”,其技术难点已基本克服,剩余的更多是工程化和商业化问题。工业机器人的发展进程也会更快。
家庭机器人需要面对极其开放和复杂的环境,最关键的是需要与人进行交互:与人交流、理解人的意图,并准确执行动作。这些方面仍存在一些尚未解决的科学问题,理论和算法尚未取得根本性突破。
暗涌:为何物理世界的人工智能发展相对缓慢?
张亚勤:十年前,我就将智能分为三类:数字智能、物理智能和生物智能。数字智能发展迅速,是因为过去二十多年互联网积累了海量数据,文本、图像、视频等数据能够用于训练模型,遵循“规模法则”(scaling law)。加上算法和算力的进步,模型的通用能力得以增强。然而,物理世界的情况截然不同。首先,我们缺乏足够的数据;其次,物理世界的场景极其分散;第三,数字世界的“比特”需要与物理世界的“原子”相结合。“原子世界”并不遵循摩尔定律。关节、手等机械结构的控制,也并非简单堆砌算力就能解决。因此,物理智能的进展会相对缓慢。
在数据不足的情况下,有几种解决方案:一是像人类一样,从第一人称视角收集人与世界交互的数据;二是让机器人自行采集数据;三是在仿真环境中模拟各种场景,生成合成数据。然而,在模拟器中成功运行的算法,在真实世界中不一定有效。因此,我们正在探索RSR(Real-to-Sim-to-Real)方法,即从真实世界到模拟场景,再回到真实世界,形成一个闭环。这个闭环非常困难,AIR的周谷越教授在该方向已研究多年,并有望在特定场景下取得快速突破。
暗涌:面对物理世界数据缺失的挑战,目前有哪些可行的技术路线?现在关于VLA和世界模型的讨论非常热烈。
张亚勤:目前已有一些方法,但尚未能像互联网那样收集到海量数据。一种方式是将大语言模型的方法论扩展到能够处理自然语言、理解视觉信息并操控物理动作的VLA(Vision-Language-Action)模型。这种路线的好处在于以语言为主线,可以借鉴当前大语言模型已形成的方法论;但问题在于,动作往往难以用语言精确描述。对机器人而言,视觉是最重要的输入,因此另一种思路是从视觉直接生成动作,将语言作为辅助。
另一条路径是世界模型。世界模型也有多种类型,其构想是希望机器能够真正理解世界。理解世界的方式多种多样,例如构建模拟器等。我认为最终的解决方案可能是这两种路线的结合。
暗涌:如何理解“两种路线的结合”?
张亚勤:无论是开发VLA模型还是各种世界模型,我认为都没有绝对的对错。将两种路线结合,是因为机器人所面对的环境极其复杂。例如,自动驾驶过程更像是一个以视觉为主的端到端系统,并不需要太多语言交互。但机器人很多时候需要通过与人对话来接收指令,需要理解语言;在执行任务时,则主要依赖视觉进行决策,并将决策转化为电机驱动信号。这个过程目前还没有明确的“规模法则”可循。
在语言模型中,token(词元)是人类抽象的、有结构有意义的文字单位。但图像的最小物理单元是像素,单个像素本身没有物理意义;动作也是同样的道理。AIR的老师们进行了大量探索,詹仙园团队研发的X-VLA系统,尝试将不同机械臂和机器人的能力进行“归一化”处理,以实现部分技能的可泛化和跨设备迁移。也有团队让模型观看大量视频,以理解视频中的动作和环境。在许多科研问题尚未突破的情况下,一方面需要继续进行通用性研究,另一方面也要在通用性要求不那么高的特定场景中,着手解决实际问题。
暗涌:目前机器人可以率先应用于哪些场景?
张亚勤:我认为机器人应首先在实际生产力场景中应用,承担人类不愿从事的工作,例如在极其危险或艰苦的环境中作业。例如,我们目前正与煤科院合作,开发煤矿场景下的无人车和机器人;与首创集团合作,开发地下管网巡检机器人和电网机器人等。在这些场景中,目前仍需要人机协作。我一直强调,人工智能和具身智能的目的是帮助人类,而不是一开始就取代人类的工作。
暗涌:当前AI领域存在一种趋势,即不断追求“超级智能”和“通用人工智能”。但听您的观点,您似乎并不认为这是目前最重要的事情?
张亚勤:作为科研目标,这当然是可以追求的。但从社会和企业的角度来看,我认为仍需解决具体问题。一些美国企业开始陷入误区,一味追求智能的上限,仿佛拥有了“超级智能”就能无所不能。然而,如果没有明确的目标,仅仅是“模仿人类、超越人类”,其风险往往是不可控的。而且,人工智能是否一定要“模仿人类”,一定要“超越人类”?我认为未必。
人类有优秀的一面,也有固有的缺陷;人工智能在放大能力的同时,也会放大人性中负面的一面。这带来了安全和伦理风险。
暗涌:您特别关注AI可能存在的哪些风险?
张亚勤:当前人工智能主要存在三类风险:失控、滥用和系统性风险。系统性风险也包括失业等社会问题,但我目前更关注失控和滥用。人工智能系统日益复杂,许多机制对人类来说是未知的黑箱。而且,具备行动能力的Agent正从实验室走向实际部署,存在自主复制、逃逸约束等现实隐患。2026年4月,Anthropic披露了模型Claude Mythos,但未对公众开放,原因在于Mythos能够自主识别软件漏洞,存在引发大规模网络攻击的风险。
因此,在设计AI产品和技术时,就应明确其要解决的具体问题,这样AI的可控性会更强。人工智能最终是为了帮助人类,让人们的生活更长久、更舒适、更幸福。

资深玩家
平台定期更新版本,优化用户体验,并提供详尽的新手指南和玩法规则介绍。遇到任何问题,我们的客服团队随时为您解答。
匿名玩家
通过我们的官方网站,您可以轻松下载正版WPK微扑克客户端。我们保证软件安全可靠,让您放心畅玩。