对话张亚勤：AI不是泡沫，但AI公司有泡沫

海若镜采访海若镜、巴芮

在清华无锡研究院智能产业创新中心，张亚勤院士在盛夏时节接受了采访。他抵达时，立即提议降低室内温度。

在谈话中，张亚勤对当前围绕具身智能和人工智能投资创业的热潮表示，需要“降温”，并呼吁“更冷静些，不要急躁”。

五年前，张亚勤创立了清华大学智能产业研究院（AIR）。该研究院汇集了多位在人工智能产业拥有丰富经验的知名教授。据了解，AIR的首届博士生已顺利毕业，其孵化的十家公司已累计获得约150亿元人民币的融资，总估值达到1500亿元人民币。其中，华深智药和它石智航等独角兽企业在资本市场获得了高度关注。

尽管1500亿元的估值是一个显著的数字，张亚勤强调AIR的首要任务是进行科学研究，公司孵化只是自然而然的衍生结果，并且多数公司仍处于“证明自身能力”的阶段。

作为中国工程院院士和国内最年轻的IEEE fellow之一，张亚勤曾经历技术革命与资本周期的起伏。他认为，当前人工智能的发展阶段类似于1998年至1999年的互联网时代，正处于大规模投资基础设施（包括电力、算力和算法）的关键时期。他相信，从长远来看，人工智能产业具有巨大的潜力，并指出“人工智能本身没有泡沫，但早期的人工智能公司可能会存在泡沫”。他预测，未来万亿市值的巨头可能并非当前备受瞩目的公司。

到2026年，“物理人工智能”已成为技术开发和资本投资的热点。在过去五年里，张亚勤及其团队已在自动驾驶、具身智能仿真和工业能效人工智能等领域布局了多家公司。对于“趁着市场热潮积极融资”的普遍做法，他直言，过多的融资可能导致业务分散，最终耗尽资金却未能转化为实际业绩。

近年来，张亚勤每年都会就人工智能的发展趋势提出预测。例如，在2024年6月，他提出了开发新的AI算法体系的需求，包括世界模型和Agent，以实现效率的百倍提升。他解释了当前AI与1998年互联网的相似之处，讨论了面向物理世界AI数据缺失的问题，以及VLA和世界模型技术路线的结合方式，并分享了对教授创业的看法。

自2024年起，AIR每年6月在无锡举办“太湖对话”论坛，今年已是第三届。以下是论坛前夕张亚勤与暗涌Waves的对话内容（已编辑）。

第一部分：教授重回创业前沿，但多数不适合担任CEO

暗涌：三年前，投资界还在反思“不投教授”。在新一轮具身智能和AI创业热潮中，科学家又重新站在了舞台中央，您如何看待“教授创业”？

张亚勤：本轮AI创业高度依赖技术，因此教授的技术能力和创新理念至关重要。目前，中国涌现出一批高水平教授，他们能够引领世界级的、主流的创新，而不再仅仅是跟随。科学家创业有三种模式：第一种是教授全职投入创业，离开学术界；第二种是教授以学术研究为主，将优秀的研究成果和技术转化为企业，但不直接管理公司，由市场化团队运营；第三种是教授仍在高校任职，同时管理多家公司。第三种模式通常难以成功。

暗涌：第一、二种模式是否更好？投资人可能更倾向于投资全职创业的教授。

张亚勤：第一种模式已有成功案例。例如，高通公司由两位麻省理工学院的教授创立；AIR的彭建教授全职创立了华深智药，在AI制药领域取得了优异成绩。然而，**绝大多数教授并不适合运营一家公司，即使全职投入，教授担任CEO创业的失败率也远高于普通创业者。这一点在中美两国都是普遍现象。**将研究转化为技术，再将技术转化为产品并实现规模化推广，这中间存在巨大的鸿沟。极少有人既精通前沿研究，能从零到一，又熟悉市场和商业化运作，能从一到N。

AIR教授创业大部分遵循第二种模式：科学家凭借其卓越的研究和技术，作为联合创始人或首席科学家参与孵化企业，以技术入股。同时，企业聘请具备商业和工程管理能力的CEO，按照市场化方式运营。这种模式能够发挥教授的优势，并兼顾企业的实际发展需求，是一种相对理想的模式。

暗涌：全职创业一旦成功，回报会非常丰厚。

张亚勤：全职创业的风险同样巨大，可能最终商业运作不成功，科研也受到影响。来到AIR的教授绝大多数是出于科研目的，希望将有价值的基础研究成果产业化，并最好有团队协助他们完成产业化。我也更倾向于在学校进行科研工作和人才培养，我们学院有三位博士生曾获得清华特等奖学金。AIR的定位是一家科研机构，而非孵化器。孵化器通常会同时孵化大量项目，依靠风险投资机制和规模效应取胜，而我们每年仅孵化一两个公司。

暗涌：AIR的目标之一是为行业输送CTO和顶级架构师，您认为培养这类人才的核心要素是什么？

张亚勤：核心在于在成长过程中培养产品和系统思维。仅仅在校园里，缺乏真实场景和数据，博士生可以完成算法研究和论文撰写。但关键在于验证这些研究成果能否在实际系统中运行。这也是AIR成立的初衷之一。我们与字节跳动、阿里巴巴、百度、比亚迪等二十多家大型企业合作，通过联合实验室等方式开展科研项目。AIR的许多学生有机会到这些大公司实习，参与最前沿的研发系统，并进行规模化验证。

暗涌：适合担任创业公司CEO的人才非常稀缺。您会帮助孵化公司寻找CEO吗？您偏好什么样的CEO画像？

张亚勤：创业初期，在技术孵化阶段，教授可以兼顾部分公司管理工作。最困难的是下一步，即找到一位CEO来搭建工程团队和商业模式。目前我们孵化的多数企业正处于从第一阶段向第二阶段过渡的“证明自己”的时期。**理想情况下，我希望能为每个团队匹配一位合适的CEO，但实际上，我真的无法做到（笑）。**

CEO不一定是职业经理人，也可以是连续创业者，或者是科研团队中的年轻骨干。目前AI领域的人才相对容易找到，难得的是那些在产业界有深厚根基，既具备产业经验又能理解部分AI技术的人。最关键的是这个人必须拥有极其坚定的信念，因为创业过程中一定会遇到诸多困难，有些人会在艰难时刻动摇。没有信念，几乎不可能成功。

我想再次强调，不能将创业想得过于简单。像1500亿元这样的估值数字，其实意义不大。企业最终需要依靠技术实现商业化，产生收入和利润，并建立起核心竞争力。

第二部分：AI并非泡沫，但AI公司可能存在泡沫

暗涌：创业公司获得高估值，这应被视为阶段性成果，但您似乎对此保持高度警惕？

张亚勤：我看到的是一种风险。市场期望越高，你需要证明的东西就越多，这个阶段必须保持清醒。在学院里，我常常会给学生泼冷水，（在他们成立公司前）会反复追问：你们到底要解决什么问题？人工智能能解决什么？谁来为你们的产品付费？短期内获得高估值，并不能代表已经成功。

例如，**当前机器人赛道拥有数百家公司，但可能在三到四年后，只会剩下约20家。大模型赛道，最终国内可能也只会剩下三到四家。**我们经历过互联网泡沫，当时资本市场的狂热程度甚至超过现在，但许多明星公司迅速从市场上消失了。

暗涌：这种审慎的态度，是否与“趁着市场好，多融资”的逻辑相悖？

张亚勤：创业确实需要充足的资金，但资金并非最关键的因素。创业公司本来就是九死一生，必须高度聚焦。如果尚未想清楚就获取大量资金，试图“什么都干”，那么在更多情况下，结果将是资金耗尽，业务却未能取得实质性进展。当一家企业拥有真正优秀的产品、独特的技术、强大的团队和清晰的发展前景时，自然会吸引到投资者。

暗涌：人人都谈论AI和具身智能行业的泡沫，但大家仍旧义无反顾地涌入。这种氛围与上一轮互联网创业有相似之处，但又存在显著差异。

张亚勤：不同之处在于，大多数互联网公司在初期并没有规模化收入，而本轮AI领域的头部公司收入增长迅速。例如OpenAI和Anthropic的收入增速达到了前所未有的水平，这增强了市场对AI的信心。然而，我并不确定这种高增长能否持续。

目前全球几家科技巨头在数据中心和芯片等领域投入巨大，这也是基于对未来的高度预期——认为这些投入能够带来回报。这些巨额投入最终能否转化为订单和收入，仍有待验证。**未来两到三年将是关键的观察期，如果（巨头的）收入增长未能达到当前预期的指数曲线，这个循环就会受到影响。**大公司会受到冲击，而小型企业则会更加敏感。

暗涌：如果以互联网技术周期来类比，您认为现在AI大致处于哪个阶段？

张亚勤：可能相当于1998年或1999年，互联网刚刚兴起，雅虎备受追捧的时期。互联网本身并非泡沫，但早期许多互联网企业存在泡沫。从长远来看，人工智能产业不会有泡沫，但人工智能公司和其估值可能会存在泡沫。短期的资本炒作没有实际意义。企业经营者仍需专注于核心业务，愿意承担艰苦的工作，并用实际成果证明自身价值。

第三部分：让机器人先承担繁重、危险的工作

暗涌：您此前提到，机器人尚未迎来“ChatGPT时刻”，通用机器人可能还需要10到15年。这期间的关键瓶颈是什么？

张亚勤：通用家庭服务机器人确实还需要很长时间，可能超过十年。然而，在特定场景下执行具体任务的机器人则可以更快实现。例如，自动驾驶本质上是“驾驶机器人”，其技术难点已基本克服，剩余的更多是工程化和商业化问题。工业机器人的发展进程也会更快。

家庭机器人需要面对极其开放和复杂的环境，最关键的是需要与人进行交互：与人交流、理解人的意图，并准确执行动作。这些方面仍存在一些尚未解决的科学问题，理论和算法尚未取得根本性突破。

暗涌：为何物理世界的人工智能发展相对缓慢？

张亚勤：十年前，我就将智能分为三类：数字智能、物理智能和生物智能。数字智能发展迅速，是因为过去二十多年互联网积累了海量数据，文本、图像、视频等数据能够用于训练模型，遵循“规模法则”（scaling law）。加上算法和算力的进步，模型的通用能力得以增强。然而，物理世界的情况截然不同。首先，我们缺乏足够的数据；其次，物理世界的场景极其分散；第三，数字世界的“比特”需要与物理世界的“原子”相结合。“原子世界”并不遵循摩尔定律。关节、手等机械结构的控制，也并非简单堆砌算力就能解决。因此，物理智能的进展会相对缓慢。

在数据不足的情况下，有几种解决方案：一是像人类一样，从第一人称视角收集人与世界交互的数据；二是让机器人自行采集数据；三是在仿真环境中模拟各种场景，生成合成数据。然而，在模拟器中成功运行的算法，在真实世界中不一定有效。因此，我们正在探索RSR（Real-to-Sim-to-Real）方法，即从真实世界到模拟场景，再回到真实世界，形成一个闭环。这个闭环非常困难，AIR的周谷越教授在该方向已研究多年，并有望在特定场景下取得快速突破。

暗涌：面对物理世界数据缺失的挑战，目前有哪些可行的技术路线？现在关于VLA和世界模型的讨论非常热烈。

张亚勤：目前已有一些方法，但尚未能像互联网那样收集到海量数据。一种方式是将大语言模型的方法论扩展到能够处理自然语言、理解视觉信息并操控物理动作的VLA（Vision-Language-Action）模型。这种路线的好处在于以语言为主线，可以借鉴当前大语言模型已形成的方法论；但问题在于，动作往往难以用语言精确描述。对机器人而言，视觉是最重要的输入，因此另一种思路是从视觉直接生成动作，将语言作为辅助。

另一条路径是世界模型。世界模型也有多种类型，其构想是希望机器能够真正理解世界。理解世界的方式多种多样，例如构建模拟器等。我认为最终的解决方案可能是这两种路线的结合。

暗涌：如何理解“两种路线的结合”？

张亚勤：无论是开发VLA模型还是各种世界模型，我认为都没有绝对的对错。将两种路线结合，是因为机器人所面对的环境极其复杂。例如，自动驾驶过程更像是一个以视觉为主的端到端系统，并不需要太多语言交互。但机器人很多时候需要通过与人对话来接收指令，需要理解语言；在执行任务时，则主要依赖视觉进行决策，并将决策转化为电机驱动信号。这个过程目前还没有明确的“规模法则”可循。

在语言模型中，token（词元）是人类抽象的、有结构有意义的文字单位。但图像的最小物理单元是像素，单个像素本身没有物理意义；动作也是同样的道理。AIR的老师们进行了大量探索，詹仙园团队研发的X-VLA系统，尝试将不同机械臂和机器人的能力进行“归一化”处理，以实现部分技能的可泛化和跨设备迁移。也有团队让模型观看大量视频，以理解视频中的动作和环境。在许多科研问题尚未突破的情况下，一方面需要继续进行通用性研究，另一方面也要在通用性要求不那么高的特定场景中，着手解决实际问题。

暗涌：目前机器人可以率先应用于哪些场景？

张亚勤：我认为机器人应首先在实际生产力场景中应用，承担人类不愿从事的工作，例如在极其危险或艰苦的环境中作业。例如，我们目前正与煤科院合作，开发煤矿场景下的无人车和机器人；与首创集团合作，开发地下管网巡检机器人和电网机器人等。在这些场景中，目前仍需要人机协作。我一直强调，人工智能和具身智能的目的是帮助人类，而不是一开始就取代人类的工作。

暗涌：当前AI领域存在一种趋势，即不断追求“超级智能”和“通用人工智能”。但听您的观点，您似乎并不认为这是目前最重要的事情？

张亚勤：作为科研目标，这当然是可以追求的。但从社会和企业的角度来看，我认为仍需解决具体问题。一些美国企业开始陷入误区，一味追求智能的上限，仿佛拥有了“超级智能”就能无所不能。然而，如果没有明确的目标，仅仅是“模仿人类、超越人类”，其风险往往是不可控的。而且，人工智能是否一定要“模仿人类”，一定要“超越人类”？我认为未必。

人类有优秀的一面，也有固有的缺陷；人工智能在放大能力的同时，也会放大人性中负面的一面。这带来了安全和伦理风险。

暗涌：您特别关注AI可能存在的哪些风险？

张亚勤：当前人工智能主要存在三类风险：失控、滥用和系统性风险。系统性风险也包括失业等社会问题，但我目前更关注失控和滥用。人工智能系统日益复杂，许多机制对人类来说是未知的黑箱。而且，具备行动能力的Agent正从实验室走向实际部署，存在自主复制、逃逸约束等现实隐患。2026年4月，Anthropic披露了模型Claude Mythos，但未对公众开放，原因在于Mythos能够自主识别软件漏洞，存在引发大规模网络攻击的风险。

因此，在设计AI产品和技术时，就应明确其要解决的具体问题，这样AI的可控性会更强。人工智能最终是为了帮助人类，让人们的生活更长久、更舒适、更幸福。

第一部分：教授重回创业前沿，但多数不适合担任CEO

第二部分：AI并非泡沫，但AI公司可能存在泡沫

第三部分：让机器人先承担繁重、危险的工作

玩家评论

发表您的看法

最新动态

对话张亚勤：AI不是泡沫，但AI公司有泡沫

第一部分：教授重回创业前沿，但多数不适合担任CEO

第二部分：AI并非泡沫，但AI公司可能存在泡沫

第三部分：让机器人先承担繁重、危险的工作

玩家评论

发表您的看法