人工智能身外化身的未来,我们与宇树科技创始人王兴兴聊了聊丨【经纬低调推公司】

· 被投企业

以下文章来源于经纬创投 ,作者经纬创投主页君

英伟达创始人黄仁勋在ITF2023年半导体大会上表示,下一波人工智能浪潮是 “具身人工智能”,即存在实体、并支持物理交互的智能体,可以像人一样交互感知环境,进行自主的决策和行动。机器人作为“具身人工智能”的理想载体,有望引领AI变革的其中一个新方向。

机器人产业发展已久,传统机器人已形成千亿规模的赛道。其中以人形机器人为代表的双足机器人备受关注,马斯克甚至表示特斯拉的长期价值或在于人形机器人。事实上,双足机器人与四足机器人同属足式机器人,后者特别展现出巨大的商业价值和社会价值。四足机器人与双足机器人相比,具备更高的载荷能力和极强的平衡能力,也更易于控制、设计和维护,在工业端和消费端等都有广泛的应用场景,尤其能在一些危险场景代替人类进行作业。

宇树科技成立于2016年,是一家专注于消费级、行业级高性能四足机器人、灵巧机械臂自主研发、生产及销售的世界知名机器人公司,是全球最早公开零售高性能四足机器人和最早实现四足机器人行业落地的公司,并且在赛道竞争日益激烈的情况下,保持全球历年销量领先。

也许你曾见过在牛年春晚上齐舞的机器牛犇犇,上班跳舞下班拉盒饭的它们,正是来自宇树科技的“最强打工牛”。除了2021牛年央视春晚,宇树科技还受邀参加了2022冬奥会开幕式、2023 Super Bowl(美国春晚)赛前表演等。而宇树科技的四足机器人绝不止在舞台登场,在工业、消防、巡检等行业也有广泛应用,在一些危险场景代替人类进行作业。宇树科技创始人兼CEO王兴兴希望,未来它们能够成为人类日常生活中的伙伴。

宇树高度重视自主研发和科技创新,全自研电机、减速器、控制器、激光雷达等机器人关键核心零部件和高性能感知及运动控制算法,整合机器人全产业链,在四足机器人领域达到全球技术领先。目前累计申请国内专利150余项,授权专利100余项,是国家高新技术认证企业。四足机器人之外,宇树科技也在稳步推进人形机器人、通用机器人等的研发和应用。

今天这篇文章我们专访了宇树科技创始人兼CEO王兴兴,聊聊他怎样走上四足机器人研发这条道路,又将如何在这个有着无限可能的领域继续开拓向前。以下,Enjoy:

broken image

1

成立4年即登上春晚舞台,

宇树打工牛与春晚有什么故事?

 

经纬:

宇树曾受邀参加2021牛年央视春晚、2022冬奥会开幕式、2023 Super Bowl(美国春晚)赛前表演。这些大型活动的展示机会是如何获得的?

王兴兴:

以春晚为例, 2021年2月,宇树24台A1以小牛“犇犇”的形象登录央视牛年春晚,与刘德华、王一博、关晓彤同台演出《牛起来》,这是目前人类顶级足式机器人技术与中国传统生肖文化的深度交融,也是全球首次四足机器人动态走位集群舞蹈表演,引发了全民热议。

broken image

2020年中旬的时候,我们发布了一款可以跳舞的机器人。春晚导演邀请我们进行几十台小牛的集群舞台表演,为了实现最佳效果,导演把国内外所有四足机器人的公司都联系了一遍。

这场演出难度很高,需要几十台机器人进行全自动编队走位及舞蹈,同时配合音乐的节奏,还穿插后空翻、太空步等等表演。我们最初接手时也不是很有信心,集中精力在春晚后台驻扎了一个月,最后实现了较好的舞台效果。

舞台灯光复杂、演员众多,几十只机器牛进行群舞,动态定位是个大问题。我们尝试了很多种方案之后,决定自研制全局定位系统。在当时已经较为成熟的二维码识别、红外背光等技术的基础上,宇树为机器牛成功定制了一套全局定位系统。当时是疫情期间,很多东西买起来都很麻烦,高清高速工业相机等等也是加急调配过来的。在现场的时候有一台计算机出问题,又在北京买了一台主控计算机。

为了配合牛年春晚的喜庆氛围,宇树设计了一套带有牛年元素的机器牛外壳。由于定稿较晚,找到工厂的过程也比较辛苦,公司还派员工从杭州到深圳去帮忙生产。第一次整体彩排前一天,机器牛表演用的外壳服饰才到位。

broken image

历经种种,宇树克服了超大舞台的厘米级(甚至毫米级)实时移动定位问题、舞台强电磁干扰情况下的多机无线通讯问题、机器人穿上整套靓丽服装,整机过重,后空翻动力不足问题(整机动力学参数改变)、滑玻璃舞台的后空翻足端打滑问题等等,表演效果远超预期。

broken image

当时宇树上了微博热搜第一,得到央视等官方媒体的广泛报道。除夕过后的几个小时,宇树的机器牛以黑色本体出现在春晚后台(脱掉了表演用的外壳服饰)拉盒饭的视频,在微博爆发性地火了起来,各大媒体都趣味性地引用报道了一下。

broken image

登上春晚对于宇树是很大的荣誉,可以认为目前在央视层面、中国层面、海外层面,宇树基本上都代表了目前国内最顶级的移动机器人技术。后续的冬奥会、建党一百周年央视采访、二十大成果展,宇树都代表杭州、浙江参与,文化方面影响很大。 

 

2

如何在早期确立四足机器人的方向,

实现高质量自主研发,并获得头部客户?

 

经纬:宇树为什么选择四足机器人作为核心产品?与其他机器人相比,四足机器人为什么脱颖而出?

王兴兴:

我在本科就读期间有制作小型人形机器人的尝试,后来在上海大学读硕士期间,全球开创性地独立开发了使用低成本外转子无刷电机驱动的

全自由度高性能四足机器人XDog。

整个初代产品的研发包括了四足机器人控制的仿真验证、永磁同步电机的选型、电机驱动板的设计及驱动程序的开发、主从控制架构的设计、单腿设计及测试和整机控制程序的开发与测试。

这套低成本方案,已经成为国际最主流四足机器人发展方向。

2015年,XDog获得了上海市星创师智能创业大赛的二等奖,及八万元的奖金,而整个机器人的研发投入大约是1-2万元。次年,我在硕士期间及毕业答辩后公布的机器人测试视频幸运地在网络走红,得到国内外媒体广泛报道,我收到了很多购买需求和投资意愿,并判断出来创业的时机基本成熟,于是辞职毅然决然创业。

目前四足机器人已经实现行业落地应用,技术相对成熟,产品相对实用。而人形机器人处于早期阶段,技术成熟度相对欠缺。目前宇树也在开发新的人形机器人相关产品,虽然不考虑在两到三年内马上落地,但这将是宇树未来五到十年的其中一个发展方向。四足机器人短期内更有价值,人形机器人需要更长周期,二者之间很多技术是共用的。

 

经纬:四足机器人吸引了众多初创公司和大厂入局。相对其他国内外的四足机器人公司,宇树的竞争壁垒与相对优势在哪里?宇树如何在创业初期,就获得了很多头部客户的订单,包括谷歌、英伟达、Facebook等海外巨头科技企业。作为一家创业公司,宇树是如何获取头部客户的?

王兴兴:核心在于技术前端性和产品前端性。宇树的行业技术方案、市场化方向都属全球最早,是四足机器人领域的开创性公司,行业影响力在国内外得到认可。

broken image

此外,很重要的一点是,依靠中国的硬件生产制造优势,宇树在全球范围具备很强的性价比优势。公司在保证性能和可靠性和情况下,对降本增效非常重视。成本方面,研发成本可以摊薄。我们的产品是独立研发而非依赖开源代码,底层的很多算法来自于我在学生时期编写的程序。机器人核心的成本计算逻辑是,材料成本加一部分加工成本,所有超过这部分的成本核算,逻辑上一定不合理,就需要进行调整改善。

宇树的整套硬件方案跟波士顿动力等公司差别非常大,软件也存在一些差别。宇树在硬件和软件上已经形成专门团队,持续优化打磨自己的产品,相关产线以及零部件产业链都在不断地优化与升级。综合参数方面,我们各有千秋。价格上,宇树优势显著。

 

经纬:行业有很多开源的四足机器人项目,所以四足项目可以在开源的成果上去快速迭代升级,集中精力攻克运动控制和视觉问题。很多公司是在MIT Cheetah开源代码的基础上进行产品设计,而宇树选择独立研发。宇树的研发能力非常强,机械臂、激光雷达等填补了行业一些解决方案的空白,公司是如何实现多部件的自主研发?

王兴兴:我们有专门攻坚技术方案的团队,对于机械臂、激光雷达等常规产品,通常先研究目前常规技术方案的实现路径,再不断试错、对产品迭代,然后解决量产、一致化、可靠性等的问题,还有长时间测试、生产制造工艺优化等问题。研发上述有一定技术门槛的硬件相对耗时,做一个demo可能就需要半年到一年的时间,产品从研发到实现量产的周期比较长。以激光雷达为例,传统的激光雷达大部分是车用的,并不完全适配四足机器人等低速的移动机器人。四足机器人移动的速度非常低,对雷达的距离要求只有几十米;但是对成本、视场角的要求比较大,需要尽可能避免视野盲区,同时保证较低成本。一个消费机器人或商用机器人销售价格大约在一万元到几万元不等,激光雷达的价格如果达到几千甚至上万,就会提高相应成本。因此宇树决定自研适合四足机器人的激光雷达。

broken image

灵巧机械臂Z1

宇树自研的激光雷达有几个特点:第一是成本低,达到同样效果,只需不到1/10的价格;第二是参数和市面上的雷达不太一样,体积仅有75*75*65mm,重230g,可集成到不同的设备和应用场景中,拥有超低盲区,最小探测距离低至0.05m,可以帮助移动机器人实现无盲区覆盖,有效抵抗室内环境光和室外强光干扰,能在室外100Klux的强光下,实现高精度建图,比较适合低速机器人。这也是差异化竞争的一个方向。

broken image

业界首款全向超广角4D激光雷达Unitree 4D LiDAR L1

 

3

ToB、ToC和教育端多线并行,
宇树如何构建产品体系?


经纬:宇树推出了很多应用于ToB和ToC各个层面的四足机器人产品,可执行消防救援、电力巡检等多任务,还推出了健身泵Unitree PUMP,在体育产业展现风采。宇树在规划一个新产品前有怎样的考量,如何决定下一个产品的研发方向?如何构建产品体系?

王兴兴:宇树从2017年就开始推进高性能四足机器人的行业落地应用,被广泛应用在农业、工业领域,以及特定的安防巡检、勘测探索、公共救援、医疗防疫陪护等重磅行业中提供强有力支持。

broken image

消防机器人

产品迭代的方向目前多来自于客户反馈,我们倾向于市场容量大的、难度相对不高的领域。宇树的产品覆盖面很广,提供从万元机器人到上百万的机器人的解决方案。早年主要卖本体,客户会进行改装或功能添加。

broken image

行业端,宇树推出巡检解决方案、消防解决方案等解决方案,在本体上再根据行业需求叠加传感器等实现新功能,并提高其续航、负载等能力。比如宇树的B1工业机器狗,就可以搭载气体传感、温度传感、5G组网、红外云台、工业相机、3D雷达等外设,实现其在作业过程中的多维感知和强劲算力,帮助其迅速识别环境风险,检测出放射性物质、有毒气体等,提升作业精确率和效率。

broken image

工业级四足机器人B1

消费端,宇树每年会循序渐进添加一些AI交互等好玩的、智能化的功能。宇树在算法领域沉淀多年,已经在多个大型活动中证明了算法的先进性,产品不断刷新消费级与专业级的创新体验。但是机器人目前还是很难迈进纯消费端,马斯克的人形机器人也仅限于在自家工厂内部使用。与ToC端相比,ToB端的购买能力会更强。

broken image

人类科技史上首款真正走入大众生活的移动机器人宇树科技Go1

 

经纬:宇树科技的商业模式是怎样的?如何触及不同需求的客户,行业客户最看重什么?

王兴兴:宇树目前的商业模式是——提供不同功能、不同零售价格的产品,以触及不同需求的客户,客户覆盖ToB、ToC和教育端。

教育端是指科研院校有一些教学、科研方面的需求;ToB端是指产品被广泛应用在农业、工业领域,以及特定的安防巡检、勘测探索、公共救援、医疗防疫陪护等重磅行业中;教育端和ToB构成了很大一部分市场。ToC消费端虽然定价较低,但是出货量数据不错。

经过多年的研发积累,宇树在四足机器人的运动、感知等多产品性能上行业领先,满足不同行业用户的需求。宇树在工业和消费级产品上分别设置独立的生产线,以确保产品质量。

对于行业客户而言,宇树的优势是综合层面的,其中最核心的是在技术前瞻性、产品前瞻性、产业敏感度和市场敏感度方面的优势。宇树最早开创了这种方案并实现市场化,产品营收、出货量全球领先,在底层的核心零部件、算法制造能力、生产销售渠道等方面都具有优势。

4

如何看待机器人与AI相结合的未来?


经纬:展望未来,宇树想成为什么样的公司?四足机器人迎来爆发的关键转折点会出现在哪里?

王兴兴:宇树的意思就是科技树,公司的未来有无限可能。虽然目前主要还是做高性能的移动机器人,包括四足机器人、人形机器人,及其他的高性能移动机器人,但未来10年的方向在于包括通用机器人的高性能的移动机器人。我们希望真的能够成为像特斯拉、苹果这样在对全球产生重大变化,在日常生活中给人类产生大量价值的公司。

我们也希望用新科技、新产品来真正推动整个人类科技进步,通过移动机器人、AI替代一些比较危险的工种,希望推动社会进步。比如宇树科技研发制作的国产行业级机器狗,已被广泛应用于应急救援、巡逻、侦查、广场值勤、危险品排爆、抢险救灾人员搜救,缉毒缉私、生命探测、防暴处置、违章违法、警示喊话、电力线路巡检、石油和天然气管道巡检、有毒有害气体检测、城市综合管廊体检、野外巡逻、校园安全巡查、社区治安管理、红外热成像检测、高危人员和犯罪份子的排查等等,多方位服务于城市社会安全管理。

四足机器人现在每年增长可观,但是不算是大规模爆发。真正爆发还是要寄希望于更好的AI。宇树早些年不做人形机器人,是因为我认为要想驾驭人型机器人这类复杂的通用机器人,一定需要强AI,强AI是驾驭人形机器人的必要条件。

未来四足机器人会更实用、更便宜、性能更好,各种场景下能替代人类去工厂或者户外等环境去作业,也在家庭内得到应用,四足机器人会成为人类的伙伴一样。我也有和马斯克近似的想法,就是可以自己复制一个自己出来,机器人可以代替自己处理生活中各类事务。

 

经纬:AI可以说是去年以来最热的话题,机器人是AI技术的重要载体。集合AI在机器人运动控制等方面有很大空间,人机交互是智能移动机器人的未来。宇树如何看待AI发展对于机器人发展的影响?描述一下未来人类与机器人共存的画面?

王兴兴:我一直对AI很感兴趣,今年以来公司也在加大对AI的关注和投入。我非常看好AGI这个方向,一旦这个技术问题解决,对全球经济、政治、文化改变非常大,可能远超过去的工业革命或者信息化革命。我觉得如果快,三到五年有效果,如果慢,最多不会超过十年。

AGI和通用机器人是相辅相成的。我们做的AI主要偏向于底层、运动控制、操作,可能更像人的小脑这部分,而OpenAI他们做的可能更像大脑逻辑思维方面的事情。

首先,很重要的是明确我们在谈论AI时,是在谈论什么。AI并不是像之前的互联网、手机一样的工具,实际带来的变革将远超于此。当强AI诞生的时候,某种意义上整个人类的文明就终结了。人类和AI要么共存,要么毁灭。

我觉得我们其实只有一条路,就是人类跟AI共存。AGI可能会成为一个高智能、终极的逻辑机器,但它本质是一个服务人类的机器,是相对可控的、超高智商没有欲望的东西,类似圣人,不会有欲望或者毁灭人类。

既然我们只能共存,那么人类个体为何不把自己的意识上传到AI上?过去科学家使用脑机接口等以实现人类大脑的扫描,但生物神经系统几乎无法与目前的计算机系统兼容,可以预见未来几十上百年,人类也不可能使用生物医疗技术实现对整个大脑的数据扫描,更不可能把大脑数据转化为目前人类的通用计算机数据。

事实上,有一种更加简单廉价的方法可以实现意识的上传。目前的AI训练是用大量的人类文本语言数据进行学习,那么人类个体只要在平时生产生活中佩戴一个数据采集装置,用实时采集到的数据训练 AI 模型,就可以把自己的意识上传到 AI 大模型。

我们可以使用穿戴式数据采集系统进行意识的“复制”,包括双目广角相机眼镜(带麦克风),数据采集衣服(柔性传感器),植入式数据人体感知和运动数据采集。我个人猜测这可能会成为苹果视频眼镜的杀手级应用。采集之后,可以将上述数据用大模型进行训练,防止自己被复制。

接下来就是机器人登场的时候。复制意识是不够的,因为如果没有肉体可以承载意识,意识就只能成为类似缸中的大脑,必须让意识丰富地感知自己的肉体和自然环境,才能重新获得活着的感觉。这时候就需要真实的肉体,即机械身外化身。

人型通用机器人的必要性在于,人类的技术依旧完全不够发达,无论是能源、材料、算力等等都完全不够支撑每个人安全自在地活在虚拟世界中。所以我们需要大力开发真实的肉体,最核心还是给人类创造高性能机械化身。

全新科技时代开始后,随着人类大规模式使用强AI,且 AI 本身和人类融为一体,人类的智力达到飞跃,原来世界顶级诺贝尔物理学家一辈子也破解不了的物理定律,可以在一瞬间就经过精密计算验证并被破解。再结合物理身外化身,全世界机械、材料、生化等各种领域会迎来技术飞跃,存在于科幻世界的真正意义上的移山填海将成为现实。

AIA人工智能身外化身(Artificial Intelligence ce Avata)的诞生,还附加诞生了CSI跨尺度智能(Cross Scale Intelligence),这将带来工业制造能力的腾飞。

尺度问题构成人类科技的很大限制。人的平均身高只有 1. 7 米左右,对细胞级甚至更小的微观领域几乎没有非常显著的控制和改造能力,也需要费很大精力才能建造三峡大坝等大规模工程。

那么我们借助AIA人工智能身外化身,就可以制造比自己小无数倍和大无数倍的机器人,新智能人类可以在各种尺度上需要非常夸张的生产指导能力,比如可以直接手动更改 DNA 排列,让 DNA 制造蛋白质,并且随时观察蛋白质的制造和工作过程;可以直接用手把塔克拉玛干沙漠的沙子挖到太平洋,然后注入海水到沙漠原来的地方。

总结一下,我认为未来可能出现完全独立于整个世界的、分布式的多个新兴经济体;生物人类和智能AIA将会共存,构成新的生物多样性;智能AIA会脱离原生物人类的原始肉体欲望,诞生新的欲望,这过程中会有不可控性;矿、能源、算力将是最重要的关键性资源。

broken image