维他动力创始人余轶南:60人团队一年量产机械狗
曾来到混沌立异院第三模块的线下讲堂,为大师做了从题为「具体智能:舍九取一的计谋思虑」的出色分享。先简单引见一下我小我的布景。我读书的时候学的是模式识别取人工智能,次要研究标的目的是计较机视觉取机械进修,全体上比力偏学术。2012年博士结业后我插手百度,担任图像取互联网搜刮相关手艺。那段时间,恰是以深度进修为代表的AI 1。0手艺海潮兴起的期间,像卷积神经收集、轮回神经收集、LSTM(Long Short Term Memory,长短期回忆)收集等一系列模子快速成长,鞭策人工智能送来第一轮迸发。2015年,我从百度分开,跟从前老板余凯一路创立了地平线机械人,它是一家以AI芯片取智能汽车为次要营业的公司,而我次要担任从动驾驶相关的产物取手艺研发工做。我正在客岁岁尾分开了地平线,正在地平线的十年里,我既了公司从草创到港股成功上市的过程,也完整了从AI 1。0手艺迸发到第一个AI财产周期的全过程。而我们当前无论是大模子、Agent智能体仍是具身智能的成长,我认为都曾经明白标记着AI 2。0时代的到来,也就是人工智能的第二个大周期。这一周期大约从2017、2018年起头萌芽,曲到ChatGPT的呈现后实正,现在我们正处正在其高速成长的迸发阶段。取之陪伴的是,财产增速也处正在一个极高的程度。正在投资范畴,几乎所有的项目都取“AI+”慎密相关。而这一现象背后,是手艺内正在的耦合逻辑:一项道理级手艺的冲破,往往会催生全新的财产海潮。从蒸汽机、电力,到消息化取半导体,每一次都沉塑了经济取社会布局。AI做为一种全新的底层手艺,必将深度沉构互联网、软硬件甚至线下实体等各个范畴。正在这个弘大历程中,哪怕只找到一个细分的切入点,都可能孕育出沉构行业款式的庞大机遇。而具身智能做为人工智能范畴中的主要一环,它同样正正在送来汗青性的机缘期。接下来,我会从以下几个维度给大师阐发阐释。第一,电力。电池的能量密度用10年的时间提高了一倍摆布,并且这个速度还正在加速;例如正在电动汽车的续航里程方面,从十年前的百余公里,轻松冲破至现在的千公里级别。第二,算力。算力方面仍然遵照摩尔定律,速度很是快。目前全球最先辈的半导体系体例程曾经迫近了3纳米,而当制程微缩至1纳米时,量子隧穿效应将导致现有的半导体手艺失效。不只如斯,现外行业正正在从2D平面制制转向3D堆叠架构。例如,近期备受关心的HBM(高频宽回忆体)存储手艺,即是通过立体堆叠,正在冲破带宽瓶颈的同时,延续着半导体机能的攀升曲线。第三,AI算法。按照一些benchmark(基准测试),根基上每100天,AI算法的机能便会提高一倍。这意味着,每100天后呈现的新模子,机能可取此前顶尖模子媲美,所需算力却仅需一半。若是我们把电力、算力以及算法这增加曲线叠加,以十年为周期,便会发觉整个行业正以几千倍、甚至上万倍的速度正在前进。正在此变量下,我们必需冲破现有认知框架,并据此思虑当下的步履标的目的。同时,正在手艺架构上,AI也履历了显著演进。以从动驾驶为例,十年前大多采用分段式模子,大要正在三年前起头转向端到端架构,而当前的趋向则是进一步多模态大模子,将图像、文本、语音等消息正在一个模子中进行协同进修,迈向手艺架构的“大同一”。除了模子范式,锻炼方式同样履历了显著跃迁——从需要良多人工标注的监视进修,到大模子下的无监视预锻炼,曲至当下,基于仿照进修、强化进修和世界模子的锻炼架构。这些冲破性进展,都稠密发生正在短短十年间。取此同时,需求侧也正在变化。以我国市场为例:生齿老龄化历程加快,劳动力生齿占比持续走低,家庭办事消费比沉逐年攀升。数据显示,65岁以上老年群体对居家办事的需求正呈指数级增加。另一方面,55%的年轻消费群体更倾向于付费省时。对这些年轻消费者来说,过去亲力亲为的事务,现在更愿通过采办办事处理。正因如斯,从国度层面到本钱市场,再到各类企业,都高度注沉这一范畴,并持续投入资本。加之中国显著的工程师盈利,具身智能已然成为一个遭到全社会关心的核心议题。虽然AI的前景令人振奋,但现实上,仍是得一步一步地走。当我们实正落实到具体的营业中时,仍然会晤对诸多挑和。概况上,它什么都能做,但对每个企业甚至小我而言,这反而带来了新的命题:当手艺几乎无所不克不及时,我们该若何选择?因而实正的挑和不再来自「能不克不及」,而是来自「该做什么」取「先做什么」的计谋抉择。面临一个复杂的财产,其实我凡是把它拆分成三个维度来审视,且每一个维度上都存正在诸多变量。环节正在于,若何正在这个三维空间中找到属于你本人的阿谁「小立方体」——这一点至关主要。第二,手艺径。既要看到手艺将来的可能性,也要认识其当前阶段,我们需要从现状出发,勾勒出一条通往将来的手艺成长径,从而明的当下应聚焦的标的目的。第三,产物定义。产物是毗连用户场景取手艺能力的桥梁。我们需要思虑,使用哪些手艺,通过何种产物形态,最终为什么场景下的用户实现何种价值。所以,我们需要把以上几个方面整合正在一路来看,再连系本身的资本和前提,我们才能正在阿谁广漠的三维空间中,找到最适合本人切入的精准点位。这个点位大概很小,但对任何人或企业而言,若是实的能选得准,便已脚够奠基成功的基石。适才讲的是若何从理论层面做创业标的目的的抉择。接下来,我就以我本人所处置的具身智能这一范畴为案例,分享我的思虑取阐发框架。虽然机械人看似无所不克不及,但若是一起头就定位为「万能型」产物,那最终做出来的工具很可能什么都干不了。因而,我们起首要对用户场景进行细分。第一层,分行业。想清晰是要唱工业的、办事业的抑或是面向消费端的机械人。我们最终选择了消费端,由于它的市场规模最大、财产升级的需求也最为火急。室内场景,例如出产线上的工业机械人或者家庭里的洗碗机,它面临的是比力单一的,使命反复性也高,因而它的数据多样性就会比力低。然而,若是你但愿机械人能正在将来实正具备AGI的能力的话,就必需得让它面临脚够多样、复杂的数据。因而,我们认为室外这种型的场景对于数据的多样性而言会更有帮益。正在手艺的选择方面,若是将过去二十年的手艺演进及其产物化历程进行对照,便会发觉二者之间存正在较着的时间错位:凡是,当原手艺趋于成熟后,大约需要五年摆布时间,其贸易化取工程化的手艺就会成熟。若是大师现正在关心机械人的话,就会正在网上看到良多视频,好比机械人叠衣服、拿杯子等等,当我们看到良多雷同的demo(样本)的时候,它其实代表的是这些产物背后的原手艺起头慢慢变得成熟,而不是这个财产曾经成熟了。而这时其实就是入局的很好的时间点。说实话,虽然经常看到一些机械人活蹦乱跳的视频,但仍有部门手艺还处于攻坚阶段,例如双脚行走正在非平整面庞易失稳,五指工致手也仍是待解的难题——Tesla Optimus 3。0正在工致手方面碰到的挑和即是一个。因而,对创业公司而言,抱负的手艺切入点是选择那些道理已获验证、工程化径初步,但尚未完全成熟的「两头地带」。选择过于超前的手艺,贸易化周期过长、风险过高;而选择已完全成熟的手艺,则难以成立合作劣势。把握这一「两头点位」,是手艺选择中的环节策略。具体到产物选择时,我们能够察看到,分歧场景的落地速度也存正在着必然差别。例如,无人机、割草机、酒店配送机械人等产物已快速出现并实现贸易化;而从动驾驶虽然历经了十年的成长,但至今仍然没有被普遍地利用。场景的失效成本:它能够理解为使命失败所带来的后果严沉性。例如,办事机械人递咖啡时若是失手了,只需要清理现场;但若是从动驾驶车辆发生变乱,就有可能导致人身或严沉财富丧失;而家用扫地机轻细地碰撞桌角,则几乎没有什么额外成本。现实上,良多范畴大师也投了良多钱、付出了良多人力,却一直没有击穿,它背后的缘由往往都呈现正在场景的失效成本过高。基于这个框架,我们正在客岁底对市场上的相关公司进行了系统性梳理,发觉一个清晰的配合逻辑:几乎所有具身智能企业都环绕「AI大脑」这一焦点展开,通过附加分歧身体形态实现功能分化——搭载轮子成为从动驾驶车,安拆机械臂成为操做机械人,组合四肢则人形机械人。大师的终极方针趋于分歧:建立通用的、交互、挪动取操做能力。区别正在于分歧的公司,大师会选择如何的一个点位做为本人的起点。这就像爬珠穆朗玛峰,若是是人形机械人是颠峰,而当前的环节决策正在于你要从哪里起头爬,并规划阶段性线。这种选择本身并无绝对对错,但企业必需做出明白且独一的径判断,并果断推进。接着是市场维度。我们曾系统阐发过什么样的行业比力适合使用机械人。从我们的研究成果来看,目前教育行业是机械人使用的第一大财产,其次是巡检、物流等根本办事的场景。家庭办事场景虽是很多机械人公司的持久愿景,但实现难度最大。此外,制制业,如汽车厂、3C代工等企业也很是需要机械人去降本增效,由于对今天的制制业而言,工人的人力成本、不变性、靠得住性都是很严沉的挑和。还有文娱场景,例如商场、公园等,很多商家会租用机械人做表演引流,对很多C端消费者来说,这也是他们接触机械人最屡次的场景。面临浩繁选择,我们成立了以两个焦点维度为根据的阐发框架:一是价值属性,从纯文娱性到强功能性,到底是好玩仍是有用;二是用户类型,从ToB商用至ToC小我消费。我们把前面提到的各类机械人场景都放置于这个坐标里,能够清晰看到市场的分布款式——客岁底时,创业公司高度集中正在科研、教育、巡检、军事取商演等范畴,而功能性强且面向小我消费者的左上角区域,几乎完全空白。二是家用机械臂,可视为扫地机的升级版,加上两个机械臂,从而让它完成更多的家务,但手艺挑和取落地难度都极高;从手艺成熟度来看,四脚机械人硬件已成长到较高程度,处于「两头点位」——既避免了手艺过于晚期导致的长周期孵化风险,也绕开了手艺完全成熟后合作激烈的红海。同时,它正在软件算法方面已有优良根本,供应链也相对成熟,具备成本可控的财产化前提。正在场景适配性上,四脚机械人具有优良的户外挪动取承载能力,无论是小区散步、露营出行或是日常购物等场景,它所具备的活动能力、负沉机能还有交互潜力都能够高度适配。进一步聚焦到人群的选择上,我们发觉现代家庭,特别是五口之家的行为模式具有高度的纪律性:工做日父母上班、孩子上学,周末至多一天全家外出,白叟则有固定的买菜、做饭取散步习惯。我们能够看到,无论是利用场景仍是人群选择,它的画像都很是地清晰且,因而,我们就决定环绕家庭场景推出了首款四脚机械狗产物。从功能上讲,它能够负沉、拍摄、牵引,还能够跳舞,素质上是一个面向家庭的“智能伙伴”。正在产物脚色定义阶段,我们找了一个小学去调研,发觉约40%的孩子但愿家里的机械狗饰演「哥哥」的脚色——既能本人,还能够陪同玩耍,并正在需要的时候供给支撑。基于此,我们就把四脚机械狗的产物抽象给明白为「家庭中的小哥哥」,焦点价值定位为温暖、平安、好玩、英怯、有丰硕的动做言语。正在功能层面,它能够做为「小仆从」为孩子背包负沉、一键跟从并摄影记实。对家长而言,它也可做为「小」,通过内置的48小时DVR系统,让父母随时领会孩子的动态,加强外出时的平安感。综上,我们通过系统性地阐发行业、市场、产物、用户以及手艺等多个维度,逐渐定位,最终聚焦于一个具体的产物点位。正在价值建模过程中,环节就正在于正在度中找到一个实正属于本人的精准切入点。而我们建模次要就从两个维度展开:二是机械本体维度。当前大大都AI产物仍然是基于已有的硬件进行加强,走的是“Something + AI”的径,这正在过去十年里一曲是行业的支流标的目的。然而,跟着AI能力的持续进化,我们认为有需要为AI打制一个原生的硬件载体——一个过去并不存正在、因AI而生的全新本体。我们此前所切磋的几种机械人形态,恰是这一标的目的的表现,而正在此中我们选择的点位是「有生命力的机械人」。我们的第二个环节策略是错位合作。纵不雅当前机械人行业的合作款式,我们会发觉绝大大都公司仍然集中正在「左上角」的抢手范畴,而正在我们所对准的标的目的上,客岁几乎没有合作者,本年合作者也很少。因而,我们判断选择了一条少有人走的。接下来是单点击穿的施行逻辑。机械人行业的涵盖范畴广漠,从行业使用到出产到商演再到ToC,我们果断地选择了C端市场——由于将来市场潜力庞大且当前参取者较少。正在C端机械人中,我们进一步聚焦于户外场景,而非室内办事型机械人;正在户外形态中,我们正在人型、轮式地皮、轮脚和四脚之间选择了四脚,由于它更接近宠物的形态,家庭接管度更高;而正在产物定位上,我们并未局限于「东西」或「玩具」的二元选择,而是将其定义为「家庭」——成为孩子身边的「小哥哥」,融入抵家庭的一份子。由此可见,若是将整个机械人行业展开为一个复杂的选择收集,其实每个结尾节点都包含机遇。但对任何一家公司而言,要想正在短期内正在市场中崭露头角,就必需做出清晰、果断的计谋选择。我们恰是通过如许层层的径,最终锚定了本人的标的目的。就我本人的体验而言,做机械人这件工作和我之前所处置的从动驾驶范畴其实存正在着必然的差别。从动驾驶是一件很是hard code(硬编码)的工作,它对平安性的要求极高,正在正式上新一个方案之前需要通过数百万公里的严苛测试,而用户对它的度却很是低的,只关怀这个车开得好欠好,会不会撞的问题。但对于一个机械人来说,用户会看到它的外不雅、行为、表演取交互等多种要素,它里面其实包含着更多的人文要素。因而,我们提出了「用科学的思维节制精度,用艺术的思维塑制魂灵」的,这也恰是公司名称维他动力(VitaDynamics)的由来,即智能生命取机械动力,通过AI手艺立异,打制实正融入糊口场景的智能伙伴。而我们的方针是正在五年内,鞭策机械人规模化进入家庭取办事场合,全天候的陪同取办事。目前,我们的产物已进入预售预备阶段,将于下月中旬正式发布和预定,并于来岁第一季度实现首批量产交付。起首,我们正送来一场庞大的手艺变化,毫不夸张地说,这是一场可谓「第四次工业」的巨变。十年当前,所有的公司都将是AI公司,就像我们今天用电一样习认为常,这是第一个大布景。其次,正在如斯庞大的变化海潮中,机遇实正在是太多了,但这更需要我们去沉着地对待市场。我们必需系统审视当前取将来几年的市场款式、实正在的用户需求、手艺成熟度以及产物工程化能力。正在浩繁的二维选择中持续做出决策,先决定好走哪边,再逐渐,曲至找到阿谁独一值得全力投入的切入点。到现正在为止,我们公司成立仅一年时间,团队也才60人,几乎每一个部分、每一个环节都做到了极致精简。而我们之所以可以或许正在这么短的时间内做到机械人量产上市,缘由无他,不外是极致的聚焦,所有人的方针都朝着一个点去击穿。那这个点是什么呢?最终我们思虑的成果是「用户对劲度」。无论产物订价几多,哪怕只要一位用户,只需ta承认这款产物异乎寻常、体验超卓,我们的勤奋便有了价值。说了这么多,其实我的焦点就是:虽然机遇纷呈、选择浩繁,但只需思清晰,把聚焦这件工作想清晰,集中所无力量正在一个环节点上持续深耕,即便规模无限、时间紧迫,也能正在一年内做出令人信服的。做为全球首款无需遥控的消费级具身智能机械狗,Vbot超能机械狗既是Vbot维他动力手艺实力的集中展示,也标记着具身智能向丰硕多元的消费场景迈出了环节一步。来混沌立异院,参取更多优良企业参访勾当、取各行业领甲士物对话交换、系统进修底层贸易认知方!




