Posted in: 科技

专访宇树科技王兴兴:在人形机器人的巨变前夜,做一个敏锐的谨慎派

文 | 黎诗韵

编辑 | 靖宇

 

在目前大热的人形机器人、具身智能赛道,宇树科技是最受关注的公司之一。这家公司最大的标签是硬件实力强——一方面是性能,去年其首款通用人形机器人 H1 能奔跑、原地空翻、踹不到,拥有全球几乎规格最高的动力性能;一方面是成本控制,今年其第二款人形机器人 G1 价格仅 9.9 万元,而同行普遍在数十万、乃至百万元。

这背后建立在积累多年的四足机器狗技术上。四足机器狗和双足机器人的底层技术相通,宇树只用 3 个员工、不到 6 个月时间,就做出了上述人形机器人产品。谈及硬件实力强的原因,宇树科技创始人王兴兴对极客公园表示,主要是做了十几年、在软硬件上积累了大量的认知和经验。

2013 年,还在读研的王兴兴,自己设计电机、控制算法等,用不到两万块研发出了第一台四足机器狗 XDog,这几乎是全球首个四足机器狗的技术方案;2016 年,当 XDog 在海外展现出市场需求,王兴兴离职创立宇树科技,不久后极客公园旗下的变量资本,注意到了王兴兴,并于次年领投了其天使轮融资。

目前,宇树的机器人本体(硬件)被全球各大科研机构、科技公司购买,用作研究。而其四足机器狗目前在全球出货量第一,包括万元的消费级机器狗 Go2 及最其新轮足版本 Go2-W,用于工业级场景的 B2、B2-W。年初,宇树披露了最新一轮近 10 亿元的 B2 轮融资,这也让它成为目前机器人赛道估值较高的公司之一。

不过,AI 为机器人这个赛道带来了新的变量。

在王兴兴看来,AI、而不是硬件,才是目前人形机器人行业最大的掣肘。两年前 ChatGPT 的出现,让人形机器人有机会进化出真正智能的大脑,变成有自主感知、决策、执行能力的智能体。它将在工业、家庭等场景形成通用服务能力,从而作为全新的生产力供给,带来万亿规模的市场机会。

在王兴兴看来,硬件未来或许会处于从属地位,比如当一个超级强大的机器人 AI 模型出现、哪怕用垃圾堆里捡的一堆机器人零件也能干活。不过,他并不打算改变公司的目标和重心,宇树的目标仍然是「做好产品」,AI 只是少量投入、且是为了更好地服务客户。

宇树代表了目前人形机器人公司的一种谨慎、务实选择。在王兴兴看来,目前人形机器人 AI 的进程还非常早期、甚至不到「GPT-1」水平,表现为机器人没有很好的通用性和泛化性,商业价值不大。而技术进化的路线又没有明确、数据也非常缺乏,因此全球各大公司对人形机器人的投入还远远不够,包括特斯拉、英伟达。

他说,技术的推进将由「全球共创」,并且很快就会有突破——因为,AI 技术呈现出阶跃性突变的特点,进步总是突然发生。而对于宇树来说,重要的事情是保持学习、跟进新技术,这能让公司存活下来、甚至继续领先。

以下是极客公园与王兴兴的对话,与现场分享进行了融合后整理:

 

AI 技术不成熟,工业场景的落地还未到时候

极客公园:最近不少人形机器人公司都在提工业场景的落地商业化,包括前不久 OpenAI合作的 Figure 02 也宣布进入宝马工厂。你怎么看今年人形机器人行业的变化?工业场景的落地是否在加速?

王兴兴:我个人感觉其实没有太明显的变化,只是说会有进步,以及会有一些尝试性落地。但目前大家基本上还是处于试点阶段,觉得工业方向有价值,先尝试下落地部署。

极客公园:有人说今年会是 POCProof of Concept,概念验证)之年,你怎么看?

王兴兴:只能说在一些相对容易落地的小场景、工业的局部环节能做点事情。但大部分还是针对特定环节进行定向训练,成功率也未必特别高,离通用场景还比较远。

极客公园:关于应用场景,似乎你们之前说会看重介于工厂和家庭之间的能源场景?

王兴兴:我们公司还是偏工业一点,目前大量工厂对劳动力的需求是比较大的。但能源行业大部分全是自动化设备,它对人力的需求我感觉没有那么多。

极客公园:你们现在在工业领域有哪些落地?

王兴兴:比如我们过去几个月有跟蔚来的汽车工厂合作,现场部署了我们的人形机器人做搬运,有激光雷达定位、机器人操作、AI 识别等,整个过程是全自主的。

虽然我们也在推进落地,但可能推进的速度和效率没有那么快。我们公司还是比较有耐心的,不是说一定要今年或者说明年在工厂里部署多少台,其实没有把自己逼迫那么紧。因为我觉得目前技术发展水平还不够,没有达到真正商业闭环,比如让机器人能达到一个工人的价值。

所以我们还是尊重整个市场的反应,等到技术和产品成熟到一定程度了、已经有一些更好的商业推广的势头了,我们再大规模地推广。

极客公园:大家都在提人形机器人进入汽车总装场景,你觉得什么时候能实现?

王兴兴:汽车总装很难,因为汽车总装最大的一个问题是汽车的零部件太大了,一般小的人形机器根本搬不动。而且车辆又特别复杂,要把机器人伸进去装,难度太大。目前进入汽车厂商的上游供应商可能还更容易一些。极客公园:上游供应商指的是?

王兴兴:生产一些仪表、线缆或者什么,这可能简单一点。总装厂的难度其实有点大,个别总装厂里部分工序还是能做的。

极客公园:在机器人底层AI技术还没有真正突破时,怎么看大家钻到细分场景去做落地的意义?现在针对细分场景打补丁,会不会难以跟上底层 AI 的技术进展?

王兴兴:其实每个行业肯定要先尝鲜、先推进一些事情,不可能等所有的技术或所有的条件都满足了,再去做一些商业化或者落地的事情。如果有能做的,大家可能都会开始尝试,这是毋庸置疑的趋势。

极客公园:你之前提到,明年年底前全球至少会有一家人形机器人公司实现工业场景的商业闭环,这个判断是怎么做出的?

王兴兴:原因也比较简单,目前全球整个的机器人 AI 技术的进步还是非常快的。技术一旦变得更好,那有些简单工业场景的落地就可以做了,一旦比如一个工厂的一台人形机器人设备,能够产生正向商业价值,其实很多的工厂都会买,这是不可阻挡的一件事情。

我觉得到明年底和后年,人形机器人真的可以大规模地在工厂里铺起来。这个是非常快的,所以当务之急还是要把 AI 做得更好一点。

宇树机器狗被用于工业场景 | 图片来源:宇树科技

 

人形机器人 AI 不到 GPT-1 水平,原因是数据和技术路线不清晰

极客公园:如果把现在具身智能的智能水平跟大语言模型做对比,你觉得现在是相当于 GPT 几的阶段?

王兴兴:我觉得还没到 GPT-1 的水平。具身智能整个的模型进展是有点慢的,还没有突破一个临界点。现在就有点像 ChatGPT 出来前一两年,机器人 AI 还是有点笨拙,只能做一些非常简单的工序、而且执行的成功率有点低。极客公园:这是不是悲观了点?

王兴兴:没有,这基本上是事实。我觉得目前至少公开的、大家看到的技术,还没有到。极客公园:你觉得达到 GPT-1 的标准会是什么?

王兴兴:一定的通用性和一定的使用价值。现在很多场景都是固定工位、工序的训练,能做点事情,但泛化比较差,你训练了什么就只能做什么。

你可以看到前些天,特斯拉才刚开始招数据采集的人。你说数据都没有到位,这个模型怎么出来呢?所以就 GPT-1 都没有。极客公园:之前看到特斯拉有通过摇操的方式获取数据?

王兴兴:已经做了一点点,但是很小的、固定的一部分功能,比如把一个电池从这里拿到这里。这当然是可以的,但它跟我们想象中的通用机器人模型完全两码事,跟通用的基层模型还差挺远。极客公园:所以AI技术没突破主要是数据的问题?

王兴兴:数据是一方面。现在很多机器人数据都很杂、不太干净,甚至也不是给机器人专用的,就不是真正能干活那种级别的数据。所以只能做些简单的事情,成功率不是特别高。极客公园:应该怎么解决数据问题?特斯拉、谷歌比较强调遥操、英伟达强调仿真,你怎么看?

王兴兴:遥操、仿真都有需要的,各有优缺点。

比如虚拟数据能大概让机器人知道要往前走、或者拿个什么东西,但是真正要达到非常精密的操作,误差会比较大。你可以用虚拟数据做机器人的训练,但最后要让操作准确度达到 100%,还是需要真实的数据。我觉得如果有实力的公司,像特斯拉,多弄点人搞真实数据会比较好。

不过我个人感觉,机器人的数据量没有大家想得那么夸张。现在最大的问题是。现在每家搭的模型都不太一样,每家的想法也不一样,没人知道哪个模型是好的、也没人知道哪个什么技术路线是真正最后能跑出来,都比较模糊。

 

机器人仿真数据 | 图片来源:宇树科技

 

极客公园:行业主要分为怎样的技术路线?

王兴兴:目前市面上比较常见的有两种。一种是把大语言多模态模型直接给机器人用,然后再加一部分机器人底层的操作运动集等,让大语言模型去调用一下、完成一些事情,这是目前最常用的一个架构。

有些公司可能希望更端到端一点,像特斯拉目前要搞的就是这个方向。它直接用模仿学习,让人采集大量的动作数据去训练机器人。它确实堆数据是有效果的,比如今天干这个活堆一部分数据,干一个活堆另外一部分数据,最后这两个活都能干,但更大的验证不太确定。

极客公园:为什么技术路线还没有形成共识?

王兴兴:主要是模型和最终结果都没有看起来说,哪个技术路线特别特别好。

光硬件都没有办法形成共识,比如一个摄像头具体应该装什么位置、装几个,传感器数据应该怎么采、要不要触觉传感器,有的不想要灵巧手、有的需要很多手指……每个人的想法都不太一样。这就导致了其实很难评价哪种正确、哪种错误。

其实在 ChatGPT 之前大语言模型也有非常多的架构,只是后来发现这种架构更有价值,就把其他架构淘汰了。现在人形机器人有点像 ChatGPT 出来的前一两年,实际上没有哪家敢保票,说自己的方向是绝对正确的。

极客公园:那你自己更相信哪一种路线?

王兴兴:我感觉可能跟他们想法都不太一样。我们其实目前不是特别急,一方面是看能不能做一些新的模型,另一方面这些常用的我们也会用。我们就玩玩吧。

极客公园:大家说智能汽车是机器人的一个子集,现在很多车企在入局人形机器人行业,车企从自动驾驶的端到端来做机器人会更有优势吗?

王兴兴:因为马斯克在搞人形机器人,所以车企对这块肯定是比较关注的。大家希望在机器人上用到像 FSD 一样端到端的自动导航技术,但很多传统的自动驾驶还是偏传统的技术,比如机器狗在一些园区做巡逻的这种技术。

把 FSD 自动驾驶用在人形机器人上面,大家做得不够好。包括特斯拉,因为特斯拉大量的人力都放在 FSD 去了,人形机器人相对投入没那么多。当然也有一些创业公司在做,但目前还是不多。

极客公园:你认为机器人AI什么时候能实现 GPT-1 的水平?

王兴兴:明年年底差不多,全球至少有一家公司应该可以搞出来。可能比这个时间还更快。极客公园:虽然技术路线还不清晰,但为什么相信能这么快实现?

王兴兴:比较简单,AI 技术都是阶跃性的。现在有点处于一个平台期的感觉,但技术进步本身非常快,可能今天没做出来,突然明天就做出来了,它就是突变性的。

比如我们在研发的时候,经常发现非常惊喜的事情:有同事调了(机器狗)很多天都调不好,它完全地上打滚啥都干不了。但突然一个晚上,你给它训练一个新的模型放上去,第二天早上效果就非常好。这种情况在 AI 里面很常见,一开始可能真的是很烂,突然间变得非常智能。

另外,这个行业越来越热了,有更多的聪明人、更多的钱在关注这个行业,那整个速度就会变快。如果还是按过去那种机器人 AI 研发的进度,可能等个十几年或二十年都等不到。所以目前,我还是比较乐观。

 

全球人形机器人公司对 AI 的投入都很少,处在观望、共创阶段

极客公园:目前你们在AI 上的投入怎么样?

王兴兴:说实在的,我们在国内在机器 AI 里投入算是比较少的,跟别家比起来。极客公园:但你之前说希望能更相信、更投入 AI?

王兴兴:对,但是毕竟财力和精力有限嘛。AI 太烧钱了,光 GPU 算力都烧不起。如果投入太大,容易盈亏不平衡。所以我们还是克制一点。

极客公园:从这个角度上来说,有更多资金的大公司会比创业公司更有优势吗?

王兴兴:我觉得还好。核心原因是,在目前技术路线不是特别清晰的情况下,你哪怕有很多钱和资源,也使不上太多劲。在这个阶段,你可以看到虽然大公司都挺关注的,但投入其实不多,其实都很保守。

特斯拉的人稍微多一点,至少有几百人,别的公司大概可能有几十人。投入远远不算大。国内其实大家投入也都挺克制,没有说哪家疯狂投入啊。

说实在的,它不是说一家公司有多少钱、有多少人就能一定能把它做出来。因为在这种前沿的、全球都没有人做出来的情况下,某种程度上你可以认为看运气、或者看某个天才人物,把这个事情推动了。

极客公园:这看起来很反差,外界都觉得人形机器人行业很热,但实际上大家投入不多。

王兴兴:这跟大语言模型比起来真的是九牛一毛。

因为大语言模型的技术路线相对确定了,如果你去看一下 OpenAI 的早期发展经历,它做的事情其实很杂,包括机器人、AI 模型等等。后来它们是发现 GPT 的方向比较正确,通过投入算力和资源、可以大力出奇迹,才重注这个方向。它们并不是在路线还不太清楚的时候乱投入。

极客公园:那人形机器人相比自动驾驶,哪个更远?

王兴兴:FSD 更快,基本上特斯拉在这个技术路线上就跑通了,商业价值目前都完全看得到。所以它们现在投了大量的资金和人力去做 FSD。

我觉得这也是为什么它们人形机器人的 AI 进展没有那么快,因为目前的技术路线没有特别清晰,所以投入跟 FSD 比起来真的是少很多。极客公园:一方面是技术随时会有突破,另一方面大家又不敢投入,那怎么跟上技术进程?

王兴兴:这个不太好估计吧,就看具体的技术进展。如果突然觉得技术好了,你就多投点钱。如果技术不太好,那就少投点钱。这其实是很动态的一件事。

极客公园:技术突破主要是靠学术界还是科技公司?

王兴兴:目前还是全球共创的阶段,很难说是某个实验室、某家大公司。就像 OpenAI 能做出 GPT,也用到了谷歌的 Transformer 技术和其他公司的一些成果。

很难说某家大公司是技术最领先或者产品最领先的,国内国外都有可能,大公司或许机会更大一点,但都不好说。AI 这个领域就是这样,今天你领先,过了没几天别人更领先了、你原本老的东西都不能用了,它的变动性和风险系数还挺高的。

我们公司还是希望全球共创、和大家一起努力,之后再根据整个产业的动向做相应的调整。

极客公园:为什么你之前说,这次技术的突破大概率是由别的公司完成?

王兴兴:这其实是完全不可预计的一件事。不过我觉得美国的概率会更大一点,因为它们 AI 人才更多一点、算力也更多。

宇树的人形机器人 G1 具有超越常人的灵活性 | 图片来源:宇树科技

 

目前的大语言模型无法通往 AGI,但具身智能可以

极客公园:你提到相比于大语言模型,具身智能是实现 AGI 的最有效途径。这种物理世界的 AGI 和虚拟世界的 AGI 是一样的吗?

王兴兴:我觉得是统一的。我认为真正的 AGI 需要有物理肉体,纯虚拟环境的 AI 可能没办法诞生 AGI,最后它一定要和身体做整合。

我之前提到过大语言模型有「幻觉」问题,「幻觉」就是虚拟环境导致的。就像大脑在做梦,你没办法判断这个虚拟环境的真实性,就会迷失。就像把你的大脑被连接到互联网上,看到各种图片、视频,没准过一段时间你就已经完全没办法区分什么是真的、什么是假的。所以要实现 AGI,还是要结合具身智能和机器人。

极客公园:像 Sora 这种模拟真实世界的物理模型,能解决这个问题吗?

王兴兴:我觉得这是个很好的技术方向。它目前已经能做一部分事情了,比如生成一个跳舞的小人,但离质的飞跃还有点难度。

极客公园:具身大模型跟大语言模型,最终会形成一个怎样的关系?

王兴兴:语言模型未必是给具身模型的必选项,它只是其中一部分。举个最直观的例子,比如在工厂里做事的一个机器人,他完全可以不说话,比如说我给它一个任务,给它看一张照片、或者给它敲一个数字进去,他只要能干活就行了。具身模型最核心的是干活。

极客公园:从具身智能来看,实现 AGI 的标志是什么?

王兴兴:我觉得还是机器人能真正达到自我学习、自我干活,或者至少大部分活都能自己干。比如你随便找一个场景,家里、工厂,只要把人形机器人拉过来,直接跟它说要做什么事情,它一下就能学会做,至少要达到这种级别。

极客公园:最终就是开箱即用?

王兴兴:差不多。甚至如果再高级一点,需要机器人能持续性地自我学习。

因为现在的 AI 都是靠人产生的数据驱动的,但未来是不是可以不要人为数据、让它自己生产数据,自我驱动、自我学习和进化。甚至你啥都不用管了,它连芯片都能自己造。

极客公园:当真正的 AGI 时刻来临,它会带来怎样颠覆性的影响?

王兴兴:我觉得整个社会的变化会非常非常大。普通人可能不需要上班,生产力将由机器人承担。我觉得这会真正解放人类,让每个人都可以吃喝玩乐,每个人都很快乐,每个人都有大的房子住,每个人想去哪里玩去哪玩,每个人都很自由。

而且我觉得这个过程挺快的,5 年内有可能实现,最多不会超过 10 年。AGI 的未来其实并不遥远。

 

消费级机器狗 Go2 及最其新轮足版本 Go2-W | 图片来源:宇树科技

 

宇树的目标还是做好产品,并学习和跟进新技术

极客公园:外界都知道宇树的硬件做得好,国内外的高校、科研机构都买你们的机器人本体做研究,为什么你们能做好这件事?

王兴兴:对我们公司来说,最大的一个优势就是,我们在这个行业做了很多年了。我自己差不多从 2010 年就开始做小的人形机器人,2013 年就正式开始做电驱动的四足组机器人,已经有十几年了。

所以,我和团队,在机器人硬件和软件方面积累了大量的认知和经验。无论是硬件的生产制造、降低成本、提高可靠性,还是销售渠道,还是技术的研发等等。目前我们整个公司规模在全球来说也是比较大的,这些多方面的因素让我们相对很多别的机器人公司有更多优势。

我一直坚信一点,其实世界上的聪明人很多,但你真正要把这个行业做得很好,其实主要还是保持足够长时间的学习与进步。只有这样,才能真正把这个行业做好。

极客公园:坚持研究机器人十几年,这背后是源自什么?

王兴兴:我确实比较喜欢机器人,但其实我从小对所有的科技都比较喜欢,就从几岁的时候开始,科学、物理、化学、生物这些学科我都很喜欢。

09 年读本科的时候,机器人变成了我的一个职业倾向。无论是机械结构设计、电器电机控制、包括 AI 算法等等,我都比较喜欢。如果有些人觉得一个方向做久了有点厌,对我来说可能反而还好。比如说今天可能玩玩机械玩腻了,明天换一换玩 AI,再玩腻了就回头玩玩电路板。

所以我的兴趣点还是非常非常多的,而且随着每次有新的创新出现,对我来说是非常非常满足的一件事情。

极客公园:你说现在AI 才是整个机器人行业最重要的变量,这会带来哪些机遇和挑战?

王兴兴:我一直认为机器人行业现阶段最大的限制,还是 AI 不太够——AI 模型、AI 的训练数据集、AI 的场景的落地部署,都完全远远不够。当然硬件目前也不够,但是它没有理论上的门槛,只是工程上的问题,比如把成本做得更低,性能做得更好、外观做得更加极致、功能更加丰富等,时间是可以预估的。

随着 AI 技术越来越成熟,大家对硬件的需求会越来越低,包括硬件的自由度、数量、外观灵活度等等。甚至我一直感觉,当未来人形机器人的 AI 真正突破之后,你从垃圾堆里找几个关节电机,把它像个人那样搭出来,它就自己能走路甚至能干点活,这都是非常有可能的事情。

我们的立身之本肯定是机器人本体,不过我们在 AI 方面也做了不少的事情,但比不上纯粹的 AI 公司。我们之所以要做 AI,也是为了让客户知道我们机器人的 AI 效果怎么样,你需要一个初始的软件系统。我们的核心还是希望有更多客户来用我的机器人,他哪怕买了硬件把软件(AI)全给删了,这也没问题。

所以我们现在也积极地跟各种大模型公司合作,我们非常愿意直接在我们产品上标配它的大模型。可以这么说,如果哪一天有人把 AI 机器人的模型做出来,我可以保证年底之前直接给他做 10 万个人形机器人。

极客公园:你怎么定义公司的目标?如果说OpenAI目标是成为最顶尖的技术公司,但这似乎不是你们的目标。

王兴兴:还是希望把产品做得更好一点吧,比如硬件成本、外观性能、客户友好性、包括功能等等。我们还是希望大家能接受我们的产品,最终让产品在工厂、服务业、家用等场景真正产生价值。其实无论客户对我们的印象是硬件还是软件,我觉得都无所谓。我们会投入 AI,但我们不会是搞专门搞基础 AI 的公司。

极客公园:现在有越来越多人形机器人公司出现,有一些也拿到了不错的融资,你怎么看待竞争?

王兴兴:我觉得因为行业确实非常热,所以很多人进来,这是不可避免的一件事情。但是对于我们公司来,包括对我自己来说,我们一直坚信就是我们要超越的,主要还是我们自己。

因为我们目前无论是技术层面、包括公司规模,都比市面上大部分公司都还是要好很多。所以如果我们盯着对方,其实也没有太大帮助。我自己,包括我们公司,主要是希望每天、每个月、每年有更好的产品技术,或者在商业化策略上有更好的进步。保持进步是最主要的一件事情。

极客公园:你自己花多少精力在探索新的东西上?

王兴兴:时间不太好说,不是特别确定和固定。

极客公园:身处AI大变革的时代,一方面技术还看不真切、但另一方面技术又会随时涌现,这是一种怎样的心情?

王兴兴:我觉得还是非常激动人心的,你只能保持探索的、学习的状态。比如说有什么新东西了,要尽早发现苗头,尽早把握机会。这一点,我们可能比大公司更有优势,因为大公司内部的流程体系有一些限制、团队会面临更激烈的资源竞争等等。

中小公司更能保持足够的前沿技术的敏感度,你得看到未来,你得足够灵活。如果你能预估未来 1 年、2 年、甚至是 5 年以后的整个技术路线,包括整个产品格局,整个世界格局是怎样的,你提前做布局去做,你肯定死不了。你能不能做第一不太清楚,但至少做到前几名,还是非常有可能的。

 

Posted in: 科技

AI 生产力工具竞速,进入产品力比拼阶段

作者 | Li Yuan
编辑 | 郑玄

AI 狂飙已经进入了 2024 年。

不同于 2023 年,用户对每个场景的 AI 产品都眼前一亮,具有新鲜感。进入 2024 年后,AI 产品在哪些场景切实可用,已经逐渐浮现。

对于普通用户而言,AI 搜索、AI 文档视频总结、AI 生成 PPT 等成为高频使用的 AI 能力。而 AI 文生图、AI 情感陪伴等则成为较多使用的娱乐功能。

随着使用 AI 成为常态,AI 产品进入比拼产品力的新阶段。在办公、学习等场景中,用户使用的产品会逐渐收缩至几个以内。而决定性因素,或许将不再是大模型参数,而是谁的产品用着最方便,体验最好,用户就会选谁。

如何在用户需要的场景中,做出最好的交付?

夸克近期推出了 PC 端,通过「系统级全场景 AI」能力,以快捷键、截屏、划线等方式缩短了交付路径,或许做出了一个很好的模式。

 

从智能搜索走向 AI 生产力工具

 

去年 11 月发布了千亿级参数的自研夸克大模型后,夸克一直在使用 AI 能力创新产品体验。

7 月中旬夸克 App 升级「超级搜索框」,2 天前夸克又发布全新 PC 端,基于大模型能力增强,能够给用户提供速度更快、结果更准的 AI 搜索等服务。

电脑是办公、学习场景中,最关键的工具之一。

夸克通过 AI 搜索积累了一批忠实用户。很明显,此次推出 PC 端,夸克将 AI 能力融入用户需求最多的场景中:AI 搜索、AI 写作创作、AI PPT 、AI 文件文件总结,用一个夸克在多端的不同场景中,满足用户对信息服务的需求。

笔者在 Mac 平台上尝试了夸克 PC 端。进入夸克,最明显的不同,就是左上角集成了三个标签页。其一是首页(AI 搜索),其二则是工具,其三则是网盘。

夸克将许多年轻用户最常用的功能,都集成到了 PC 端中,大屏的体验势必优于移动端。

比如夸克最擅长的 AI 搜索。大屏环境不仅让长篇回答的阅读更为流畅,还使搜索结果变得更加丰富。

笔者亲身体验了「西瓜怎么挑」这一搜索。夸克不仅响应迅速,还提供了图文并茂的详细解答,包括判断西瓜成熟度的图示说明。呈现方式让信息获取变得直观而高效。

笔者还试用了夸克的 AI 写作功能。

和通用型助手不同的是,夸克的写作功能,提前为用户针对性地优化好了多个体裁,都是用户最常使用的——实习报告、开题报告、调查问卷、思想汇报。

用户可以自定义主题和字数。笔者尝试写了一个研究用户如何使用 AI 的调查问卷,16 个问题不到半分钟生成出来了,有选择题有开放题,且生成完成后还能做针对性的调整,令人惊喜。

 

AI 生产力工具获得用户认可

 

进入 2024 年,用户对 AI 的需求已经明显走向两类。从七麦数据发布的《2024 年第二季度 iOS 实力 AI 产品排行榜》就能看出一丝端倪。

用户需求中,一类更偏向于 AI 生产力工具,最常用的功能包括 AI 搜索、AI 文档总结、AI 生成 PPT 等。这样的需求分散在多个 App 中,既包括夸克、豆包这样偏综合的 AI 应用,也包括 WPS、钉钉这样的场景性应用。

而另一类则是更偏向 AIGC 支持的娱乐向的需求。最典型的就是提供虚拟陪伴的星野,和曾经靠粘土滤镜出圈的 Remini。

不过,用户对于 AI 生产力工具的需求显然更多,受众范围也更加广泛。前十五名的 AI 应用中,此类产品最多。

这与目前 AI 验证过的能力有关。从去年开始,AI 生产力工具已经浮出水面。

在获取信息方面,AI 搜索已经能够成为很好的辅助。微软、Google、Perplexity 等公司纷纷在搜索中加入 AI 辅助,不少人也开始习惯和 AI 助手聊天来获取信息。

而文件总结、翻译、邮件撰写、PPT 生成等功能,也已经进入从学生到打工人的工作流中,产生了明确的效率提升的效果。

七麦数据发布的榜单中,占据榜单前五名的,绝大部分都能提升用户工作、学习的效率的综合应用。

如何在这么多效率工具中脱颖而出?

从目前来看,关键点在于对于用户的需求,有更细腻的洞察。

例如此次在榜单上登顶的夸克,其登顶的主要原因,就是抓住了对于年轻用户群体的需求。

夸克用户中,50% 以上都是 25 岁以下年轻用户。今年 6 月高考季,针对高考填报志愿的痛点,夸克率先推出了高考 AI 搜索,考生、家长可以用更加自然的语言,询问各类与高考志愿相关的问题并得到精准回答。

这一基于用户洞察的产品设计,直接将夸克带入了 AI 应用榜的榜首。七麦数据显示,在 6 月高考季,「夸克高考」AI 搜索的使用量超过 1 亿次。

在新推出的夸克 PC 端中,也能看出来这样的特点。除了专门上架了 AI 简历这样的年轻用户十分需要的效率工具,夸克还将更多的用户洞察,融入到产品细节的点滴中。

像此次夸克推出的截屏搜索功能,就体现得非常明显。在文档、网页场景中,通过截屏搜索,用户可以利用夸克已经建立好的题库搜题,或直接进行 AI 搜索。

 

用户到底需要几个助手?

 

在夸克推出的在众多新功能中,笔者认为快捷键,或是夸克的一个最重要的秘密武器。

只要安装夸克 PC 端,在 Windows 电脑按下 Alt+Space 或苹果电脑的 Option+Space,可以在任何界面,调起夸克的 AI 回答、AI 写作、翻译、AI 文件总结等功能。

AI 生产力工具落地初期,不少公司选择使用浏览器插件的方式来提升用户的使用效率。笔者就曾经使用过多个类似的工具,有的用来总结网页,有的用来翻译,而有的用来生成文字。在 AI 功能出现的早期,每个功能都能让用户惊叹的时候,浏览器插件尝试成本低,是一个不错的选择。

通过快捷键,夸克 PC 端能够将自己的 AI 功能扩展到超越浏览器的更多场景中,在这些场景中,都能成为用户使用 AI 的最短路径,完成更简单的交付,更好的交付。

效率类场景,作为 AI 应用最成熟,也是最为广泛接受的功能,已经被越来越多的厂商看到。从协同工具到办公软件,再到文档工具,各类应用都在积极整合 AI 功能以提升用户体验。

但从用户的角度看,同一个场景下,用户的需求最终是固定的。在同质化严重的产品中,用户使用一定会向产品体验更好,交付路径更短的产品集中。

正如移动互联网曾经展示过的一样,初期用户们都喜欢下载多个 App 尝鲜,但进入移动互联网后期,人们的使用习惯逐渐固定在几个超级 App 中一样。当移动互联网的新鲜感褪去,用户更愿意在一个熟悉的 App,如微信中,完成绝大部分的操作。微信更让人熟悉,更顺手,离用户更近。

AI 时代,这种趋势也已开始显现。

随着 AI 技术的普及和同质化,单纯依靠技术优势已经难以在市场中脱颖而出,比拼的是谁整体的产品更完整,体验更丝滑,对用户需求的洞察更细腻,谁更能在出现在用户手边。

在 AI 生产力工具竞争加速的时代,AI 产品进入了产品力比拼的阶段。

 

 

 

 

Posted in: 科技

特斯拉 Model 2,让小鹏造出来了,只要12万

2020年9月,马斯克曾透露特斯拉计划推出一款售价仅2.5万美元的新车(俗称 Model 2),并计划在三年内发布。然而,这一计划多次被推迟。

如今,特斯拉的野心,被小鹏汽车抢先一步实现。

8月27日,小鹏正式推出了MONA M03,售价仅为11.98万元到15.58万元。这是小鹏MONA系列的首款车型,其最大的亮点在于将智能化配置带到了15万元级别的车型中。此前,汽车智能化大多出现在20万元以上的车型上。

市场,给予了小鹏积极的回应。

数据显示,小鹏MONA M03上市后,仅用52分钟订单量便突破了1万台。

在过去10年中,小鹏经历了高峰,也走过绝望之谷,但现在站在开悟之坡上 | 图片来源:小鹏汽车

今年也是小鹏汽车成立的第十个年头。小鹏汽车CEO何小鹏在现场回顾了十年的发展历程,他形象地比喻这十年为「在血海中游泳」,并坚定地表示,相信小鹏终将「游到海水变蓝」。

那么,是什么让小鹏MONA M03如此吸引用户?它对小鹏未来十年的发展又有何重要意义?

MONA M03,想做「年轻人的第一台智能车」

早在2021年,何小鹏在第十三届中国汽车蓝皮书论坛上曾表示,15万元以内很难造出优秀的智能电动汽车,因为当时智能化的成本过于高昂。然而,随着技术的快速迭代,如今小鹏成功打破了这一局限,将不可能变为现实。

小鹏MONA M03最令人期待和兴奋的,莫过于小鹏擅长的智能体验。

小鹏MONA M03将智能化带到10-15万细分市场 | 图片来源:小鹏汽车

在智能座舱方面,MONA M03聚焦于三个最常用的功能——语音、音乐和导航。该车型配备了一块15.6英寸的中控大屏,搭载高通骁龙8155芯片和16GB内存,性能不错。

特别值得一提的是,MONA M03标配了同级少见的四音区语音助手,能够主动识别发出指令的乘客位置,并提供个性化的回应。

在音响系统方面,M03更是搭载了定制的18扬声器音响系统,支持7.1.4全景声场,配备顶置天空声道,带来沉浸式的听觉体验。此外,小鹏还专门为车机大屏开发了精致的沉浸式导航软件——音乐氛围地图。歌词会随着音乐节奏出现在屏幕上,桌面底部也会随着音乐产生波形律动,为用户提供独特的视觉和听觉享受。

MONA M03的智能驾驶在细分市场属于降维打击 | 图片来源:小鹏汽车

在智能驾驶方面,小鹏一如既往地展现了其领先优势。M03配置了同级少有的16GB大内存以及自主研发的智能驾驶算法,支持倒车入库、侧方停车和LCC辅助驾驶等一系列智能辅助功能。

从具体功能来看,售价11.98万元和12.98万元的版本,配备了自动泊车功能,覆盖了几乎所有高频车位,泊车成功率超过95%。这些版本支持断头位自动泊车、带限位杆的反向侧方位自动泊车,以及ACC、LCC等基础智能驾驶功能。

相比之下,售价15.58万元的Max版本更为突出,搭载了高阶智能驾驶功能。Max版提供了「门到门」体验,具备不限城市、不限路线、不限路况的「三不限」能力,实现了在全国范围内的卓越驾驶体验。

据悉,最初的产品规划中并未考虑加入高阶智能驾驶功能。然而,为了更好地满足用户的多样化需求,何小鹏宣布将P7+上的视觉方案应用到MONA M03上。

在这背后,是小鹏纯视觉和端到端技术的强大支撑。小鹏汽车自动驾驶负责人李力耘表示,他们致力于以用户能够负担的价格,提供最智能、从门到门的智能辅助驾驶体验。端到端技术带来了智能化研发方式和行为模式的变革。在传统规则时代,智能驾驶系统的改进往往是通过逐个解决问题实现的,比如提升感知模型的精度或为特定场景设计算法。

然而,今天的用户期望的是全国范围内无缝运行、不断优化的高阶智能驾驶体验,这对系统提出了更高的要求。端到端技术延长了整个研发链条。为此,小鹏每年投入35亿元用于AI研发,不仅在算力建设上持续加码,更重要的是通过大量数据的积累来支持这一转变。

目前,小鹏在端到端技术已经初见成效。据官方介绍,端到端大模型的应用,使得小鹏MONA M03的操作流畅度提升了20%以上,尤其是在处理窄路、掉头、环岛等复杂场景时,能力显著增强。

下一个10年,面向全球的AI汽车公司?

在发布会的开场,何小鹏回顾了小鹏汽车过去十年的重要瞬间:2018年,G3正式上市;2019年,经历了行业最为艰难的时期;2020年,P7的推出助力小鹏汽车成为新势力冠军,并成功登陆纳斯达克……

然而,2022年G9的上市事件标志着一个关键的转折点。尽管G9经过多轮预热,上市时却遭遇了负面反馈。问题在于G9的配置版本过多且混乱,八个不同的配置在价格上也缺乏竞争力。

面对挑战,何小鹏迅速行动。在48小时内,他推出了全新的配置表,将与「智能」相关的两个关键功能设为所有车型的标配,并在不增加价格的情况下给予用户更多优惠。这一举动在汽车行业中独树一帜,但也让小鹏付出了巨大代价。

这些经历使何小鹏深刻认识到两个问题:首先,小鹏过去过于追求技术和用户体验的极致,忽视了商业平衡的重要性;其次,所有问题归根结底都是组织的问题。尽管小鹏已是一家上市公司,每年有着庞大的交付量和营收,但内部组织问题依然严重。

经过一段时间的内心斗争,何小鹏最终决定掀起一场彻底的变革,开始「重新创始」小鹏汽车的组织,并在商业化上发力。这也标志着小鹏最近两年大调整的开始。何小鹏表示:「过去两年,小鹏经历了从1到2的重建,重塑了我们的体系,补齐了短板,忍耐了寂寞和嘲笑。」

对于小鹏的组织变革,外界感知最深的是多位早期创始团队成员和高层人员相继离职。与此同时,何小鹏投入大量时间挖掘新骨干力量,并引入了新的核心团队,重构了组织的骨干体系。他在2023年新款G9发布会上提到,原财报中的12位核心高管中仅剩2位。

MONA M03 的上市,让比亚迪等玩家感受到了压力 | 图片来源:小鹏汽车

 小鹏汽车的10周年既是回顾和反思的时刻,也是面向未来的起点。何小鹏在发布会上做出了三大「预判」:

  • 未来10年,中国主流汽车品牌将减少到7家;
  • 未来10年,年销100万台 AI 汽车将成为决赛入场券;
  • 未来10年,小鹏汽车一半的销量将来自海外市场。

此外,小鹏汽车宣布,未来10年将致力于成为「面向全球的AI汽车公司」。

小鹏未来10年的AI战略,将围绕机器人、汽车、飞行汽车、芯片和大模型展开 | 图片来源:小鹏汽车

在MONA M03发布会上,何小鹏首次披露了小鹏汽车的AI战略。他表示,「在接下来的10年中,我们将以AI汽车为核心,涵盖机器人和飞行汽车。同时,我们将芯片和大模型纳入闭环系统,只有全域全栈自研才能实现数据闭环。」

同时,何小鹏还透露了自研「图灵芯片」的进展。这款芯片已于8月23日成功流片,配备40核处理器,最高支持运行30B的大模型参数,未来将应用于AI汽车、飞行汽车和机器人等领域。这款定制化芯片专为AI和智能驾驶定制,与通用芯片有所不同。

至于端到端的自动驾驶大模型,小鹏计划分四步推进:第一步,现阶段的轻地图方案已经实现了「全国都好开」;第二步,2024年Q4,采用轻雷达+轻地图方案,实现门对门的智能驾驶体验;第三步,2025年中到下半年,推出类L3智能驾驶方案,百公里接管次数小于1次;第四步,2026年,实现部分低速场景下的无人驾驶。

此外,在今年接下来的1024活动中,小鹏将推出第二代人形机器人。这款机器人配备超精细的手臂,拥有超过60个关节,能够通过AI技术进行动态组合,并搭载端到端的大模型。

过去的10年间,以比亚迪为代表的车企通过电动化掀起了对燃油车的激烈竞争,尤其是在10-15万元的市场区间。如今,随着小鹏MONA M03的推出,智能化成为新的战场。这款车不仅仅是10岁的小鹏汽车为未来10年迈出的第一步,更标志着一个重要的回归——回归造车的本质。

何小鹏认为,真正的成功不仅依赖于技术的极致,更在于全方位提升产品的综合能力,逐一补齐短板。只有在这样的基础上,长板的优势才能得到充分发挥。MONA M03的推出,正是小鹏汽车在反思与蜕变后的结晶,它不仅代表了对过去的总结,更预示着未来的全新布局。

 

Back to Top