标签：科技

传字节做「大模型研究院」，四处招人；小鹏 MONA M03 上市，11.98 万元起；美国大举「清洗」印度裔高管｜极客早知道

admin 2024年8月28日评论

OpenAI 神秘「草莓」项目计划最早今年秋季推出

据科技媒体 The Information 报道，OpenAI 神秘「草莓」项目，计划最早今年秋季在 ChatGPT 中推出。

上个月，OpenAI 的内部团队被曝出正开发的「草莓」（Strawberry）项目，目的是增强 OpenAI 的模型的推理能力。草莓」项目的前身是 Q*算法模型，Q*能够解决棘手的科学和数学问题。

The Information 表示，Strawberry 可以解决以前从未见过的数学问题，并且还接受过解决涉及编程问题的培训。但其能力不止于数学。如果给它额外的时间来「思考」，Strawberry 模型还可以回答客户关于更主观主题的问题，例如设计产品营销策略。在语言相关任务方面，Strawberry 可以解纽约时报的 Connection 字谜游戏。

OpenAI 内部正在推动通过一个称为蒸馏的过程来简化和缩小 Strawberry，这样它就被用于 ChatGPT。但是，猜测是尽管使用草莓后，这些答案可能更准确，但它们也可能更慢。

这意味着 Strawberry 可能不适合用户希望立即响应的应用程序，例如 OpenAI 的 SearchGPT 搜索引擎，但非常适合对时间不太敏感的用例，例如修复 GitHub 中的非关键编码错误。

而使用更大版本的「草莓」，正在被用于生成提供给 Orion 的合成训练用数据。Orion 是 OpenAI 目前正在开发的新旗舰大模型。

据报道 Open AI 已经向美国国家安全官员展示过这项技术。（消息来源：The Information）

消息称字节跳动正在秘密筹备成立大模型研究院

8 月 27 日下午消息，近日，据媒体报道，字节跳动正在秘密筹备成立大模型研究院，并招揽人才。原序智科技创始人秦禹嘉、原零一万物核心成员黄文灏已加入字节大模型团队。

针对上述消息，新浪科技求证零一万物，官方回应称：近期零一万物公司架构进行调整，将公司业务更聚焦。已经有来自国内外的顶尖模型训练、产品高阶负责人到岗履职，进一步落地「模应一体」战略，持续验证 TC-PMF。零一万物也即将有新方向的产品/解决方案推出市场，敬请期待。

另据知情人士称，字节跳动有加强大模型相关研究的长期计划，但并未决定建立独立的机构；黄文灏负责技术项目管理和规划，汇报给朱文佳。（消息来源：新浪科技）

「制霸」硅谷的印度 CEO，惨遭「大清洗」？

星巴克公司 CEO Laxman Narasimhan 日前的突然离职，推动了美国企业 CEO 离职数量创下历史新高，更被认为是美国对印度裔 CEO 的一次大清洗。

根据研究服务机构 exechange.com 的统计，今年在 Russel 3000 指数企业中离职的 191 名 CEO 当中，有 74 名属于被解雇或被动离职。通过分析公开资源以跟踪高管变动，并发现这是自其 2017 年起开始跟踪 CEO 离职趋势以来，同时期内高管下台人数最多的一年。

除了星巴克，Google、Twitter 等科技巨头也有计划「清理」印裔高管。马斯克接手 Twitter 后不久后的暴力裁员，其中包括印裔的 Twitter 前 CEO Parag Agrawal、法律事务和安全主管 Vijaya Gadde，据彭博社报道，Twitter 印度分公司的员工人数大约为 200 人，但裁员后只剩下约 12 人。

据彭博社报道，2022 年 11 月至 2023 年 1 月期间，美国有超过 20 万名科技工作者被裁。上述 20 万 IT 从业者中，30%-40% 是印度 IT 专业人员。自 2022 年底以来，美国约有 8 万名持有 H-1B 和 L-1 签证的印度 IT 专业人员面临失业。曾在亚马逊、微软、Google 和 Meta 等美国和加拿大公司担任重要职务的印度技术人员，由于大规模裁员，被迫回国。（消息来源：cnBeta）

星巴克前 CEO Laxman Narasimhan ｜图片来源：视觉中国

阿里云「无影」升级为一级部门，由 CEO 吴泳铭直接管理

8 月 27 日下午消息，在今日举办的阿里云无影年度媒体沟通会上，阿里云无影事业部总裁张献涛透露，阿里云智能集团无影事业部已从原来弹性计算产品线下的一个子产品线升级为阿里云一级事业部，由阿里巴巴集团 CEO 兼任淘天集团董事长、阿里云董事长与 CEO 吴泳铭直接管理。

张献涛指出，「今年年初，阿里云在梳理完产品线后便确定了两大战略产品，一个是 AI 大模型，另外一个就是无影电脑。」

在他看来，「未来十年，终端云计算一定会成为一个这个很重要的增长空间，随着技术的发展、云计算技术的成熟，这场算力革命一定会发生，并且已经近在眼前了。」（消息来源：新浪科技）

京东集团：未来 36 个月内将实施不超过 50 亿美元的股票回购计划

8 月 27 日消息，京东集团 8 月 27 日晚间在港交所公告，其董事会已批准一项新股份回购计划，自 2024 年 9 月起生效。

根据新股份回购计划，公司可于截至 2027 年 8 月底的未来 36 个月内回购价值不超过 50 亿美元（约 356.11 亿元人民币）的股份（包括美国存托股）。

京东于 8 月 15 日发布的 2024 年第二季度财报显示，京东 2024 年第二季度营收 2914 亿元人民币，较 2023 年第二季度同比增长 1.2%；归属于公司普通股股东的净利润为人民币 126 亿元，同比增长 92.1%。（消息来源：IT 之家）

比亚迪与华为展开自动驾驶合作

8 月 27 日，华为对外宣布，方程豹与华为在深圳签订智能驾驶合作协议。此次合作主要是针对比亚迪旗下方程豹汽车展开智能驾驶的深入联合研发，首款产品是即将在年内上市的方程豹豹 8，将会搭载华为乾崑智驾 ADS3.0，双方拟共同打造首个硬派专属智驾方案。

此前，早有传闻双方会在智驾领域有所合作，此次官宣算是靴子终于落地。据悉，双方团队已立项并研发验证了很长时间，预计于今年的 Q3 以后，豹 8 就将搭载华为乾崑智驾 ADS 3.0 正式上市。

双方对于这次重磅合作也极为重视，比亚迪集团董事长兼总裁王传福和华为轮值董事长徐直军均出席此次签约仪式。

方程豹汽车定位比亚迪旗下新能源个性品牌，主打 30 万以上级别的硬派越野，是比亚迪上探高端市场和越野车市场的重要品牌尝试。豹 8 是方程豹品牌的第二款车型，被比亚迪寄予厚望。（消息来源：界面）

夸克宣布 PC 端发布上新，升级 AI 搜索、AI 写作等功能

8 月 27 日下午消息，阿里智能信息事业群旗下产品夸克 PC 端产品上新，升级 AI 搜索、AI 写作、AI PPT、AI 文件总结等一系列功能，可一站式完成信息检索、创作和总结。

一个月前，夸克在 App 端推出 AI 搜索，此次一并在 PC 端发布，并升级了模型能力，提升了交互速度。此外，夸克 AI 回答的首字出现速度和吐字速度领先于行业，可瞬时给出精准答案。三栏式的界面设计能更清晰地展现图文、视频等生成式回答和网页，便于核心信息浏览。

针对大学生、白领等重度用户，夸克还可驾驭任何体裁的文章写作，当你输入主题和字数等要求后，夸克能撰写近 200 种类型的文稿，半分钟就能产出一篇高质量文章。夸克还提供多种方式撰写 PPT，比如输入主题智能生成大纲，或筛选模板再编辑内容，还支持 Word 一键转成 PPT。（消息来源：新浪科技）

小鹏 MONA M03 发布上市：11.98~15.58 万元，面向年轻人的 15 万级 AI 汽车

8 月 27 日晚举行的发布会上，小鹏汽车推出了全新 MONA M03，号称是「国内首台 20 万元内 A 级智能纯电掀背轿跑」：

515km 长续航版本 11.98 万元｜ 620km 超长续航版 12.98 万元｜ 580km 超长续航 Max 版 15.58 万元

MONA M03 将于今年 9 月起向用户开始正式交付，其中具备城市高阶智驾能力的 M03 Max 将于 2025 年春节后开启交付。

M03 展现出超越同级别车型的智能驾驶技术，特别是 M03 Max 版本，它是 20 万以下唯一配备高级智能辅助驾驶系统的车型。

小鹏 MONA M03 售价 11.98 万元起，何小鹏表示，所有版本的定价都是有利润的，一定会考虑当前环境下客户的想法，把技术进步回馈给车主，做到车好、价格可支付、同时正毛利。

上市 52 分钟，大定突破一万台。（消息来源：IT 之家、快科技）

零零科技海外推出 HoverAir X1 PRO / MAX 自拍无人机

8 月 27 日消息，无人机制造商零零科技今天在海外推出了旗下 HoverAir X1 PRO / PRO MAX 系列航拍无人机，该无人机定位自拍用途，是 2022 年 HoverAir X1 的后继产品，号称是世界首款「8K 飞行运动相机」，可以让用户「轻松拍出社交大片」。

两款无人机价格分别为：X1 PRO：标准价 499 美元，首发价 399 美元（当前约 2842 元人民币）。X1 PRO MAX：标准价 699 美元，首发价 599 美元（当前约 4266 元人民币）。

两款无人机在外观上完全一致，主要区别在于 CMOS / 避障传感器 / 机身存储，其中 HoverAir X1 PRO 搭载 12MP CMOS（FOV 104 度），可拍摄 4K 60FPS / 1080P 120FPS 视频，内置 32GB 存储空间。

而 HoverAir X1 PRO MAX 搭载 48MP CMOS（FOV 107 度），可拍摄 4K 120FPS / 8K 30FPS 视频，内置 64GB 存储空间，同时据称拥有「额外的视觉传感器」。

其他规格方面，两款无人机最高续航均为 16 分钟，最高起飞高度均为 5500 米，搭载 SmoothCapture 2.0 防抖技术，支持后方避障，可抗五级风。（消息来源：IT 之家）

绿洲乐队宣布重组，明年开启巡演

8 月 27 日，绿洲乐队（Oasis）在解散 15 年后宣布重组，并将于 2025 年前往卡迪夫、曼彻斯特、伦敦、爱丁堡和都柏林展开巡演，门票将于 8 月 31 日正式开售。

绿洲乐队是 1991 年成立于曼彻斯特的英国摇滚乐队，代表作包括《Don』t Look Back In Anger》《Wonderwall》等，2009 年 8 月因内部矛盾解散。（消息来源：新京报）

科技

赛博朋克能不能实现，就看这家公司了

admin 2024年8月27日评论

作者｜Moonshot

编辑｜靖宇

在智能手机之后，这几年还能激发数码迷们热情的硬件门类，莫过于混合现实了。

从微软引领出市场的 HoloLens，Magic Leap，Meta 围绕元宇宙打造出的 Meta Quest 系列，再到苹果堪称 iPhone 后最创新的硬件Apple Vision Pro，索尼、Pico 在游戏领域推 VR，Nreal、Rokid、华为、小米则瞄准了大众消费者的眼睛，推出一个又一个的 AR 智能眼镜。

这些硬件设备的共同之处都在于：让用户跳脱出 2D 屏幕，进入 3D 交互的时代。

在这些产品宣传片里，混合现实描绘出的图景又是那么鲜活且触手可及，在科幻电影和游戏里，未来看不到 2D 的屏幕，赛博都市的橱窗遍布着可交互的立体景观。

但无论 AR、VR、MR，目前还都脱离不了「头上顶盔，遮挡视线，一人独享」的使用障碍。

毕竟我们还处于一个看 3D 电影都要佩戴眼镜的屏幕时代。这类设备，还是数码极客或游戏迷昂贵的玩具。

但有家公司，想要丢掉笨重的设备，让混合现实肉眼可见，它提供了目前最抽象又最合理的方案，产品定价贵到离谱，但又能让人觉得它就是未来。

那就是 Looking Glass，一个敢把 16 寸显示器卖到 6000 美元，32 寸显示器直接标「要是你问价，你就买不起」，公司标语直接写：在头显之外，体验空间。

Looking Glass 的标语｜图片来源：Looking Glass

屏幕顶好的还带 M4 芯片的 13 寸的 iPad Pro 也不过要 1300 美元，Looking Glass 是真的狂，还是真有货？抑或想站在风口上，拿到投资后等着被大公司收编的噱头公司？

「银翼杀手」照进现实

Looking Glass 就卖一类产品：全息屏幕。

即无需佩戴任何设备，能让人肉眼可见，可交互的混合现实屏幕，放大到极致，就像《银翼杀手 2049》里的高斯林所见。

大家眼里的赛博感，首先得是立体的｜图片来源：银翼杀手2049

Looking Glass 成立于虚拟现实风口期的 2014 年，媒体对他们的评价是「技术非常酷，但价格过高」，此前他们 15 寸显示器售价 6000 美元（约44000 元），如今 16 寸只卖 4000 美元还算「普惠于民」了。

在 2020 年底，他们终于推出了第一款「亲民」的设备 —— 定价 349 美元（约 2500 元）的全息相框 Looking Glass Portrait。

这个相框可以提供多达 100 种不同的 3D 图像视角，而且技术比同年索尼推出的裸眼 3D 显示器还先进，因为索尼用的是技术是眼球追踪，Looking Glass 是在成像环节就实现了光线衍射，多人同时看这相框，都能看出全息 3D 的效果。

既然是相框，那怎么获取全息照片呢？照片用 iPhone 就能拍，再用 Looking Glass 提供的软件编辑成 3D 图像，拍视频则要用 Kinect 或英特尔的 RealSense 相机。

把全家做进立体相框确实很酷｜图片来源：Looking Glass

普适的使用场景（主打视频通话和家庭相框），普通人能负担的价格（众筹价 199 美元），以及「你的第一台全息设备」的口号，让 Looking Glass Portrait 在 Kickstart 上直接众筹超过 250 万美元。

尽管消费者的评价很好，但在新鲜劲儿过后，Portrait 还是沦为了桌子上的高级相框，或是极少数全息开发者的测试屏。

直到 2023 年，苹果在 iPhone 15 Pro 和 Vision Pro 上推出了空间照片和视频，举手即可拍摄空间影像，消费者反而发现，没有载体可以回看（如果你不买2 万人民币以上的 Apple Vision Pro 的话）。

Looking Glass Go｜图片来源：Looking Glass

8 月 8 日，Looking Glass 推出第二款「亲民系」产品，售价 299 美元的 Looking Glass Go，Go 有 6 寸的屏幕和一个可折叠支架，比 Portrait 更小更轻薄，仅重 235 克，叠起来和一台套壳手机差不多，苹果设备拍摄的空间影像可以直接通过 Wi-Fi 上传到 Go 上，Looking Glass 还提供了 2D 照片转 3D 的编辑软件。

而且 Go 不仅是一个相框，在生成式 AI 的影响下，Looking Glass 也找到了桌面级全息影像的新玩法：虚拟玩偶

这不比放我的照片好玩多了｜图片来源：Looking Glass

Looking Glass 设计了一款数字玩偶叫兔子叔叔，它有着全息的「身体」和接入了 ChatGPT 的「脑子」，它的声音像纽约黑帮老大，但是它会写诗，会陪聊，可以给你提供出游建议，也能帮助你检索信息。

而兔子叔叔，只是 Looking Glass 众多数字生物中的一个，其他形象还有柴犬、动漫女孩、公司员工以及未来的无限可能，比如某个明星，或是逝去的爱人。

毕竟如今的生成式 AI，已经可以和人谈上以假乱真的赛博恋爱了，Looking Glass 进一步赋予其一个可看见，可交互的载体，想象一下未来你走进球场时，你喜欢的球员全息投影在入口给你介绍赛事信息，你进入商店，品牌代言人不再是美丽的海报，而是会给你全息介绍商品，你回到家里就有个类似「贾维斯」的管家陪你聊天……在对全息屏的畅想里，仿佛《哈利波特》里的魔法世界，现代科技马上就能实现。

电影《哈利波特》里的壁画让「全息影像」概念深入人心｜图片来源：华纳电影

全息屏，潜力有多大？

无论是《银翼杀手》、《攻壳机动队》、《火星特快》这类科幻电影，还是《赛博朋克 2077》、《幽灵行者》这类游戏，我们早已在许多娱乐作品中看到过全息投影技术。

赛博朋克 2077 夜之城的全息景观｜图片来源：Cyberpunk 2077

在未来世界里，全息投影已经变成了像我们现在 LED 显示屏一样的存在。而在上世纪 70 – 80 年代，LED 刚开始应用时，也正是用于商业和工业应用，如广告牌、交通信号和特殊显示器等，当时一个大型 LED 广告牌就要数千美元到数万美元。而如今一个商场里，可能就有数十块大型 LED 屏。这个过程不过四十余年。

在广告和展示信息之外，全息屏就像其他混合现实设备一样，拥有着重新定义内容的潜力。

比如游戏和电影，VR 游戏已经发展很多年了，但仍离不开面对面却要头戴各自设备的尴尬，可交互的全息屏幕，或许未来小到可能变成肩部的宝可梦，大到能投影出一台麻将桌、乒乓球桌。

如果说苹果的 Immersive Video 给影像带来了广度，用 180 度的空间视频让观众身临其境，那全息电影将给平面的影像赋予空间的深度，实际上 Looking Glass 已经制作了第一部全息电影《Zanzibar: Trouble in Paradise》，是一部讲述海洋环境保护的短片，全片只用 iPhone 的空间视频拍摄而成。

VR 跑团游戏｜图片来源：Tilt Five

而在医疗保健、教育和工程等领域，十几年来都在试图把复杂数据和概念 3D 可视化，就像 iPad Pro 上的 3D4Medical、Visible Body 给医学生带来了很大帮助。未来，医学生可以肉眼可见人类心脏的全息模型，建筑师可以直接给客户呈现等比例建筑。屏幕已经改变了工作和学习的方式，全息影像只会更进一步。

Looking Glass 官网上的应用区｜图片来源：Looking Glass

「我们认为这将比从广播到电视的转变，或从黑白到彩色的转变更大。我们将一起到达那里。」Looking Glass 团队在官网写道。

虽然距离《银翼杀手 2049》里面真正的全息影像还有很长的路要走，但随着 Apple Vision Pro 带动的具有简单 3D 效果的「空间视频」技术下放到 iPhone 手机之上，可以想象此类音视频内容会呈现爆发式增长。而在显示端，除了各种头显，Looking Glass 的「全息相册」产品，或许会成为下一个爆发的品类。毕竟，现在再往桌子上放熔岩灯多少有点过于怀旧了。

LED 到全息影像用了四十多年，或许，2077 会比想象中来得更早一些？

科技

逛遍世界机器人大会，「人形机器人」离我们还有多远？

admin 2024年8月27日有 1 条评论

今年国内最受关注的产业展会，除了七月初的 WAIC（世界人工智能大会），就属八月下旬的世界机器人大会。

马斯克带起的人形机器人风口，加上大模型爆火后推动的具身智能热潮，让机器人赛道再次成为创业、投资的热门领域。有数据统计，2023年至今国内仅人形机器人融资就达到 80 亿元，再加上四足、工业用、医药、商用等机器人细分领域，机器人赛道的热闹程度相比 AI 也毫不逊色。

不过热闹归热闹，机器人初创团队，尤其是背景还不错的，拿到初始的第一第二笔钱并不困难。但要成长到更大规模，仅有技术概念或者产品原型远远不够，要有自己更突出的优势特点，以及把这些特点运用到现实场景，有能创造出更大商用价值的能力和潜力。

那么，在行业埋头狂奔了一年后，国内人形机器人和具身智能今天走到了哪一步？逛完今年的世界机器人大会，我们看到了这个问题的一部分答案。

参展人形机器人翻倍，机器人和真人一起逛展

人形机器人的爆火，首先体现在参展的机器人数量上。

2023年极客公园参加世界机器人大会的时候，曾对现场展示的人形机器人做出盘点，当时现场展出了约十几款人形机器人。

而今年，世界机器人大会现场展出的人形机器人的数量直接翻倍，达到接近三十款。

不止是数量，机器人的能力，也明显比去年有提升。

在去年的机器人大会中，虽然不少家机器人厂商，已经宣布了机器人具有双足运动的能力，但在嘈杂的现场环境中，只有一两家机器人企业现场实机展示双足运动。

而快进到今年，行走展示则成为了一个标配。

背后悬挂一根绳在固定展台上的行走展示是最基础的。

几家机器人公司，如去年就进行过行走展示的星动纪元，已经开始了绕场行走的测试。在其他展会中，你可能会看到机器狗和小车在人旁边并肩而行，而只有在世界机器人大会上，才能看到双足机器人和人并肩而行的魔幻场景。

再进一步，加速进化公司的小型人形机器人，已经开始让小朋友操作，进行踢足球的比赛了。

一向以运动能力著称的宇树的人形机器人，已经可以跳舞了。

而人形机器人运动能力的另一端，则是上肢运动能力。

简单的抓取箱子放置，已经显得不再稀奇。人形机器人公司，仍然可以在三点上进一步“卷”起来。

其一，是与AI大语言模型的结合。机器人可以识别人类的语义，更“聪明”地抓取物品。不过，限于场景的嘈杂，此次大会中展出的不多。

主要的人形机器人厂商本身，也并不自己训练AI语言大模型，而是选择和其他公司合作接入大模型。例如，科大讯飞在世界机器人大会上，就展出了其多模态AI套件。套件利用对于人嘴部的视觉识别和声音的拾取，可以更准确地在展会的嘈杂声音中，更精准地收音，已经与智元机器人达成了合作。

其二，就是动作的流畅性。此次，星尘智能的展示就令人惊喜。

星尘智能的机器人Astribot S1，此次在现场展出了写毛笔字、敲扬琴、打咏春拳等展示。不少观众用“丝滑”来形容星尘智能的机器人的动作。

星尘智能联合创始人来杰表示，这主要在于星尘智能的机器人，采集和训练的数据本身，多一重“力”的维度。

传统对机器人的训练，通常机器人分解任务后，会设计出一条行动轨迹，然后机器人以相对均匀的力度按照轨迹操作，因此动作显得相对僵硬。而星尘智能则在采集训练数据时，就创新性地增加了力的维度，让机器人的动作能更“有张有驰”。

而配合触觉传感器，在手部动作的精细性上，也会有所提升。“比如运用轨迹控制，切胡萝卜和切黄瓜，需要计算不同的轨迹。而人其实更多时候是用力反馈来判断操作，伸出手去，碰到黄瓜后开始用力。”来杰表示。

其三，则是抓取的成功率。

虽然在公众眼中，此次大会的不少机器人，看起来都能抓取物品，但在抓取任务，实际上存在不同的难度。在2024年进行了多轮融资的银河通用，就在展会上重点展示了其抓取能力——尤其是抓取拥有透明材料的水瓶的能力。

银河通用公司表示，银河通用在抓取的成功率上十分领先，原因之一是源自对于合成数据的训练。

在人形机器人的动作精细度上，最后呈现的成果，许多时候仍然要落在训练数据上。这点是与其他AI领域不完全相同的地方——机器人想要拥有具身智能，仍然需要大量数据进行训练，而这样的数据本身，还是很稀缺，也很贵。

最早能在年末看到人形机器人进入生活

与去年参加世界机器人大会，主要参展的人形机器人都是才做出来不久的产品不同，今年，头部的机器人厂商，对于产品的口径，已经统一地变成了接近量产。

量产是不是就意味着我们快要在生活中见到人形机器人了呢？

不尽然。

根据极客公园的观察，普通公众或将在生活中见到人形机器人，但这些机器人可能更多地仍然是展示功能居多，而非真正大规模地替代人类工作。

备受关注的稚晖君创立的智元机器人，在世界机器人大会期间，就宣布 2024 年，智元机器人预计发货量达到 300 台左右，其中双足人形机器人预计 10月起量产，年内发货 200 台。

智元机器人代表了一类人形机器人的产品思路。主攻工业场景，这些先进的人形机器人，将首先被应用在试点工厂中，与具体的工业场景进行磨合。

智元机器人已经是该类场景中的头部企业，不过量产，仍然大概只意味着百台量级的机器人在工厂里分散试点。

在智元机器人的发布会上，智元机器人还展示了另一个场景，是机器人替代人类，进行汽车销售——搭载了大模型的机器人，终于有了一点智慧的感觉。在智元的展示中，可以主动介绍汽车的功能，甚至在对话后发现客户口渴还可以主动倒水。

这算是人形机器人公司找到的一类场景：放置在公共场景，在特定场合进行展示、介绍、答疑。

虽然目前来看，技术和场景还有很多提升和挖掘的空间，包括在直播中，一部分观众的直观感受是会“有点尴尬”。但这一场景，倒是更有可能更快地出现在我们身边。

在智元的生态合作伙伴展台上，极客公园与智元的生态链企业数字华夏进行了交流，了解到在与智元合作的基础上，数字华夏公司已经拿到了不少订单，专门生产这种与人轻交互的人形机器人。

另一个在落地场景上，表现较为突出的，是银河通用公司。

由于抓取等能力上的突出应用能力，银河通用预计将在第四季度，与美团公司进行合作，开启智慧药店和智能零售的机器人店试点。用户可以直接通过与轮式行动的机器人对话，依靠机器人抓取，购买货架上的物品。

2024年上半年，亚马逊关闭了不少依靠视觉识别的无人零售店，被爆料其中一个原因就是因为视觉识别在很多场景下，仍然无法做到完全的智能，需要背后进行人工干预。

而依靠机器人的无人零售，或许将意味着一个新的无人零售的商业模式的开启。机器人直接从货架上抓取货物递给用户，能够避免店铺里出现复杂的状态，而将难度转换成机器人的抓取问题。

而除此之外，机器人本身的通用性，意味着相比于只是结账的无人化之外，机器人未来可能实现直接上货、摆货架、打扫卫生等多项操作，产生真正的无人零售。

对于更多的人形机器人公司，尤其是双足机器人公司而言，目前最重要的客户，仍然是科研客户。

逐际动力和加速进化，都是此次世界机器人大会中，展出的双足能力较为优秀的公司。在交流中，它们都提到，科研用户仍然是目前双足的人形机器人重要的客户。

“科研的需求还是比较大的。传统的运动控制、CV的科研人员都在转型AI，就需要新的构型去承载。比如原本做四足运动控制的科研人员，现在经常也在转过来做双足的运动控制，他们就需要一个好的本体来承载这些算法需求。包括感知、人机交互等等，都需要一个机器人来承载研究。”现场工作人员介绍道。

而家居场景，则是一个许多公司都会提到的未来愿景。

人形机器人最终的星辰大海，在于进入家庭，帮助做家务、照顾孩子、养老。

相对进展较快的UniX AI表示，其轮式双臂人形机器人Wanda将在9月进入小规模量产，年内预计将生产100台左右。初期的Wanda可以完成洗衣服、做汉堡、叠衣服、餐后清洁碗盘等任务。

笔者逛展时，发现一个很有趣的现象：在今天的机器人大会上，几乎每一个在展的机器人面前，都一定有一个工作人员，工作中的最重要的内容，就是防止好奇的人群，靠近机器人——即使是在机器人没有动起来的时候。

人形机器人想要落地，安全性是一个必须解决的问题——机器人尚不能做到全身遍布触觉传感器，在做动作的时候触碰到人类就有可能发生危险；反之对于精密的人形机器人来说，不是按程序设定行动的人类，一样是一种危险。

机器人会长一张人脸吗？

对于机器人专业的人而言，机器人像人，反而常常是不重要的。

机器人的原型机，常常连头都没有。目前各家人形机器人厂商的成型产品，最多也就是为机器人赋予一张简陋的emoji，来简单体现一下机器人的状态。

不过，此次在机器人大会上，极客公园还是发现了几家公司，在专门做机器人的脸部动作。

其中，除了每次参展都能引起不少人围观的Ex Robots的外观惟妙惟肖的机器人“苏轼”，此次机器人大会上，还有更专注于面部本身的Noetix公司参展。

Neotix公司的人脸，本身有29个自由度，脸部不止眼睛和嘴巴能够运动，还能做出更精细的表情，比如皱眉。不过，为了容纳足够多的电机在脑部，Neotix的机器人略显头大。

对于普通参展观众而言，机器人的人脸，显然具有天然的重要性。

主攻轻交互的数字华夏，为机器人装上了人脸，而它的人形机器人展示前，互动的人数显然更多。人们不厌其烦地测试机器人会不会被吓到眨眼，能不能盯着一个人看，也总有人想趁着无人看管摸摸机器人的脸。

Neotix公司的创始人表示，参展后，也发现了许许多多不同的长尾需求——很多商家很愿意展示一个有趣的人脸在自己的展台来吸引客户。

今天人形机器人产业还在从0到1做出一个有效产品的阶段，人脸显然不会是机器人公司优先级最高的任务，但如果未来几年，人形进入商用，甚至走入家用，不论是前面提到的机器人导购，还是天天和老人小孩面对面的陪伴机器人，脸部可能是手、足之后，机器人厂商需要攻克的下一个课题。

结语

在一年人形机器人/具身智能的投资狂飙过后，在今年的世界机器人大会上，人形机器人在机器人大会上的展出翻倍，而人形机器人的能力，也明显较去年普遍有了提升。

而在展台前积极交流的专业人士们，关注的重点，也已经机器人中用哪一款电机这样的具体问题，逐渐向人形机器人到底能够应用在哪些场景里，何时能够进行商业化了。

看起来，最早在今年年末，一批公司就将开启这样的场景落地的探索了。

而人形机器人真正进入普通人的生活，或者大规模在工厂内应用，行业里普遍认为，仍需最短三到五年，甚至十年。

不过，每年在机器人大会的现场，笔者都能看到一场新的人机关系的探索正在发生。

小朋友围着机器狗，像摸真的狗狗一样，试图和它们交流。

再专业的机器人领域从业者，有的时候路过一张逼真的机器人脸，也时常忍不住想伸手摸摸触感如何。

笔者在序厅路过一个围得水泄不通的拍照区，挤进去一看，原来是有人在模仿进行机器人表演。而周围的人，似乎无法分辨，互相询问，是真的吗？

人形机器人距离真正进入我们生活，仍然有一些距离。

但在世界机器人大会上，我们已经可以看到未来的一瞥：机器人变得越来越像人类，而人类也在被机器不断赋能。人机融合的时代，可能并不遥远了。

OpenAI 神秘「草莓」项目 计划最早今年秋季推出