Posted in: 科技

为什么诺贝尔物理学奖,颁给了 AI 专家?

作者|芯芯

编辑|靖宇

 

我怎么能确定这不是个恶作剧电话?」

杰弗里·辛顿(Geoffrey Hinton)在凌晨两点接到诺贝尔奖委员会电话时,这是他的最初想法。

当时,这位 77 岁的「AI 教父」正在加州的一家酒店,网络信号微弱,电话信号也不好,当天本来打算去做个核磁共振扫描,检查下身体。

直到他想到,电话是从瑞典打来的,而且说话的人有浓重的瑞典口音,还有好几个人在一起,他才确定了自己获得了诺贝物理学奖这一事实。

这一通来自瑞典的电话打破了他一天的计划,也标志着他多年研究神经网络与机器学习的成果被世界进一步认可。

北京时间 10 月 8 日,2024 年诺贝尔物理学奖正式授予了他和另一位学者约翰·霍普菲尔德(John J. Hopfield),以表彰他们在机器学习与人工神经网络领域的基础性发现和发明。91 岁高龄的约翰·霍普菲尔德在收到消息时,同样「有些震惊」。

2024 年诺贝尔物理学奖得主约翰·霍普菲尔德和杰弗里·辛顿|诺贝尔官网 

在这一消息公布的同时,不少人的疑惑是——为什么诺贝尔物理学奖,会颁给看似离物理学有些遥远的计算机和 AI 领域?

 

物理学与计算机神经网络的交汇

约翰·霍普菲尔德和杰弗里·辛顿俩人,自上世纪 80 年代起就在人工神经网络领域做出了重要工作。

人工神经网络,顾名思义,源于对大脑工作原理的模仿。科学家们设想大脑的神经元可以通过计算节点的方式进行重现,这些节点通过类似神经突触的连接传递信息。这样的网络经过训练,可以增强某些连接,抑制另一些,从而使系统在处理复杂数据时具备学习与记忆能力,成为现代人工智能的基础。

1980 年代,拥有物理学背景的霍普菲尔德,开始着手将物理学概念引入人工神经网络领域,特别是自旋玻璃模型。

他的突破在于,基于物理学的自旋系统,提出了一种能存储和重建信息的联想记忆模型,这一模型使得神经网络可以通过不完整的输入进行自我修正,重建出原始模式——这就是「霍普菲尔德网络」。

霍普菲尔德网络的基本思想是:每个节点类似于图像中的一个像素,节点可以被视为系统中的能量状态,而这个网络的目标,是通过不断调整节点之间的连接权重,降低系统的能量,力图找到最稳定、最节省能量的状态。此时,网络输出的图案就是重建后的完整图案。这一机制不仅使机器可以重建部分丢失或受损的图像,还能从部分输入中提取出整体信息。

接着,以霍普菲尔德网络为基础,杰弗里·辛顿又将人工神经网络推进到了全新的高度。

当时,辛顿利用统计物理学的工具,特别是 19 世纪物理学家路德维希·玻尔兹曼的统计模型,开发了「玻尔兹曼机」,它可以学习识别某类数据中的特征元素。

玻尔兹曼机的核心在于概率。辛顿认识到,数据中的模式可以通过计算「可能性」来识别,机器可以学习哪些模式更有可能出现,哪些模式则相对罕见。经过训练的玻尔兹曼机可以识别它以前从未见过的信息中的熟悉特征。

在 20 世纪 90 年代,许多研究人员对人工神经网络失去了兴趣,但辛顿是继续从事这一领域研究的少数人之一。进入 21 世纪后,辛顿又与他的同事通过层层玻尔兹曼机进行预训练。这种预训练为网络中的连接提供了一个更好的起点,优化了网络识别图像元素的训练过程。

霍普菲尔德网络与玻尔兹曼机|图片来源:瑞典皇家科学院

得益于自 20 世纪 80 年代以来的工作,约翰·霍普菲尔德和杰弗里·辛顿帮助奠定了大约 2010 年开始的机器学习革命的基础。

说回来,他们在上世纪的突破性贡献,事实上首先源于对物理学中复杂系统的深刻理解。正是他们对物理学工具概念的应用,推动了机器学习与人工神经网络领域的发展。

与此同时,现代物理学本身也从人工神经网络中受益——因为人工神经网络逐渐成为物理学中强大的计算工具,可以用于量子力学、粒子物理学等领域。

诺贝尔物理学奖委员会主席指出:「得主的工作已经带来了巨大的益处。在物理学中,我们在广泛的领域使用人工神经网络,例如开发具有特定属性的新材料。」

「机器学习长期以来一直应用于我们可能熟悉的领域,从以前的诺贝尔物理学奖中可以看出。其中包括使用机器学习来筛选和处理发现希格斯玻色子所需的大量数据。其他应用包括降低碰撞黑洞引力波测量中的噪声,或寻找系外行星。」

「近年来,该技术也开始用于计算和预测分子和材料的特性,例如计算决定其功能的蛋白质分子结构,或确定哪种新材料可能具有用于更高效太阳能电池的最佳特性。」诺奖官方如此称。

 

物理或者 AI,都在尝试理解世界本质

虽说约翰·霍普菲尔德和杰弗里·辛顿两人的贡献灵感来源于物理学,他们的贡献也反哺了物理学和其他领域。

但与以往不同,2024 年的诺贝尔物理学奖,还是引起了大量讨论和争议,网友们的主要争论点就在于,两位得主的贡献,到底属不属于物理领域?甚至有人侃道,诺贝尔委员会想「蹭 AI 热点」。

诧异声之多,以至于诺奖官方都发起了一场投票:「你知道机器学习的模型是基于物理学方程的吗?」

诺奖官方下场问网友:你知道机器学习的模型是基于物理学方程的吗?|图片来源:X

对此,AI 领域的从业者们也展开了讨论,下面是他们的部分反应和声音:

智源研究院创始人张宏江表示:「Hinton 2006 年利用 RBM 做 DNN 自监督预训练,成功训练深度神经网络,可以说是这轮 AI 革命的先声,Hopfield 网络为 RBM 奠定了基础。接下来看看 AlphaFold 能不能拿生理学奖。」

出门问问创始人兼 CEO 李志飞表示:「数学模型用在物理和人工智能方面本质都是建模,只不过前者的建模对象是物理世界,后者的建模对象是智能,这样说起来是不是靠谱点?」

地平线创始人余凯也表示:「物理学研究的目的是理解自然界中物理系统的本质规律,从而可以去创造和发明自然界不存在的物理系统。比如从鸟可以研究空气动力学,基于空气动力学并不是构建鸟,而是飞机火箭」。

人工智能的目的在于首先去研究自然界中智能系统它的本质的机理,然后通过这些研究,其目的不是说是要去发明生物大脑,而是去构建有可能更加智能的新的物理学系统。」余凯认为。

余凯还注意到,这次的诺贝尔奖物理学奖得主有物理学背景,也有从统计物理角度看神经网络,其中一位还曾担任过世界知名高校的物理系教授,「早期搞人工智能的很多都是物理学背景」。

横跨多个学科领域的霍普菲尔德|图片来源:诺奖委员会

争议之外,约翰·霍普菲尔德与杰弗里·辛顿的成果,以及其获得诺贝尔物理学奖这一事实,除了证明人工智能如今的突破与火热,还点明了一个重要信息,即科学的突破可以不只局限于单一领域的定义,跨学科合作也自有其力量

比如,约翰·霍普菲尔德的确有物理学博士学位,他的早期职业生涯始于贝尔实验室,最初研究凝聚态物理,但当他在这个主要研究领域中的问题耗尽时,他又转向了新的领域。在 20 世纪 60 年代末,他探索了一下生物物理学,将固态物理学的概念应用于理解生物系统如何合成蛋白质。20 世纪 70 年代末,他又转入神经科学领域,将他在理论物理学中的技能应用于大脑问题,才有了前述开创性贡献。

什么是物理学?霍普菲尔德曾在他的自传中写道:「对我来说——因为我父母都是物理学家——物理学不是某种学科。原子、对流层、核、玻璃块、洗衣机、自行车、留声机、磁铁——这些只是偶然的研究对象。核心思想是世界是可以理解的,你应该能够拆解任何东西,理解其组成部分之间的关系,进行实验,并基于此建立对其行为的定量理解。」

在他看来,「物理学是一种观点,认为我们周围的世界通过努力、创造力和足够的资源是可以在预测和定量的方式下理解的。」

至于杰弗里·辛顿,在剑桥大学读本科期间,他尝试了一系列学科——生理学、物理学、哲学,直到 1970 年获得实验心理学学位。在 1972 年进入爱丁堡大学攻读人工智能博士学位之前,他还曾做过一段时间的木匠。

当诺奖工作人员问他「如何形容自己?认为自己是一名计算机科学家,还是从事这项工作时试图了解生物学的物理学家?」辛顿的回答是:「我会说我是一个不太清楚自己从事什么领域,但想了解大脑如何运作的人。在我试图理解大脑工作原理的过程中,我帮助创造了一项出乎意料的有效的技术。」

辛顿这一回答的信息是——不管你把他归为什么领域,或许都不重要,重要的是,他创造了什么。

AI 教父杰弗里·辛顿|图片来源:TIME100 AI

而且,奖项的设立有其历史背景和局限,如果奖项的设置者在世,愿意设立一个新的学科奖、或者跨学科奖其实也说不定。目的都是相同的,即褒奖那些推动人类知识进步的人。

此外值得一提的信息是,辛顿希望,获得诺贝尔奖能让他「更具说服力」,期盼人们能更加认真对待他提出的对 AI 的担忧

「在这些事物失控并接管的生存威胁方面,我认为我们正处于历史上的一个分叉点,在未来几年内,我们需要找到解决这一威胁的方法。」这是他现如今最想传达的一个声音。

头图来源:The Globe and Mail

Posted in: 科技

戴了「Ray-Ban Meta」两个月,我开始相信 AI 眼镜的未来

作者 | Li Yuan
编辑 | 郑玄
Meta 联合雷朋推出的「Ray-Ban Meta」智能眼镜(以下简称「Meta 眼镜」),可能是 2024 年最受关注的智能产品。
自去年十月发售起,Meta 眼镜已经在全球销售了超 100 万台。不过,其真实的销售潜力远不止于此——扎克伯格在许多场合提到,这款产品的需求量比预期更高,导致不少款式售罄,用户只能买到最基础的黑色款式。
Meta 眼镜的销量之高,甚至改变了扎克伯格的认知和 Meta 的战略:「一年半前你问我什么时候人们会更喜欢使用眼镜作为主力设备使用,我会说要到眼镜的显示效果足够好的时候。现在我认为可能有三种路径,其中一种是无显示屏只具有人工智能的眼镜。」扎克伯格讲道。
Meta 眼镜为眼镜增加了摄像、耳机,和最引人注意的——AI 功能。呼唤 Hey Meta,就可以与 Meta AI 对话。除此之外,这款眼镜没有加入任何 VR、AR 等增强显示效果的技术。但消费者对这样一副没有显示增强效果的眼镜趋之若鹜。
这或许是比销量更重要的,这款产品跨时代的意义所在。即在一种全新的交互范式下,我们或许正在见证智能眼镜像无线耳机、智能手表一样,成为一个数亿乃至十亿人每天使用的超级可穿戴设备。
为了验证这个念头,笔者自费购入了一台 Meta 眼镜与它一起工作、娱乐、生活,深入使用了几个月后,对于 AI 与眼镜结合带来的可能性,以及智能眼镜的未来,笔者有了新的想法。
可以每天佩戴的智能眼镜
首先必须要明确的一点是:从今天来看,AI 只能说是 Meta 眼镜的一个添头,卖爆本身还是因为这是一款好的眼镜。
在 Meta 2023 年 9 月推出这款智能硬件之前,Meta 和雷朋曾在 2021 年 9 月推出其联名的初代产品:Ray-Ban Stories。只看产品定义,两代产品似乎变化不大:都是采用雷朋眼镜的镜框进行二次设计,为眼镜增加了摄像和音频功能。
不过初代产品,在两年的全生命周期中,只卖出了 30 万台。而 Meta 眼镜,在 2023 年 9 月推出后,一个季度就卖出了 30 万台,且销量增幅稳定,加上 2024 年的上半年,Meta 眼镜已经出货量超过 100 万台。
相比之下,2022 年,全球智能音频眼镜市场总出货量只有 343 万副,而同样主打轻便的 AR 眼镜产品,2023 年整年,全球消费级 AR 出货量为 20.5 万台。
什么让 Meta 眼镜成为变数?
笔者认为 Meta 眼镜的成功,可以总结为一句话:这是第一款可用,且有用的智能眼镜。
前面提到,过去几个月里,笔者一直将 Meta 眼镜作为主力眼镜佩戴和使用。
这是一项不寻常的成就。
作为一个对于眼镜的舒适度和美观度要求偏高的消费者,能够将 Meta 眼镜作为主力眼镜,首先意味着,Meta 雷朋智能眼镜,做到了本身是一副好戴的眼镜。
对于消费者而言,一副好戴的眼镜意味着什么?
首先是外观。从外观来看,Meta 雷朋眼镜,与一副普通的雷朋太阳镜非常相似。

Wayfarer 太阳镜,非智能款与智能款的对比

除了眼镜正面的边角装饰位置,有细微的差别,一副 Meta 眼镜,看起来与一副普通的眼镜差别很小。
美观问题见仁见智,不过 Meta 眼镜用雷朋经典的设计,尽可能地绕开了科技公司在美学上积累不足的问题。笔者曾经将 Headliner 的眼镜给编辑部不少同事进行试戴,得到了「谁戴谁好看」的评价。
这一代的 Meta 眼镜目前共推出了 Wayfarer(方框)、Headliner(圆框)、Skyler(猫眼)三种框架,每种框架有四种颜色可以选择,镜片可选墨镜、变色、偏光和防蓝光的选项,也可以买后由消费者自己去眼镜店选购适配,尽可能给了消费者足够多的选项。
其次是舒适度。Meta 眼镜,官方重量为 48 克,已经接近了消费者佩戴眼镜的舒适区。在使用 Meta 眼镜作为主流眼镜之前,笔者日常佩戴的眼镜重约 30g,不常佩戴的大框变色眼镜,则重约 40g。
Meta 眼镜也着重保留了雷朋镜框镜腿的独特设计。在镜腿越过耳朵的位置,尽可能地保持了雷朋眼镜原本的弯度和渐细的曲线,以保证佩戴的舒适。

笔者采访的供应链人士告诉笔者,为了保证这样的镜腿曲线,Meta 没有采用常见的长方形或双椭圆型扬声器,而是特意定制了异形扬声器来保持镜腿的设计感和舒适性。

在笔者实际的佩戴中,佩戴 Meta 眼镜比起佩戴普通眼镜,眼镜的存在感还是明显更强——由于重量的原因,眼镜会更频繁地滑落,舒适度比普通眼镜差一些。不过,在长时间的佩戴中,这种不适感并没有强烈到无法忽视,在最初的不适应过去之后,笔者可以完全将其视为一副偏重的眼镜,进行正常佩戴。
不过,只有像眼镜,还不足以奠定 Meta 眼镜今日的成功。Meta 与雷朋联名的初代产品,外观与今日的 Meta 眼镜几乎相同,官方重量仅多出 1.2g。

能够将 Meta 眼镜作为主力眼镜进行佩戴,更关键的因素是,Meta 眼镜给了消费者一个足够好的理由,让其心甘情愿地将 Meta 眼镜作为主力眼镜而在这一代产品上,这一点是 Meta 的摄像和耳机功能。

在 Meta 眼镜的初代版本中,已经存在这两个功能,不过,当时这两个功能的可用性并不高。而这一代的 Meta 眼镜,则真正将这两个功能做到了「可用」甚至「好用」。
第一次戴上 Meta 眼镜,你会立刻感觉到 Meta 眼镜的不同。笔者戴上的第一反应,就是被其扬声器的音质惊艳。Meta 眼镜的音质,与音质较好的开放式耳机不相上下,听音乐也完全不觉得违和。
而视频功能,更是令人惊喜。事实上,在购买雷朋眼镜之前,笔者已经逐渐意识到有些记录生活的拍照需求,使用手机难以满足:比如在高速驾驶的情况下看到了美丽的风景、在骑马的马背上不允许携带手机的时候、在和儿童或宠物进行交流的时候等等。在这些场景下,掏出手机拍摄,并不是一个很好的解决方案。
之前的最优解是购买一个运动相机,不过随身携带运动相机,对于用户的要求仍然太高了。Meta 眼镜的出现让我看到了一种新的可能。
事实上,已经有不少视频创作者,因为这一功能成为第一代 Meta 眼镜的受众,不过第一代的 Meta 眼镜的相机只有 500 万像素,而新一代的 Meta 眼镜升级至 1200 万像素,第一次将视频/拍照功能做到可用。
在新一代的 Meta 眼镜上,只需要用右手长按镜框上的一个按钮,就可以开启摄像功能。如果不愿意用手操作,还可以选择语音操作——喊一句「Hey Meta,开始录制」。实际测试的效果来看,笔者认为已经接近几年前手机的录像水平,同时具有极强的防抖效果,最长录制时间三分钟。在高速转动的游戏设施上,Meta 眼镜能仍然保持较为出色的摄影效果。
结合五麦克风阵列的豪华收音——不少录音笔甚至不能达到五麦克风阵列的收音,戴着 Meta 眼镜回看录的视频,能够体验到沉浸式的音频体验,能够如身临其境一样,重新听到当时录视频时不同方位传来的声音。
在笔者购买 Meta 眼镜之前,曾经与几位拥有 Meta 眼镜的尝鲜者进行交流,其中促成笔者购买的主要原因之一,就是他们几位都没有将其闲置,而是真实地在生活中长时间地使用。Meta 眼镜高度可用的音视频功能,是他们愿意长时间使用最重要的原因
其中一位用户表示,他最喜欢在健身房里一边健身一边用 Meta 眼镜听歌。而在笔者追问为什么耳机不行时?他的回答是,「因为总是有可能,突然有有趣的东西出现想要拍摄。」
这一回答在当时看起来虽然有些随意,但在经过笔者自己的使用和与多名用户交流后,发现有这个心态的不止他一个,而是 Meta 眼镜粉丝们的共识。
眼镜是近视者生活中无法离开的一个必需品,听音乐、接打电话的长期需求,再加上一个记录生活的「万一」,让 Meta 眼镜的可用性超越了其佩戴的不舒适性,牢牢戴在每一个购买者的上。

Always on 的硬件与 AI 的化学反应
Meta 眼镜在 2024 年 4 月,加入了新的 AI 功能。
在产品刚推出时,Meta 眼镜本身也具备语音助手功能。用户可以戴上眼镜,呼唤「Hey Meta」连接特定的软件,进行简单操作,如拨打电话,调节音量或播放音乐。和现在的 Siri 作用相似,甚至更局限。
而让 Meta 眼镜正式成为目前最炙手可热的 AI 硬件的,正是这次 4 月份的更新。Meta 在对外发布 Llama 3 大模型的同时,宣布 Meta 眼镜的用户,之后再呼唤 Hey Meta 时,除了可以使用之前的功能外,将能够直接和由 Llama 3 的多模态的大模型对话。
除了最常见的问答之外,Meta AI 最亮点的能力在于可以使用语音命令「Hey Meta, look and…」,在这条命令后,Meta 眼镜会自动调用摄像头,拍下用户当前正在看的场景,调用多模态大模型的能力,回答用户的相关问题。
扎克伯格在社交媒体上亲自表演了一段。

在 Meta 新的固件更新中,还增加了对多轮对话的支持——在一轮大模型的回复结束后,会自动等待一段时间,用户可以进行追问而不必再次使用 Hey Meta 作为开头。
笔者也对 Meta 眼镜的 AI 功能进行了深度体验。
首先第一个优点,是 Meta AI极低的延迟
每次提问后,Meta AI 会有一个一秒左右的思考提示音。在大量尝试后,笔者发现,基本上所有的问题,无论是针对当前的视觉问题,还是普通的问答问题,Meta AI 基本上都能在一次提示音后给出回复。
笔者咨询了相关的产业人员,产业人员猜测,这可能源自 Meta 眼镜使用的高通 AR 1 芯片,在本地就对图片进行了简单的 token 化和预处理,才能达到这样好的效果。
而或许与极低的延迟相关,Meta AI 本身能力并不是特别强,且 Meta 似乎对 AI 的回复进行了长度限制,超过一定长度后,Meta AI 的回复就会突然停止,这导致 Meta 眼镜上的 AI 能力的另一个突出特征是:其能做的事,仍然很局限。
事实上,笔者曾经一度对于眼镜中加入大模型的合理性产生怀疑。
以眼镜 AI 最常宣传的一个功能的物体识别功能为例,受限于大模型的实际能力,和 Meta AI 本身的限制,Meta AI 在识别物体上的精确性并不高。
例如,如果问 Meta AI 房间里哪里有可以喝水的设备,Meta AI 可以指出房间中有饮水机,而要问到更精确的,如识别一下笔者购买的栀子花到底是哪种花,Meta AI 则识别了三遍才正确识别。识别一把小木棍大概有多少根,则数出来的数量与真实情况差距甚远。
在什么情况下用户会带着眼镜询问大模型哪里可以喝水呢?这样的需求几乎是完全人造的。识别花朵的需求虽然小众,但是是真实的需求,但是用户又为什么不掏出手机,在已经优化地非常好的识别植物的 app 里进行识别,而要使用不成熟的 AI,承受可能三次的错误呢?
在今年9月举行的Meta Connect大会上,Meta还为这款眼镜加入了实时 AI 翻译的功能。在现场演示中,扎克伯格讲英语,另一个人讲西班牙语,双方进行了一场对话,智能眼镜充当了翻译。在这一点上,AI的实用性似乎有所增强。不过,从效果来看,AI的翻译仍然还是有一定「时差」。
不过,当笔者真的将 Meta 眼镜作为主力眼镜,佩戴一个月之后,笔者意识到,一个 Always On 的设备+AI,产生的化学反应,可能是全新的。
眼镜,作为一个全天候架在眼前的设备,可以随时聆听我的召唤。对比呼唤手机上的「Hey Siri」,智能家居中的「你好小爱同学」,对眼镜呼唤「Hey Meta」,成本更低——无需在任何情况下考虑设备是否听的见,听得清,即使是在有杂音的地方低语,也能得到很好的回应。
改变是一点点发生的。
笔者原本使用 Siri 的主要场景,在于使用 Siri 快速放音乐,而 Meta 眼镜,作为一个几乎全天候佩戴的设备,很自然地成为了接收笔者语音指令的第一终端,也是控制音乐播放最方便的设备。Hey Meta 在这个场景下,轻而易举地就超越了 Hey Siri,成为了我的首选。
而一旦习惯呼唤 Hey Meta,一些全新的,没想过的自发需求就生长了出来。
比如,在无聊的路上,Meta AI 可以帮我念首诗,讲点新闻,玩猜数字的游戏。
比如,照镜子的时候,我会呼唤 Hey Meta,帮我看看是否是一个合适的穿搭。
没胃口的时候,也可以直接呼唤 Hey Meta,问问有没有什么可以合适夏天晚上吃的菜,有没有好的商店在我附近。
这些需求,有的 Meta AI 可以满足地很好——比如念一首诗,帮我提供夏夜适合吃的菜的灵感,而有的则暂时还做不到——比如骑行到一个陌生的地方帮我推荐一家附近的餐馆。
相比手机,眼镜有着独特位置优势——全天候佩戴的属性,加上是在脸上距离嘴巴最近的收音入口让笔者开始相信AI不断进步的情况下,智能眼镜有可能是比手机更适合作为 AI 载体的未来
扎克伯格在接受采访的时候也讲到:「眼镜替代手机,很可能像手机替代电脑一样。并不是人们不再使用电脑了,而是在很多场景下,人们首先使用手机来完成,而不是电脑。」
AI 代替显示技术,让眼镜成为第一入口的未来可见了
事实上,行业认为眼镜能够成为未来最重要的智能硬件的判断由来已久。
2012 年,Google 就发布了 Google Glass 的原型机概念。Google Glass 的原型机概念是美好的:在眼镜的右上方,增加一块光机,把数字信号投入到眼睛里。Google 希望这个眼镜能够做到替代部分手机功能——显示天气、消息、电话,用户可以佩戴它进行拍照、录影、导航等等。
Google Glass 愿景虽好,但最终呈现的效果却一般。续航短、发热严重不说,最终能够代替的手机的功能非常有限,无法承载新一代智能终端的愿景。
而吸取了 Google Glass 的教训,之后的智能眼镜走向了两个流派,一是不再强调替代手机的智能性,而将其主要作为一个消费电子的硬件来对待。如主打拍照分享的前三代Snap Spectacles 眼镜和主打音频功能的 Bose 音频眼镜。
而另一个流派,则在显示技术上不断加码,将越来越多的智能功能搬到眼镜上,甚至是让眼镜的智能功能超越手机——Meta 的 Quest 头显、苹果的 Vision Pro 就是这一路线的代表。
然而优秀的显示效果的代价,往往是沉重的重量,和常常被限制在家中游戏和观影的使用场景。眼镜获得了智能的能力,但是失去了 Always On 的场景——人们最初期待眼镜能够超越手机成为第一入口,看中的就是眼镜更便携,离用户更近,如果抬眼就能调用智能功能,自然比手机更容易成为第一入口。
而 AI 技术的出现,或者将带来第三条路。
在大语言模型技术出现之前,从手机、智能音箱再到 HoloLens 等 AR 眼镜也曾引入语言交互,但在当时,只使用自然语言进行交互的效果,很难称之为智能但只使用自然语言进行语音交互几乎很难称之为智能,这意味着以语音交互为主无法支撑起一个计算平台。
而在今天,大语言模型技术的出现,让单独的语音交互的体验,有了走向足够智能的可能性。虽然今天 Meta 眼镜上的 AI 仍然停留在交互玩具的级别,但我们完全可以预期随着大模型技术的发展,拥有摄像头和 AI 的眼镜能够替代今天手机应用的不少场景——无论是点外卖、扫码支付、获得陪伴、问大语言模型商店是否具有针对性的优惠,实际上在技术上已经都不再是挑战,差的只是平台的接口尚未打通。
而 AI 技术,也可能带来很多新的智能能力,比如长期的陪伴,针对个人生活场景真正个性化的推荐等等。
另外一个不可忽视的因素:经过 10 多年的发展,智能眼镜的几项关键技术都在近些年取得了突破,这也是 Meta 眼镜取得成功,以及支撑智能眼镜在未来几年快速增长的重要因素。
几名熟悉供应链的业内人士告诉笔者,在 Google Glass 时代,使用眼镜进行拍照、甚至进行一定的 AI 功能,续航和发热是不可解的。而 Meta 眼镜独家使用高通的 AR1 芯片,使得 Meta 眼镜的续航大为提升——官方表示单次续航约四小时。实测中,如果音乐、摄像功能的使用不频繁,甚至可以支撑更久。
除此之外,蓝牙芯片、摄像头清晰度、开放式耳机的声音调教都在近些年取得了不小的进步。
事实上,Meta 最初也并没有意识到这一代的 Meta 眼镜能够在消费者层面上获取如此大的成功。上一代的 Meta 眼镜功能相似,却没有取得类似的成功。但正是硬件领域持续不断的技术积累,推动了 Meta 眼镜的可用性质的飞跃,终于突破了智能眼镜佩戴舒适度的临界红线,使其成为消费者愿意长期佩戴的设备。
硬件性能已足以支持全天候运作,软件智能已达到纯语音交互即可胜任复杂任务的水平。
AI 取代传统显示技术,使智能眼镜成为人机交互第一入口——这条颠覆性的第三路径,或许已近在咫尺。
Posted in: 科技

「AI 教父」辛顿获诺贝尔物理学奖;曝 OpenAI 要求投资者不可投资竞对;黑神话手办官方品牌发文打假

2024 年诺贝尔物理学奖揭晓,获奖者之一是「深度学习教父」

10 月 8 日消息,为表彰其通过人工神经网络来实现机器学习而做出的的基础性发现和发明,本年度诺贝尔物理学奖被授予了美国普林斯顿大学的生命科学家霍普费尔德(John J. Hopfield)和加拿大多伦多大学的「AI 教父」辛顿(Geoffrey E. Hinton)。

瑞典皇家科学院在 2024 年 10 月 8 日发布的新闻稿中写到,两位获奖者利用物理学工具构建了多种方法,为机器学习奠定了基础。其中霍普菲尔德创建了可以存储和重建信息的结构,而辛顿则后续发明了可以独立发现数据属性的方法,两者对于目前广泛使用的大型人工神经网络至关重要。基于人工神经网络的机器学习正在颠覆科学、工程和日常生活。(来源:界面新闻)

霍普费尔德(左)和辛顿。来源:诺贝尔官网

OpenAI 要求新一轮投资者不可投资其竞争对手

​10 月 8 日消息,近日,AI 领域的巨头 OpenAI 在风投融资中成功筹集 66 亿美元,使其估值飙升至 1570 亿美元,引起业内广泛关注。然而,据《金融时报》援引三名知情人士的消息称,OpenAI 在融资过程中对投资者提出了特殊要求,即不得支持包括 Anthropic 在内的五家竞争对手 AI 公司。

针对这一排他性投资传言,特斯拉和 SpaceX 的首席执行官埃隆·马斯克在社交平台 X 上发表评论,批评 OpenAI 的行为称「OpenAI 真邪恶」。然而,OpenAI 新一轮投资者 ARK Invest 的首席执行官 Cathie Wood 则驳斥了该报道,称其为「不真实」。

目前,关于 OpenAI 是否确实存在排他性投资要求的问题,业内仍存在争议。但无论如何,OpenAI 作为 AI 领域的领军企业,其融资成功无疑为 AI 行业的发展注入了新的动力。(来源:ITBEAR)

 

地平线通过港交所上市聆讯,将赴港 IPO

​10 月 8 日消息,港交所网站挂出地平线 PHIP 版招股书,这意味着智驾科技企业地平线(Horizon Robotics)正式通过港交所聆讯,即将踏入港股市场。

截至目前,地平线软硬一体的解决方案已获得 27 家 OEM(42 个 OEM 品牌)采用,装备于 290 款车型,其中,中国十大 OEM 均已选择地平线的智驾解决方案。

在业绩表现上,2021 年、2022 年、2023 年,公司分别录得收入约人民币 4.67 亿元、9.06 亿元、15.52 亿元,年复合增长率达 82.3%;2024 年上半年,公司录得收入约人民币 9.35 亿元,同比增长 151.6%。(来源:新浪科技)

 

欧盟法院限制 Meta 使用 Facebook 个人数据投放定向广告

10 月 8 日消息,欧洲最高法院(CJEU)于 10 月 4 日裁定,Meta 必须限制使用从 Facebook 收集的个人数据来投放定向广告,即使用户同意将其信息用于广告目的,此举可能会对在该地区运营的广告驱动型公司产生严重后果。

欧洲联盟法院在周五的裁决中表示:Facebook 等在线社交网络不能将获得的所有个人数据用于定向广告,而不受时间限制、不区分数据类型;必须设置限制,以遵守欧盟的《通用数据保护条例》(GDPR)数据最小化要求。

值得注意的是,GDPR 第 5 (1)(c) 条要求公司将处理限制在严格必要的数据上,防止收集的个人数据(无论是通过第三方在平台内还是平台外收集)被汇总、分析和处理以用于有针对性的广告,而不受时间限制。(来源:IT 之家)

 

​美国做空机构兴登堡瞄准 Roblox 称其关键指标作假

10 月 8 日消息,美国做空机构兴登堡研究公司 10 月 8 日发布报告称,在线游戏平台 Roblox 自上市以来每个季度都出现净亏损,最近 12 个月的亏损总额达 10.7 亿美元。该公司股价为销售额的 8.6 倍,比游戏同行溢价 57%,这其中包含了对未来快速增长和盈利能力的预期。

而兴登堡研究表明,Roblox 在其平台上的「人数」方面欺骗了投资者、监管者和广告商,将这一关键指标夸大了 25-42% 以上,另一关键指标参与时长也预估被夸大了 100% 以上。(来源:财联社)

互联互通更进一步:微信端内可直接淘宝购物,支持双平台账号绑定

​10 月 8 日消息,三言财经发现,微信 App 里打开淘宝链接可以直接唤起淘宝 H5 界面并完成下单及支付,全程无需跳转回淘宝 App。

如图所示,用户可以在微信端绑定淘宝账号后实现正常的浏览、添加购物车、支付功能,收货地址也是淘宝里自己设置的地址;而且微信绑定淘宝账号后后续也不用再重复登录。

非要说不同的话,就是微信端的淘宝网默认只能使用微信支付(注:包括零钱、理财、信贷、银行卡等方式)。(来源:IT 之家)

 

黑神话手办官方品牌发文打假

10 月 8 日消息,@INART 微博发布公告称,根据部分玩家的反馈,发现一些网络销售平台店铺未经授权,擅自以公司官方品牌 Queen Studios、INART 及 MORFIG 的名义发布《黑神话:悟空》系列产品的「销售」、「先行预售」信息。

公司目前尚未公布关于《黑神话:悟空》系列产品的正式发售信息,也未对这些「先行预售」店铺进行《黑神话:悟空》系列产品的预售授权。(来源:界面新闻)

 

淘宝也做自营店,推出「淘精选」业务

​10 月 8 日消息,据 Tech 星球报道,淘宝上线了一项名为「淘精选」的业务,以自营店的形式内置在淘宝 App 内。据悉,淘精选是由淘宝官方运营,通过官方精选和服务为消费者提供性价比商品的官方运营品牌。

值得注意的是,淘宝此次推出的「淘精选」与「淘工厂」的运营方一致,同为杭州今日卖场供应链管理有限公司所运营。而相比淘工厂的作用,「淘精选」更像是为那些性价比商品提供一个曝光窗口。(来源:Tech 星球、IT 之家)

折叠屏新形态!小米新专利公布:上下屏可拆卸

10 月 8 日消息,在国家知识产权局 10 月 1 日公示的清单中,小米公司获得了一项新的电子设备发明专利,构想了未来折叠手机的新形态,可以实现拆卸操作

 

该专利于 2023 年 3 月 31 日提交申请,并在 2024 年 10 月 1 日申请公布,申请人为「北京小米移动软件有限公司」,发明人为高原。

从专利描述来看,该手机具有众多优点,如结构简单、制造成本低、尺寸小、屏幕大以及便于组装等。该专利申请中还包含了手机设计及其可拆卸机制的草图。专利中描述的手机整体设计看起来和小米 MIX Flip 折叠手机类似,手机背面配备了 3 个传感器和 1 个 LED 闪光灯,电源按钮和音量键则位于手机右侧。

这款手机在常规状态下为小折叠屏设计,然而其独特之处在于,在现有折叠基础之上,还能够拆卸为两个屏幕,但究竟如何实现的目前还尚不清楚。而在其中一张专利图中,该手机还可以像诺基亚 6260 一样旋转上半部分屏幕。需要注意的是,这目前只是一项专利,因此无法确认它将会在什么推出,但它让我们了解了未来的可折叠手机可能会是什么样子,以及小米目前正在研究的方向。(来源:快科技)

 

小鹏 P7+官宣 10 月 10 日首秀,全球首款 AI 汽车

​10 月 8 日消息,小鹏汽车今日宣布,小鹏 P7+将于 10 月 10 日全球首秀,宣传语为「因 AI 而生,越级登场」。据悉,新车将会成为「全球首款 AI 汽车」,预计四季度上市。

在 9 月举行的 2024 云栖大会上,小鹏汽车董事长何小鹏驾驶旗下全新车型小鹏 P7+亮相。

据悉,小鹏 P7+定位为全球首款 AI 汽车,不仅具备自主学习能力,采用端到端大模型与视觉系感知方案,还支持 100% 无图智驾。该车提供两种动力版本,分别为 180kW 和 230kW。续航里程为 575km-710km。(来源:凤凰网科技)

时代落幕,苹果宣布 iPhone 6、iPod nano 及 shuffle 停产

​10 月 8 日消息,苹果今天将第七代 iPod nano 及第四代 iPod shuffle 添加到其过时产品的停产列表中,标志着一个时代的结束。

除此之外,苹果同时还将 iPhone 6 添加到停产列表中,而 iPhone 6 Plus 此前早已列为停产;苹果还将 2017 款 12 英寸 MacBook 和第六代 iPad 添加到过时产品列表中。

根据苹果的说法,过时产品是指 Apple 停止发售之日起已超过 5 年但未满 7 年的产品。停产产品是指 Apple 停止发售之日起已超过 7 年的产品。

对于过时产品,苹果官方商店和 Apple 授权服务提供商可以继续为其提供维修服务,但前提是苹果仍能找到关于该设备的维修零件。对于停产产品,苹果会停止提供任何硬件维修服务,唯一的例外是 MacBook 电池更换服务(IT 之家注:部分型号为最后一次发售之日起最长 10 年),具体视部件供货情况而定。(来源:IT 之家)

Back to Top