Posted in: 科技

OpenAI 前科学家新公司融资 10 亿美元;飞书 CEO:今年 ARR 超 3 亿美元;淘宝计划接入微信支付|极客早知道

 

OpenAI 前首席科学家的 AI 公司融资 10 亿美元,估值或约 50 亿美元

由 OpenAI 前首席科学家 Ilya Sutskever 联合创立的 AI 初创公司 Safe Superintelligence(SSI)已筹集 10 亿美元现金,以帮助开发远远超过人类能力的安全的 AI 系统。

SSI 目前拥有 10 名员工,计划利用这笔资金来获得计算能力,并雇佣顶尖人才。SSI 将专注于在加州帕洛阿尔托(Palo Alto)和以色列特拉维夫(Tel Aviv)建立一个高度可信的小型研究人员和工程师团队。

SSI 拒绝透露其估值,但知情人士预计,其估值约为 50 亿美元。在此之前,人们对资助这些 AI 初创公司的兴趣有所减弱,因为这些公司可能在很长一段时间内无利可图。但 SSI 这笔交易表明,一些投资者仍愿意对专注于基础 AI 研究的杰出人才进行巨额押注。

参与 SSI 本轮融资的投资者包括顶级风险投资公司 Andreessen Horowitz、红杉资本、DST Global 和 SV Angel。此外,由 Github 前 CEO Nat Friedman 和 SSI 首席执行官 Daniel Gross 经营的投资公司 NFDG 也参加了投资。(来源:新浪财经)

 

淘宝发布公告计划新增微信支付能力

9 月 4 日,淘宝发布公告计划新增微信支付能力。作为目前淘宝主要的支付服务方,支付宝对此表示,开放、协作、创新、共享是互联网的基本精神,也是行业发展的大势所趋。支付宝会与淘天集团继续深化战略合作,加大科技创新和产品创新,为广大商家和消费者持续创造更大的价值。

支付宝还在回应中称,开放造就更大的未来,支付宝将在互联网技术、AI 技术产品和更广泛的生态加大开放合作,助力数字经济的生机与繁荣,也为支付宝平台打开更大的商业空间。(来源:财经网)

 

飞书 CEO 谢欣:预计 2024 年经常性收入超过 3 亿美元

在今日召开的 2024 飞书未来无限大会上,飞书 CEO 谢欣披露,飞书 2022 年 ARR(Annual Recurring Revenue,年经常性收入)达 1 亿美元,较 2021 年增长 2.7 倍。

据称,飞书 2023 年 ARR 达 2 亿美元,位列国内同类产品第一。他表示飞书目前月活用户数达 600 万人,预计飞书 2024 年 ARR 将超过 3 亿美元(IT 之家备注:当前约 21.36 亿元人民币)。

谢欣还提到,飞书通过对比 SaaS(软件即服务)行业中其他国内外巨头的 ARR 增速,飞书目前的发展和增长速度较为健康。如果看行业『老大』微软 Office,其用了 34 年达到了今天 200 多亿美元的(年)收入,所以这是一个需要 10 年以上的耐心和眼光来投入的行业。

此外,他对于飞书还给出了一个非常有趣的解读角度——飞书客户指数,简单来说就是用飞书的上市公司两年股价收益率不但跑赢了沪深 300,而且超额收益 37%。(来源:IT 之家)

 

高通再推AI PC 新平台,骁龙 X Plus 8 核覆盖更多人群

雷峰网消息,高通在柏林国际电子消费品展览会(IFA)前夕宣布推出全新的 AI PC 处理器骁龙 X Plus 8 核,这是继今年 4 月份推出骁龙 X Plus 10 核平台之后的又一新平台。

高通的新品进一步丰富了自身 PC 产品的组合,支持更多层级的 AI PC,在加速 AI PC 普及的同时,也让 AI PC 市场的竞争更加激烈。

骁龙 X Plus 8 核将帮助 OEM 推出 700-900 美元价格段的 Windows 11 AI+ PC 产品,宏碁、华硕、戴尔、惠普、联想和三星搭载骁龙 X Plus 8 核平台的设备将于即日起发售。骁龙 X Plus 8 核平台采用 4nm 工艺,从命名上就可以看出,CPU 是 8 核高通 Oryon,能够支持超快响应速度和效率,与英特尔 Core Ultra 7 155U 相比,相同功耗下比竞品性能高 61%,竞品在同性能表现下所需功耗要多 179%。

值得注意的是,骁龙 X Plus 8 核/10 核现在已经支持单个 boost 核心,过去是高端骁龙 X Elite 芯片所独有。

GPU 方面,骁龙 X Plus 8 核采用集成 GPU,支持三台外接显示器,能够确保卓越图形性能和沉浸式视觉体验。当然,骁龙 8 Plus 8 核的 GPU 性能也比骁龙 8 Plus 10 核稍弱。作为 AI PC 平台,骁龙 8 Plus 8 核的 AI 性能与骁龙 X Elite 核骁龙 8 Plus 10 核相同,NPU 性能都是 45 TOPS。其他方面,骁龙 X Plus 8 核还包括可选的 5G 支持、AV1 编码 / 解码、蓝牙 5.4、同时支持三个 4K / 60Hz 显示器,以及用于跨设备体验的 Snapdragon Seamless 功能。(来源:雷锋网)

 

百度官宣文心一言 APP 正式升级为文小言

百度官宣文心一言 APP 正式升级为文小言,定位百度旗下「新搜索」智能助手。区别其它搜索产品,文小言推出了富媒体搜索、多模态输入、文本与图片创作、高拟真数字人等”新搜索”能力,能满足用户搜、创、聊需求。同时,文小言独家首发记忆和自由订阅等全新功能。文小言即日起还将免费开放文心大模型 4.0 能力,所有用户整个九月均可免费使用。(来源:36 氪)

 

微软确认 11 月向英特尔/AMD 版 Copilot+PC 推出 AI 功能

科技媒体 Engadget 9 月 4 日报道,高通的 Copilot+ PC 独占期即将结束,搭载英特尔最新酷睿 Ultra 200V 系列、AMD 最新锐龙 AI 300 系列处理器的笔记本,将于今年 11 月开始使用 Copilot+ AI 功能。

这些 Copilot+ 功能包括:

  • Live Captions:实时生成字幕、包括翻译等等

  • 画图应用中 Cocreator:基于提示生成图片

  • Windows Studio Effects 图像编辑(背景模糊、眼神调整和自动取景)

  • 照片中的 AI 工具等

游戏玩家尤其感兴趣的是自动超级分辨率(Auto Super Resolution),类似于英伟达的 DLSS 的竞争对手,不影响性能情况下实时提升图形分辨率和刷新率。

此外还包括 Recall 功能,微软目前表示根据初期用户反馈进行调整,将于 10 月重新开放测试。

英特尔今天发布的 200V 系列处理器包含一个强大的神经处理单元(NPU),支持高达 48 TOPS 的本地处理人工智能模型和工具,更多信息可访问 IT 之家此前报道。

英特尔公司称,200V 拥有高达 32GB 的板载内存,是 “有史以来最高效的 x86 处理器”,封装功耗降低了 50%。(来源:IT 之家)

 

xAI 上线全球最强 AI 训练系统 Colossus,10 万块 Nvidia H100 GPU 加持

马斯克近日宣布,xAI 现已推出名为 Colossus 的大模型训练系统。

Colossus 在 7 月份初步建成,具备 10 万张 H100 GPU 算力。马斯克表示,将会在未来几个月内让 Colossus 的规模达到 20 万块 GPU,其中包括 5 万块 H200.

马斯克表示,Colossus 仅用了 122 天完成,xAI 团队、英伟达及其众多合作伙伴均做出了重要的贡献。(来源:品玩)

 

宏碁发布 Project DualPlay 概念笔记本:触控板可拆卸变手柄,弹出式扬声器

宏碁今天在柏林电子展 IFA 2024 上发布 Project DualPlay 概念笔记本。

这款概念笔记本有一个「巨大」的触控板,同时也是一个可拆卸无线控制器(手柄)。玩家只需将两根手指放在键盘顶部的释放按钮上,就可以取出无线控制器;同时两个 5 瓦的弹出式扬声器也会从笔记本电脑的两侧弹出。

IT 之家注意到,Project DualPlay 的无线控制器可以再拆卸成 2 个独立的摇杆,满足双人游戏玩家的需求;宏碁表示,这款概念笔记本在键盘、屏幕边框和触控板等区域,均配备动态 RGB 灯光效果。(来源:IT 之家)

 

Beats 预热 Powerbeats Pro 2 耳机,明年推出

Beats 旗下的 Powerbeats Pro 耳机自 2019 年推出以来,一直没有进行过重大的硬件升级。不过等待即将结束,今天 Beats 发布了一段预告片,宣布 Powerbeats Pro 2 耳机将于 2025 年上市。

IT 之家注意到,预告片中,棒球明星 Shohei Ohtani 展示了新款耳机的入耳式设计,可以看到耳挂仍然保留了下来。

2020 年,Beats 还曾短暂推出过一款 Powerbeats 颈挂式耳机,但一年后就悄悄停产了。事实证明,消费者更喜欢完全无线的设计。

初代 Powerbeats Pro 在充电方面存在问题,即耳机在充电盒里经常无法充电,希望 Beats 能够在续作中进行改进。此外,自 2019 年以来耳机音质的标准也提高了很多,因此期待新耳机在这方面会有所提升。

值得一提的是,Beats 的母公司苹果预计将在下周发布两款新的 AirPods 耳机。(来源:IT 之家)

 

OpenAI 2024 年启动 GPT Next 计划:AI 性能百倍级跃升,Orion 有望接棒 GPT-4

OpenAI Japan 出席 KDDI 峰会,介绍了公司即将推出的下一代 AI 模型,并宣布将在 2024 年启动 GPT Next 计划,有望在 AI 功能上实现大幅飞跃。

图源:itmedia

OpenAI Japan 首席执行官长崎忠雄(Tadao Nagasaki)表示,虽然 GPT-3 和 GPT-4 的性能比较接近,但 GPT Next 预计会有更大的飞跃,性能将提高 100 倍。

长崎忠雄于 2024 年 4 月成为 OpenAI Japan 的掌舵者,他在会上强调相比较传统软件,AI 技术正以指数级速度发展。

IT 之家援引 The Information 报道,OpenAI 目前正在开发两个新的人工智能系统:草莓「Strawberry」AI 模型主要提高数学和编程等领域能力,而「Orion」可能成为 GPT-4 的真正继任者,从而成为「GPT Next」。(来源:IT 之家)

 

Posted in: 科技

跟两位亲历者聊聊 OpenAI 崛起的关键:兴趣驱动的探索,而非目标导向的马拉松

 
文|黎诗韵
编辑|郑玄
 
我们被倡导要想明白自己的目标是什么、并做出计划。然而,两位人工智能研究者却认为,这只适用于普通的小愿望。
 
一旦涉及过于高远的、不确定能否实现的目标,比如打造AGI(通用人工智能)、登月计划等等——那么根据兴趣进行自由的、开放性的探索,才更能实现想要的。他们把这一观点写成了《为什么伟大不能被计划》一书。
 
在这本书出版的2015年,OpenAI成立,它一开始就确定了实现AGI的目标。九年间,OpenAI取得的巨大成功,似乎证明了人工智能界是一场「目标导向者」的胜利。「OpenAI看似是目标导向的,但实际上在内部,它有很多有趣的、开放性的探索。」本书作者之一肯尼斯·斯坦利(Kenneth Stanley) 告诉极客公园。
 
2015年,他任美国中佛罗里达大学计算机科学系助理教授,和前博士生乔尔·雷曼(Joel  Lehman)一起合著了该书。第二年,他们进入产业界,加入Uber AI团队。2020年,他们又一起加入了OpenAI,肯尼斯担任OpenAI「开放性研究团队」负责人。
 
OpenAI的CEO Sam Altman是他们这本书的推崇者。他曾在一个公开场合提到,OpenAI训练模型时会设定指标,指标的上升让人开心,「但对于找出一个新的研究范式,就不起作用了」。受书中观点启发,他愿意尝试更多新奇性探索,「我们愿意耐心等待数月、数年,大多数时候它(探索)并不起作用,但当它起作用的时候、效果惊人地好。」
 
加入内部,肯尼斯和乔尔看到开放性探索如何塑造了OpenAI的成功。例如ChatGPT本是一个意料之外的项目,它曾是内部几大方向中最边缘的;碰巧撞上了谷歌的Transformer架构;而Dario Amodei(前OpenAI研发副总裁、现Anthropic CEO)提出Scaling Law(缩放定律)是为了测试模型安全性、而非涌现智能等等。
 
随着2022年底GPT-3.5发布,全球人工智能行业开启了激烈竞赛。在二人看来,AGI仍然是一个遥远的、而非近在咫尺的目标,仅靠Scaling Law 这个「踏脚石」还不够。在这种情况下,开放性探索非常重要——而目前行业极具收敛的目标和计划、以及激烈的竞争,反而可能让研究走进「死胡同」。
 
即便OpenAI也面临挑战,乔尔感觉到,一种紧张的氛围开始在内部出现,开放性探索的空间也在缩窄。2022年,他们离开了OpenAI。随着人工智能越来越强大,他们希望更多研究一些开放性命题,比如AI会如何影响人类和社会、如何从哲学角度看待AI等等。
 
目前,乔尔加入了一家研究虚拟生命的公司,而肯尼斯创办了基于开放性系统的社交网络Maven、并获得了Sam Altman的投资。他们都在开放性探索的路上继续前进着。
 
以下为极客公园与肯尼斯、乔尔的对话实录,经整理后发布:
 

《为什么伟大不能被计划》一书的英文版 | 图片来源:受访者

 

OpenAI看似是「目标导向型」的成功,实则是「开放性探索」的成功

极客公园:先从这本书的起源聊起,我很好奇你们十年前是怎么想到提出「为什么伟大不能被计划」这个观点的?你们最早研究人工智能的「开放性系统」,做了图片孵化器、机器人迷宫等实验,好奇哪些事实让你们觉得这个观点是成立的、并且可以应用到除了人工智能以外的其他领域?
Kenneth:最初的想法来自于人工智能领域的研究,也就是我们所说的「开放性系统」(Open-Endedness)。这种系统早已存在,比如生物的演进,在几十亿年中,从单细胞进化为各种各样的动物。又比如简单的发明创造,我们可能花了数千年,才创造了一个轮胎、空间站和计算机等等。
作为历史学家和计算机科学家,我们希望用算法打造一个「开放性系统」,想了解它的工作原理,怎么不断创新、产生非常有趣的东西。所以我们做了「图片孵化器」网站。这个 AI 系统没有任何目标,人们随机在上面将不同图片进行「繁殖」,这些图片会构成类似生物学「分支树」的关系。
虽然每个用户都是从乱涂乱画开始的,但渐渐我们看到了一些熟悉的、可辨认的图片,比如蝴蝶、头颅、行星、汽车等等。我们进而得出一些有意思的洞察,比如你孵化出了一张酷似车的图片,但你最初并不是以此为目标的。而如果你以此为目标,你根本得不出这张照片。这是矛盾之处。遵循这样的原则,我们提出了基于新奇性探索、而非目标驱动的搜索算法。
最后我们发现,这不仅适用于算法领域,也适用于个人和机构。每一个个人和机构都会设定目标,但这种目标驱动并不总是对我们的创造和发明奏效。Joel和我觉得这个过程非常重要,值得公开说出来。我们试图找到相关信息、并进行多次对话,这就是我们这本书想法的来源。
 
极客公园:可否理解为这本书的核心观点是,无论在算法、个人还是组织层面,面对一个更遥远的目标,制定计划不如自由探索有效?
Joel:一般来说,普通的做法是我们树立一个目标、制定计划。但我们是不制定目标、只是去探索新奇的东西。比如迷宫里的机器人,如果给它制定走出迷宫的目标,那它可能很难走出这个死胡同。但如果不告诉它去哪里、而是让它自由探索,它会更容易走出迷宫。
 
极客公园:我注意到,在你们刚出完这本书不久的2015 年,OpenAI 成立了。这家公司从创立起就确定了一个非常伟大的目标,那就是实现AGI,它的每个步骤都是围绕这个目标进行。今天我们看到,OpenAI似乎取得了成功。所以我想问,在你们这本书出版后的十年里,OpenAI的故事是否反而证明了「目的驱动模式」的成功?
Kenneth:非常好的问题。我认为非常重要的一点就是要注意到,OpenAI虽然取得了一定的进展,但还没有取得AGI的成功。另外,我们也要意识到,公司往往会向公众讲述目标,但这其实是它们一种叙述的手段,这并不意味着企业内部就是这么推动工作的。
如果你去看OpenAI的幕后,你会发现它们不仅仅是目标导向的,它们也有很多有趣的、开放性的探索。实际上,ChatGPT就是这样一种开放性探索,它是在一个意料之外的项目。我并不认为OpenAI的工作人员最早就设立了要做ChatGPT这个项目(的目标),或者说预见到了它能取得如此巨大的成功。它们只是在探索过程中发现这个项目非常有意思,然后一步步更新迭代才有了今天的ChatGPT。
我们书中也提到过,创新究竟该如何推进呢?其实就是我们从有趣的一些想法开始,那究竟它是否会将我们引导向最终 AGI 的成功呢?其实这并不一定,但这是非常重要的一步,它们最终都有可能带来革命性的变化。
另外,它也能实现其他一些重要的成就,比如吸引更多的投资。我们知道GPT-2并没有带来巨大的革命性变化,但我们仍然要尽可能地宣传,才能吸引更多投资来发展GPT-3、GPT-4,并最终向AGI的目标前进。OpenAI就是这么做的,这正体现了我们书中的观点。
Joel:OpenAI看上去是一个目标导向型的成功,但其实OpenAI刚成立的时候,内部有尝试很多不同的发展方向。比如当时他们非常看重强化学习,包括视频、游戏的强化学习,为此内部做了很多尝试。
而且GPT背后的核心技术是Transformer架构,这是由谷歌推出的,所以OpenAI也是在谷歌这样的巨人的肩膀上不断发展的。如果回顾10年前、20年前、30年前、40年前,没有这么多「踏脚石」的情况下,OpenAI也不可能取得这样的成功。
 
极客公园:你们定义了OpenAI看似是目标导向、但其实是自由探索式的成功。OpenAI内部人士曾跟我们说,铺垫GPT 3.5 的几个「踏脚石」都是随机碰撞出来的,比如聊天机器人曾是内部最边缘的项目、碰巧撞上了谷歌的Transformer架构、而Dario提出Scaling Law也不是为了智能涌现而是想测试模型是否安全……这是否跟你们了解的情况接近?
Joel:是的,这些随机探索的确是非常重要的。尤其是OpenAI,它很早就开始推进 Scaling Law等尝试,并且不断在做选择,这是非常正确的。
Kenneth:的确探索很多时候是随机的、根据兴趣进行的。但Dario提出Scaling Law,这不仅是一个随机的探索、这其实也是一个目标导向性的做法。
这背后是团队从自己的兴趣出发、做了很多尝试,想要找到解决方案,最终提出了Scaling Law这个解决方案。这某种意义上也是一种目标导向。
 
极客公园:所以开放探索和目标驱动并不是彼此对立的,而是可以统一和融合的?
Kenneth:的确两者是可以并存的,能够从一方转向另一方。但是在我看来,这其实也是一个非常困难的问题。什么时候该进行转向?什么时候是目标导向、什么时候是兴趣导向?这非常微妙,很难去找到最佳的转变时机。
 
极客公园:你们能够看到 OpenAI的内核其实是一个「开放性探索」的组织,这是当初吸引你们加入OpenAI的重要原因吗?
Joel:哈哈,有许多原因。一个最主要的当然因为OpenAI是AI领域的前沿公司。另外,它的确一开始就是一家「开放性探索」的公司,虽然它们肯定有一些目标导向的元素存在。这与我的个人兴趣也是相关的。所以确实很难拒绝这样一份工作。
 
极客公园:那么Sam有看过你们这本书吗、他是否认同你们提出的「开放性探索」观点?这是他招募你们进入OpenAI的原因吗?
Kenneth:Sam 非常喜欢我们书中的想法,我相信他是在观看了我关于这本书的演讲时接触到这些想法的。他曾在公众场合提到,他受到了这本书的一些想法的影响。Sam 对这些想法是非常包容和开放的,我觉得他暴露在这些想法当中、他认为这些想法非常有意思。
当然,我在OpenAI也不仅仅是因为Sam,内部很多人都有开放的想法。比如Jeff Clune(前OpenAI研究团队负责人),他在我们之前加入OpenAI。他也觉得,开放性探索是一个有趣且值得投资的领域。我们在那个时候达成了共识,所以我们被雇佣了。
在我看来,这本书并不是OpenAI的工具书。但我相信,这一文化确实对他们有影响,开放性探索是非常重要的。
 
极客公园:Ken当时是OpenAI「开放性探索」团队的负责人,当时OpenAI对你们的期待是怎样的?有给你们制定了怎样的目标吗?
Kenneth:我们面临的挑战在于,几乎任何一家公司都会感兴趣设定目标。但如果我们探索的一些想法,并不完全是目标导向的、甚至会背离目标的话,我们肯定会面临一些沟通上的挑战。这有一些复杂,因此在日常的工作中,我们需要取得一个平衡。
有时候很难理解我们来自哪里、雇佣我们干嘛。他们可能会非常奇怪,觉得我们做的是非客观性的一些东西。不过最终他们意识到,对于推动AGI来说,这些工作是非常有用的。这已经超出了传统团队的认识。
Joel:这里面分为两部分:一个层面是关于组织的架构,很多人会困惑我们的工作,所以我们要跟他们解释我们在做什么,并找到我们工作跟AGI目标的关联度;另一方面是我们实际工作的开放性,要创造新的东西。
就像Ken说的,我们需要在公司内部找到一种开放性的方法,既要让大家了解我们在做什么,也要新奇探索、取得进步,这两者的平衡是一种微妙的舞蹈。
 
极客公园:你们是否感受到,在「开放性探索」上,OpenAI这样的初创公司可能比科技巨头做得更好?我曾听说,Google虽发明了 Transformer 架构,但没有率先做出GPT,是因为它的技术路线更目标导向——Google更强调 Encoder(输入),因为它可以解决更多具体业务问题;而 OpenAI 更强调 Decoder(输出),因为它没有那么强的业务导向,更愿意像无头苍蝇一样做「开放性探索」,你们怎么看?
Joel:我的理解是谷歌也有这种对话模型,也是很领先的。谈到好奇、兴趣、技术能力、率先应用于大众等,我认为其中包含了不同的变量。谷歌是一个更大的机构,可能有更多的「橡皮章」、繁文缛节这些东西,而OpenAI可能更开放。
Kenneth:我只是想说,涉及到任何一个大机构的成功,都包含了很多要素。不过我有一点我同意,OpenAI确实在探索方面做得更好、它有更大的意愿去冒险,而谷歌可能在这方面更加谨慎和犹豫,比如在公众面前展示技术,谷歌可能会慢一步。
这可以理解。因为谷歌作为一个大公司,在发布东西之前,需要做很多尝试和实验。他们更不愿意失败,它对于风险更有顾虑。但这并不一定是确定的,只是我们的看法。
我们看到,谷歌注重强化学习和各种方法,OpenAI也注重强化学习、并在不同领域下注,最终它们都取得了成功。
 
极客公园:距离你们当时写这本书已经过去快 10 年了,中间你们还加入了OpenAI、Uber等科技公司,经历了这些再看这本书,你们觉得书中哪些观点仍历久弥新?哪些需要变化更新?
Kenneth:回头望,这已经是我们这本书出版的第九年了。关于建立目标,我们有过非常多的、激进的争论,但许多事情随着时间的推移得到了验证。
正如你刚才提到的一些例子,有些人可能会认为有些目标是有效的。但在过去十年的时间里,我们越来越发现,目标导向有时会让人感到困惑,会让你有盲点、抓不到其他机会、看不到更多的可能。我们认为十年后、甚至一百年后,这个观点可能都不会过时。
在每一章中,我们都引入了一些历史案例和引语,比如「行者无疆」——一个好的旅行者是没有固定计划的,他对于要到达哪里并不太清楚——我不确定中国的哲学家老子是否在几千年前提出了这种描述。这是一种哲学的观点、一种经验之谈,并不是有很多科学证据,有时候听上去是反直觉的、是一个离经叛道的东西。
社会中确实有一些问题,例如,整个社会的组织都在围绕目标推动,并且把「目标是非常重要的」这种文化意识强加给我们。以教育为例,老师根据考试内容教学、学生根据考试内容学习,这就是目标对教育的影响。在书中,我们强调了目标的影响是无处不在的,我们需要去挣扎往前走。
再次强调一下,我们认为「伟大无法被计划」这个观点,是不会发生变化的。如果我们的人生只是目标导向的话,将无法取得完整的幸福。这也是为什么我们这本书如此成功和受欢迎的原因。
 

沿着Scaling Law、卷模型性能,可能会走到「死胡同」

极客公园:虽然你们反对「目标导向」,但似乎目前全球人工智能界的目标都非常收敛且明确,一是追上OpenAI等公司、二是尽快实现AGI,你们怎么看这种现象?这种「目标至上」会是你们反对的吗?
Kenneth:谢谢您的问题。我同意在目前的人工智能行业中,大家定了这两个宏伟的目标,觉得「北极星」就在那儿、我们要朝着那儿走。不过回到我一开始说的,企业往往会对外有一套说辞,但它们内部可能并不是这样做的。
我主要想谈一谈,我们到底离这样的目标有多远?如果说只差一个「踏脚石」、离得非常近,就像上世纪60年代制定登月计划的时候、已经有很好的技术基础,那么我们可以通过制定目标去实现。
但问题在于,如果我们还需要很多个「垫脚石」、离目标还很远,那设定目标可能会让我们陷入困境、无法前进。历史上有很多这样的例子。比如在2017年,我们听到有人说第二年就会有自动驾驶汽车上路,但其实不是这样。
因此,单纯采取目标导向的方法往往会无法实现目标,可能是因为目标设定的时间太早、或者太过雄心勃勃。很多人认为现在人工智能领域只差一个「踏脚石」,只需要扩大规模就可以了,这其实是过于简单化了这个问题。但在我看来,真正核心的「踏脚石」还没有被发现、我们并不仅仅差一个「踏脚石」。我们很可能正在陷入目标的陷阱和迷思之中。
Joel:的确我们现在处于一个「荒诞」的历史阶段,全球的科技公司都在追求AGI,这种过于聚焦的目标是人类「革命性的时刻」。但我们要知道,AGI的发展还要很长的时间。
现在许多人认为,只需要扩大规模、参数,有更多的数据和算力,就可以可发展人工智能。这对我来说有些无聊,或者说有些无趣。这并不是最核心的「踏脚石」,我相信还有其他的路径和方法需要我们去探索。
 
极客公园:为什么我们离AGI不只是「一步之遥」、不只差一个「踏脚石」?你们做出这个判断的依据是什么?
Joel:我们到底距离AGI有多远,其实大家是有认知偏差的。就像自动驾驶一样,并不太清楚到底需要多少个「踏脚石」。我们唯一确信的是,如果有一步之遥的东西,你必须要在那里、你必须去做、必须去放大。
Kenneth:最近有一个类比,GPT-3就像是一个孩子,GPT-4像是高中生。但实际上,ChatGPT更像是教科书中的知识,在某些方面,它可能超越了我们,而在其他方面,它可能不如我们。奇特之处在于,我们会感到某些东西非常接近了,但这不一定是AGI。
但我们也不清楚究竟还要等待多久。我们甚至可能需要一位「爱因斯坦」的出现,才能达到下一个台阶。
 
极客公园:这让我想到你们在书里提到,其实从单细胞到人类的进化过程中,重要的「踏脚石」不只是智力,还包括对称性等。那么对于AGI 来说,Scaling Law 带来的智能提升会是一个靠谱的踏脚石吗?它能支撑多久?
Kenneth:智能这个词很容易让人困惑,因为它涉及许多方面。Scaling Law遵循一些普遍的原理,但它也会丧失一些东西。比如在技术上,你必须将大量人类数据进行更好的压缩和训练,它不再是传统意义上的智能、而是不断提升的智能。我们最终可能会遇到一个瓶颈或死胡同、会在训练上遇到走不下去的时刻。
就像OpenAI在不断扩大规模、增加参数,但它还是遇到了瓶颈(注:比如GPT-5处于难产状态)。这也是为什么我们需要新的踏脚石。
Joel:如果想要达到AGI那模糊的彼岸,有点像做一个赌注,很多明显的路径都必须要去尝试。因为AGI可能不仅来自AI,还可能来自数学、哲学和其他领域。
 
极客公园:现在各大人工智能公司都在这一维度激烈竞逐,而你们在书里提到,竞争其实跟「开放性探索」相悖、因为它是极其收敛的目标。你们怎么看待现在人工智能领域的激烈竞争?
Kenneth:这就是目标导向的悖论,它会使得我们更加盲目,对其他方法和路径视而不见。像OpenAI、Anthropic和Google这样的公司,它们存在激烈竞争,因为哪家如果落后了,就可能无法获得更多资金,公司会受到生存威胁。
在这种竞争中,大家唯一的目标就是活下来。公司更倾向于继续沿着既定路径前进、扩大规模。如果这时候尝试创新,会面临失败的风险、可能会被踢出局。所以创新往往会减少。我认为在这样的竞争环境下,很容易进入死胡同。
不过当这些企业遇到瓶颈时,他们可能会意识到需要转向、进行更多开放性探索。
 
极客公园:这跟很多人的看法相反,一般我们认为激烈竞争会推动模型智能水平的提升、加速AGI的实现,但在你们看来反而会适得其反?激烈竞争会弊大于利吗?
Kenneth:是的,这可能有些反直觉。虽然竞争会引发「军备竞赛」,使得模型性能有所提升,但过度的竞争会减少开放性的尝试,使得创新更加聚焦和局限、无法取得真正的进展。
 
极客公园:说了这么久的「开放性探索」,那么对于现在目标和路径已经相对明确的人工智能企业来说,它们应该怎样才能做好这件事?你们对于「开放性探索」有没有一些建议?
Kenneth:我们会发现,很多公司太早就建立了一套体系,并且非常目标导向。如果一些探索在测试中表现不佳,他们就会放弃研究。我认为这会减少开放性探索的机会,是非常不利的。
对于AGI也是如此。当前的Transformer架构可能还远远不够,甚至我们对神经网络的运作机制还了解得不够,目前仍有许多失败的案例。我们并不清楚究竟还差多少步才能实现AGI,因此我们需要多重的、开放性的探索。
在当前阶段,对于OpenAI和其他公司来说,它们不仅需要改善现有的模型、更需要探索新的路径,这两件事需要同步推进。
 

离开OpenAI,人工智能界还需要更多「开放性探索」

极客公园:不久前Ken接受了一个采访,提到你离开OpenAI是因为「有一些的沮丧、有一些顿悟」,我好奇你的「沮丧」、「顿悟」是什么?方便跟我们分享一下吗?
Kenneth:让我想一想,我并不是说我对OpenAI不满意,而是我越来越意识到,我对人工智能的影响存在一些担忧。现在有很多关于人工智能消极影响、安全以及文明终结的讨论,这都是很明显的一些问题。
我越来越感觉到,社会中存在一些对人工智能的不满情绪、人们感到越来越多的失落,大家会追问生命的意义究竟是什么?比如,未来机器人可能有数百万个非常好的想法,一秒之间就可以超越我们一生的成就、或者比我们个人多年的经验更具智慧,那么我们如何再去做有创意性的工作、并从中获得成就感呢?这是一个非常严重的问题。
我感觉我的工作,似乎在某种程度上加剧了人们的这种担忧和焦虑。因此,我想思考人工智能未来的发展方向、解决它深层次的问题——我们究竟该如何改善人工智能,使其更好地为人类服务,促进人类之间的连接,而不是加剧竞争?
这是我最近非常关注的问题,我认为需要进行开放性探索,我相信这对人类社会会更有助益。基于这样的原则,我成立了一家自己的公司,希望建立一种开放性的社交网络。
 
客公园:你创立了Maven,它是一款基于开放性探索的社交产品,可不可以介绍下Maven是一个怎样的产品?为什么它能解决你提到的人工智能存在的问题?
Kenneth:你可能也注意到一些社交媒体存在的问题,比如信息茧房、对立观点、不断争论的意识形态导向、甚至阴谋论等。那么这些问题从何而来呢?实际上,这是因为这些系统的质量有问题。
几十年前人们就曾说过,人们会产生各种各样的观点和内容,但很多内容是负面的或不好的。而现在的社交媒体过于关注内容的受欢迎程度。我们认为这种信息分发模式需要改进。
所以我创立了Maven,这是一个基于内容质量来推荐的「开放性系统」。人们打分、评价,去找到好的内容。这种客观的评价方式、而不是靠点赞排序,才能带来更好的内容。
 
极客公园:我注意到Twitter 的联合创始人投资了你、Sam 也投资了你,为什么Sam会决定投资你?他对你这次创业有没有提出建议?
Kenneth:Sam的确投资了我的公司。我写完这本书之后,也想让「开放性系统」被更多人使用,于是萌生了成立自己公司的想法。从职业发展的角度,Sam给了我许多建议和见解。
从孵化投资人到OpenAI的CEO,Sam自己的职业发展就是非常了不起的跨越。他给我的建议是,我们不一定要沿着一份工作、一条道路前进,我们的职业发展也可以非常多元化。这给我很大的启发。 极客公园:Joel 离开 OpenAI 的原因是什么呢?
Joel:主要是我的职业发展追求跟它不再完全契合。最初加入OpenAI时,这家公司还处于比较基础的阶段,内部有机器人、人工智能等多个研究方向。然而,后来这家公司变得更加聚焦,我也注意到公司内部存在一些紧张的氛围,这对开放性探索有一定限制。
正如Ken提到的,我们需要考虑到AI对社会的影响、一些哲学问题、还有如何利用人工智能让个人更好发展等等,这些都是很有趣的研究角度。我希望能继续研究,而OpenAI可能并不是发展这些兴趣的最佳场所。
离开OpenAI后,我加入了一家研究虚拟生命(artificial life)的初创公司,现在还在继续从事开放性系统的研究。
 
极客公园:你们提到,即使是OpenAI这样最顶尖的人工智能公司,随着公司规模的扩大,它在开放性探索上的投入也开始变得紧张。你们对此有什么担忧吗?
Kenneth:的确如此,资金的压力还是非常明显的,如果没有明确的回报,管理层可能会减少开放性探索的投入。不过对于一些创新型的初创企业来说,应该还好。
像llya(注:OpenAI前首席科学家)刚刚离开了OpenAI,成立了自己的公司。他说他唯一的目标就是实现AGI,而且投资不是大问题。这表明即使没有明确的回报,也能得到资金支持,许多研究人员都在进行各式各样有趣的探索。
关于OpenAI,有人说它现在变得更加商业化,我不太确定。不过内部肯定还有一些开放性探索的机会。因为商业化并不是OpenAI的最终目标,也不是很多OpenAI研究人员的唯一目标。
 
极客公园:Sam 有跟你们聊过这方面的困惑吗?比如随着公司规模变大,他是否感到开放性探索更难做了?
Kenneth:这是一个非常有趣的问题。 我不太清楚Sam的脑袋里在想什么,因为他没有跟我聊过这些。
 
极客公园:最终回到个人,你们是人工智能研究员和创业者、也是普通人。如果你们自己有一个看起来很远大的、又很不确定的目标,你们会怎么实现它?你们对普通人有什么建议吗?
Joel:作为一个研究者,有些东西可能是似是而非的。我们书中的一些想法并不一定直接带来成功,有时需要我们慎重认真的看待和广泛阅读。
作为个人,我认为保持谦卑、开放探索的心态非常重要。因为伟大是不能被计划的,但我们可以找到伟大中的亮色。
Kenneth:作为个人,你要保持均衡。比如当你过于专注于目标,生活可能就没有那么有趣。就像有人的目标是赚钱,但如果发现了其他有趣的机会,即使这个机会的收入并不高、也不在主流地带,我也建议他尝试。
作为研究者,事实上,我想都没想过什么东西会导致AGI。我相信直觉。也就是说,我会遵循我的兴趣行动,而这会引导我发现更多的有意思的东西。看起来我离目标更远了,但实际上,兴趣才会通往最终目标的实现。
 
 
Posted in: 科技

华为三折叠手机定名 Mate XT;ChatGPT 新增 8 种语音,狗叫更自然;暴跌 60%,英特尔或被踢出道琼斯指数

OpenAI 首颗自研芯片曝光,采用台积电 1.6 纳米制程

北京时间 9 月 4 日消息,OpenAI 首款内部 AI 芯片再次传来新消息。据台湾经济日报报道,台积电将开发一款专为 OpenAI Sora 视频模型定制的 A16 埃米级工艺芯片,旨在提升 Sora 的视频生成能力。

1 埃米相当于 1 纳米的十分之一,在当前半导体制程已攻破 2 纳米工艺之后,埃米成为了全球领先芯片巨头的新战场。「A16」的命名和苹果的 A16 芯片没有太大关系,A16 命名代表的是制程 16 埃米,也就是 1.6 纳米。这是台积电目前已披露的最先进制程节点,也是台积电进军埃米制程的首秀,预计将于 2026 年下半年开始量产。

除 OpenAI 之外,苹果向台积电预定了首批产能。(来源:虎嗅)

英特尔股价今年暴跌近 60%,或被道琼斯指数除名

9 月 3 日消息,芯片巨头英特尔正面临被踢出道琼斯工业平均指数的风险。

道琼斯指数是美国著名股指,作为 1999 年互联网泡沫时期加入该指数的首批两家科技公司之一,英特尔如今的处境令人唏嘘。分析师和投资者指出,英特尔股价今年暴跌近 60%,成为道琼斯工业平均指数表现最差的公司,也是股价最低的公司,由于道琼斯指数采用的是价格加权的计算方式,英特尔低迷的股价使其在指数中的影响力微乎其微。

截至 8 月 29 日收盘,英特尔股价为 20.13 美元,在指数中的权重仅为微不足道的 0.32%。(来源:新浪科技)

 

传特斯拉计划于 2025 年在华推出六座版 Model Y,最快今年底推出 FSD

9 月 3 日消息,据路透社消息,特斯拉计划于 2025 年底在上海工厂生产六座版 Model Y,旨在满足中国市场的需求,来振兴这款「快要过时」的车型。

一位不愿透露姓名的知情人士表示,特斯拉已要求供应商为其上海工厂 Model Y 产量实现两位数增长做好相应准备。

路透社表示,六座 Model Y 的推出凸显了特斯拉在中国面临的竞争压力,而特斯拉在美国则优先考虑自动驾驶技术和机器人出租车的开发。此外,特斯拉还计划在年底前在中国推出其 FSD 自动驾驶功能。(来源:凤凰科技)

 

Google 高管警告 AI 未必能影响生产力

北京时间 9 月 3 日消息,Google 高管 James Manyika 警告,尽管预测 AI 的经济潜力高达万亿美元,但它未必能提升生产力。

Manyika 是 Google 负责研究、科技和社会的高级副总裁,他指出生成式 AI 并不能保证提升生产力,人类依然需要大量的工作。AI 聊天机器人可能会变得随处可见,但它没有从根本上改变经济。用生成式 AI 来编写代码是不够的。美国科技行业的工人只占总劳动力的 4%,即使他们所有人都用 AI,从生产力的角度看也无关紧要。要改变生产力需要劳动力密集的行业如如医疗保健和零售业普及 AI。而护士和医生等职业都不可能被 AI 取代,最多能提供协助。(来源:Solidot)

英伟达 GeForce RTX 显卡包装标志变更,添加 AI 相关字样

北京时间 9 月 3 日消息,英伟达更新了 GeForce RTX 的官方标志样式,添加了一行字「Powering Advanced AI」(为先进 AI 提供动力),该标志用于展示在显卡、台式整机和笔记本电脑的零售包装盒上。

英伟达是 AI 加速领域的领先硬件品牌,这一标志变更也代表着英伟达将向更多消费者展现其在 AI 方面的影响力。不过,新口号也让 GeForce RTX 标志变得更长了。(来源:IT 之家)

 

小鹏「陆地航母」首发试飞:2026 年量产交付

9 月 3 日消息,小鹏汇天近日首发亮相了其创新的「陆地航母」分体式飞行汽车,并成功完成了首次无人飞行演示。这款飞行汽车由「陆行体」和「飞行器」两部分组成,预计售价不会超过 200 万元。

根据小鹏汇天的计划,该飞行汽车将在 11 月 15 日的珠海航展上进行载人首飞,并在 11 月的广州车展上首次对公众展示。预计年底前启动预售,2025 年底开始内部交付,2026 年实现量产交付。

「陆地航母」的陆行体设计灵感来源于「月球探索车」,陆行体的尺寸约为 5.5 米长、2 米宽、2 米高,C 照即可驾驶,且能轻松停入标准停车位。

小鹏汇天表示,「陆地航母」分体式飞行汽车不仅能够满足用户的陆行和飞行需求,还将推动文旅营地、飞行营地等场景的发展。在公共服务领域,该飞行汽车还有潜力应用于紧急医疗救援、短途越障救援等。(来源:新浪科技)

 

Yohji Yamamoto 山本耀司入驻天猫国际,开出中国线上首家旗舰店

日本时装设计大师山本耀司同名品牌 Yohji Yamamoto 将于 9 月 5 日正式入驻天猫国际,开出山本耀司在中国的线上首家旗舰店。

据报道,山本耀司旗下品牌 S』YTE 的 300 多款商品先行登陆 Yohji Yamamoto 山本耀司天猫国际海外旗舰店,并在每周四中午 11 点与日本官网同步上新。(来源:快科技)

华为 Mate XT 非凡大师手机官宣,预计为首款三折叠屏手机

9 月 3 日消息,华为官方今日公布旗下新机命名:Mate XT 非凡大师,目前新机暂未公布外观设计,预计为此前曝光的三折叠屏手机。

华为三折叠屏新机已经多次曝光,折叠态并不算厚重,展开后机身右侧提供一个类似「笔槽」的结构,同时,该手机采用内折 + 外折 + 双铰链设计,屏幕预计 10 英寸左右,搭载麒麟 9 系平台,排期「早于 Mate 70」。

在鸿蒙智行于 8 月 19 日上海举办的享界 S9 首批车主交车仪式上,一位拥有问界 M5、M7、M9 的车主在现场向余承东询问:何时能买到华为三折叠屏手机,余承东回应称,「下个月,到 9 月份。」(来源:IT 之家)

 

保时捷计划推出纯电 Panamera 车型

9 月 3 日消息,保时捷研发主管最近透露,公司计划推出纯电动版的 Panamera,并计划在上市后与现有的燃油版和插电混动版 Panamera 同时销售,直至 2030 年左右。

虽然纯电动 Panamera 的具体发布时间尚未公布,但保时捷 CEO 奥利弗·奥博穆之前已经表明,纯电 Panamera 的市场定位将高于 Taycan,两者将在不同的细分市场中发挥作用。

值得注意的是,保时捷表示将继续研发内燃机技术,并对 V6 和 V8 发动机进行升级,以满足更严格的排放法规。(来源:凤凰科技)

 

PS5 Pro 性能曝光:光栅化性能媲美 7700 XT、光追速度更优

 9 月 3 日消息,据科技媒体 WccFtech 报道,索尼 PS5 Pro 的游戏光栅化性能将接近 AMD Radeon 7700 XT GPU,并进一步增强光线追踪性能。

此前,在 2022 年的一次演示 PPT 中,相关信息显示索尼 PS5 Pro 能够在 4K 2160p 的分辨率下以 60 到 120 帧进行渲染,并在 8K 分辨率下以 60 到 120 帧输出,也就是 AMD Radeon RX 7700 XT 同级技术。(来源:IT 之家)

ChatGPT 将新增 8 种新语音:狗叫等动物声音更自然

9 月 3 日消息,据科技媒体 testingcatalog 报道称,通过逆向工程 ChatGPT 应用,发现 OpenAI 即将扩充添加语音,让朗读的声音更加自然和富有表现力。

有迹象表明 OpenAI 未来可能会额外推出 8 种新的语音,每种语音都有一个独特的代号,后续可能会逐步推出。这些新声音的一个有趣特点是,它们能够更自然地表达非人类语音声,如动物叫声或其他非语言声音。(来源:IT 之家)

 

Back to Top