Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 兼职翻译 / 求职
    • 英语
    • 俄语
    • 德语
    • 日语
    • 法语
    • 西班牙语
    • 韩语
    • 小语种
  • 兼职翻译 / 招聘
  • 短视频
  • 即时新闻
  • 生活
  • 亚洲时事
  • 科技
  • 51蛙吖蛙公告
  • 金融
  • 杂谈
  • Toggle search form

分类: 科技

WPeMatico Campaign中添加的类别

一年卖出 80 万台,AI 硬件开启猿辅导的「新增长曲线」

 

在一年前正式推出学练机时,猿辅导还是这一赛道较晚的入局者。但一年过去,「小猿学练机」一年销量飙升至 80 万台、收入达到 30 亿元。

据沙利文数据,2023 年 8 月至 2024 年 7 月,小猿学练机全网单品销量第一。而洛图科技(RUNTO)统计,在 2024 第一季度中国学习平板线上市场中,猿辅导的学练机占销量榜首、销售额第二。

「今年是学习设备真正爆发增长的元年。」在接受极客公园等媒体群访时,猿辅导集团副总裁王向东说。

回顾学习机近 40 年的历史——从最早的上世纪 90 年代的「小霸王学习机」,再到 2000 年左右读书郎、步步高推出的「点读机」,再到 2021 年科大讯飞、小度等科技公司推出的 AI 智能学习机,再到目前以猿辅导等为代表的教育公司推出的新一代学练机,整个行业似乎在新玩家的推动下、进化到了新的阶段。

学习机市场在近两年内经历了两次去存量的过程。王向东认为,这背后反映了用户需求的变化、以及不同企业打法对市场带来的变化。

据洛图科技(RUNTO)最新发布的《中国学习平板零售市场月度追踪(China Learning Tablet Retail Market Monthly Tracker)》报告,2024 年上半年,中国学习平板市场的全渠道销量达 257.9 万台,同比增长 23.4%。

这样的节点下,我们希望跟猿辅导探讨,这种去存量的过程如何发生、以及为什么猿辅导能在其中做到比较领先的位置。最终我们发现,切中独特的市场需求、持续改善产品是一以贯之的逻辑,而 AI 技术也将带来新的变量。

 

未被满足的市场需求:针对练习场景,做出模拟「纸笔」的硬件

如果说,目前很多学习机产品需求的起源,来自 AI 大模型带来的智能供给的变化。而很多教育公司做硬件需求的起源,是在 2021 年教育行业受政策影响后、对出路的探索。但对于猿辅导来说,其做学习平板的规划要更早。

2021 年 2 月,王向东和团队开始思考一个问题,未来更符合趋势的教育硬件产品是怎样的?最后他们认为,这应该是一款提供个性化教育的产品,那么它更适合面向练习场景,而不是学习场景。

彼时,市面上的学习平板玩家基本都切入的是学习场景,通过提供基于教材的视频等教育内容、让孩子学习。但这种统一化的内容供给很难做到个性化,而练习场景不一样,它具备非常强的打标属性、每一道题目都会至少打九级,更适合用 AI 做个性化推荐。而这也是一个空白的市场需求——如果说学习场景只能学知识,那么练习场景能判断孩子是否真正掌握了知识,并进行基于个人学习能力的个性化学习推荐。

王向东的团队擅长「练习」场景,他主管的「搜题」、「口算」等产品,就是解决练习效率问题。

在硬件上,为了匹配这个练习场景,团队独创性地引入了墨水屏和手写笔。它真实模仿了学生做作业时用到的「纸」和「笔」。墨水屏是最接近「纸」的屏幕,它有别于传统的发光 LCD 屏幕,0 蓝光、无频闪,能像「纸」一样不伤眼。

在学习平板市场,团队就此确定了一个满足空白市场需求的学练机雏形:在硬件上,它是一款主打墨水屏和手写笔的智能练习本;在软件上,它拥有丰富的教育练习资源,学生可以先同步自己校内的学习进度,产品会批改、记录学生的答题过程和结果。接着,它会智能推荐相关习题。最终,它能掌握学生的学习进度,并通过匹配学习资源和练习,不断提高其学习效率和学习能力。

 

图片来源:小猿学练机官网

 

2021 年 9 月,基于这款产品的最小化 MVP(Minimum Viable Product,最简化可实行产品)上线了,它就是「小猿智能练习本 A1」。

当时在北京一家酒店的大堂里,团队组织了十几个学生来体验这款产品。十分钟之后,原来特别闹腾的小孩,慢慢变得很安静,在小猿智能练习本上默默做练习。当时,团队就判断这款产品的市场需求是成立的。

 

三年的硬件和软件迭代,从卖不出去、到卖爆80万台

虽然产品需求得到了验证,但商业上跑通更为曲折。

猿辅导第一款智能硬件产品小猿智能练习本,定价为 2799 元,而当时普遍的墨水屏产品定价在千元左右,这个价格被认为过高。为了测试市场情况,2021 年 10 月,团队在一个两百多人的老用户微信群里进行了销售测试。当时,团队做了一场直播,讲解了这款新品。直播结束之后,有近 70 人购买,转化率近 30%。看起来市场接受度是合格的。

但其后的情况并不顺利。当时第一批产品起订了 3000 台,然而半年过去,团队只卖掉 800 台。王向东意识到,这款产品可能理念没问题、但具体功能还不达要求,因此要求团队先不管销售、聚焦打磨产品。

一方面是硬件迭代,不断改进墨水屏和手写笔,比如小孩儿喜欢咬笔头、就得对笔头做专门的改进。另一方面是软件迭代,不断扩张教材内容、以及增加新的功能点。

等到 2022 年终,团队发布了更新后的第二代产品「小猿智能练习本 S1」,这时候销售量开始迅速增长、一个季度能卖 2000 台,迅速增长到 5000 台,1 万台——基于对未来销售增长的预期,团队意识到可能没法继续代工模式,必须自研硬件,自己做供应链。这不仅能更好地做硬件研发,也能更好地供货。这是一个投入很大的决定,团队为此招募了近百人的产品和研发团队。

但这事后被证明是正确的。2023 年,在产品的不断迭代下,团队的第三代产品「小猿学练机」正式发布,销量猛涨。

 

墨水屏的小猿学练机|图片来源:小猿学练机官网
 

过去一整年,团队又对产品进行了更彻底的迭代。在硬件上,一年完成了 38 次软硬件升级与更新。在软件上,支持的教材版本从 46 个增加到 159 个、功能点上的更新超过 100 个。最终,「小猿学练机」一年内卖出了 80 万台,远远超出了团队预期。而自研的供应链才能接住这一需求。

王向东如此总结成绩背后的原因:基于选一款对孩子眼睛无害的屏幕、以及基于个性化学习理念的产品初衷,不断地进行软硬件的迭代,才有了今天的优势和壁垒。

 

AI大模型改造学习机,还只踏出了第一步

回顾学习机发展的近 30 年,整个行业已经从重营销、重渠道,转向重技术、重产品和内容。

最早的学习机是上世纪 90 年代,由卡带游戏机发展来的「小霸王学习机」,它提供的更多是技能训练(如打字训练、计算器、编程入门等),在个人电脑尚未普及的时代,对消费者来说具有较强吸引力;后来是 2000 年左右,由读书郎、步步高等带火的「点读机」,主要靠「哪里不会点哪里」等广告语的强营销模式、以及线下渠道强激励模式驱动。

而 2021 年至今,无论是科大讯飞和小度等科技公司,还是寻找新方向的教育公司,都在试图用真正的 AI 技术、更好的产品和内容来改造这一行业。2022 年以来出现的大语言模型,对于硬件、学习机的改造也带来极大的想象力。

比如,AI 理论上能提供无限的内容供给,它也许能让每个学生得到真正个性化的教育。目前,各公司还只是踏出了第一步。

以猿辅导的学练机为例,在数学上,它目前主要用到的还是 AI 的个性化推荐。「幻觉」是一个棘手的问题,如果内容失真、可能会误导学生——因此猿辅导不会让大模型随机生成题目,更多是让它基于已有确定题目去做解析,比如已知正确题目的答案、再一步步把它讲解给用户。

而在语文等更主观的学科上,AI 的生成能发挥更多的作用。比如这款学练机有「互动阅读」功能,在语文阅读的过程中可以随时跟大模型提问,让它出题交互、解答疑惑等。大模型还自动生成写作提纲、并对作文提出修改建议等。

猿辅导的学练机取得阶段性成功,似乎表明了这样一个观点:在 AI 技术还不成熟的情况下,如何在已有的技术边界、满足空白的用户需求、并持续地进行产品迭代,可能才是更适合的硬件发展之道。

据王向东测算,未来整个学习平板的市场规模有望达到 1000 万台左右,其中包括学习机以及学练机的需求。他希望三年内,整个行业能实现这个目标,猿辅导也会在行业发展机会中持续发力。

 

浏览量: 87

你已经是个成熟的洗地机,应该学会自清洁

一直以来,人们都期待能有一款智能家电,帮助自己摆脱繁重的家务劳动。就拿拖地来说,长时间以来,拖把一直是主要的清洁工具。它虽然除污能力强,但使用过程相对费力,常常需要长时间弯腰操作,还得频繁清洗,效率并不高。

洗地机的问世,在一定程度上取代了传统拖把的地位。如今市面上的主流洗地机大多能做到省力省心。凭借这一优势,洗地机在 2019 年至 2022 年的短短三年内,零售规模便突破了百亿元。

然而,随着越来越多的家庭将洗地机作为标配,一个新的问题开始浮现:房屋清洁省力了,清理洗地机本身却耗时耗力,尤其是去除缠绕在滚刷上的头发和宠物毛发,让追求「省时省力」的年轻人感到十分困扰。

从「能用」到「好用」,是很多新的智能产品,在完成 0 到 1 后必须跨越的第二道坎。对于五岁的智能洗地机来说,「自清洁」也是行业跨过百亿大关后,想要继续增长必须解决的问题。

 

用户省心的自清洁,才是真正的科学清洁

2023 年,过往一直关注在扫地机器人赛道的云鲸首次拓宽产品线,发布了旗下第一代智能洗地机 S1。同年,云鲸提出了「科学清洁」的理念:尽管不同产品的使用场景、用户画像有所不同,但最终目的都是要平衡清洁力、清洁效率、维护性、智能性等多维度的指标,以达到最佳用户体验。

一年之后,基于对第一代产品的整体调研和复盘,云鲸意识到,「自清洁」是现阶段洗地机产品最大的痛点。更好的自清洁既可以在洗地结束后,解放用户的精力,而且也能长久保持机器本身的清洁无菌,不会造成家庭环境的二次污染。

因此,接下来的研发重点一定是围绕着「自清洁」功能展开的。云鲸认为:更科学的洗地,应该从自清洁开始。

得出这个结论只是研发的开始,真正做出好的「自清洁」产品才是对研发团队的考验。

每个家庭的使用环境各不相同,带来的体验痛点也有所差异。既要满足大多数家庭的需求,又要兼顾一些特殊家庭的「边缘案例(Corner Case)」,还要平衡新增功能带来的成本压力……在智能洗地机这个品类,效果、成本、使用门槛这个硬件创新的不可能三角依然存在。

据极客公园了解,其实在发布首款智能洗地机云鲸 S1 前,云鲸洗地机研发团队内部其实已经启动了「自清洁」技术的功能研发,第一代产品发布后,更是在接下来的新产品上不断迭代自清洁功能。

从 S1 上以「冷水清洁+高速离心甩干+55℃热风烘干」为核心的一键自清洁;到 5 个月后推出的 S1 Max 上使用银离子抑菌材料从而实现抑菌除臭;再到 2024 年 4 月,云鲸在 S2 上首次引入了「毛发防缠绕」和「65℃接触式智能熨干」功能。

在前三代产品的基础上。2024 年 9 月 13 日,云鲸正式发布智能洗地机 S2 Island 光辉版。这款产品搭载了云鲸首创的「自清洁灵动岛 Narwal Island™」,里面集成了4D 立体防缠绕、90°C 智能双熨干、70°C 热水自清洁、全链路风干、Cyber 光辉灯带等五大「自清洁」功能,可以说是云鲸洗地机产品自清洁的「集大成」之作。

云鲸 S2 Island 光辉版 | 图片来源:云鲸

事实上,这些功能方向的确立并不只是来自于团队内部「拍脑门」,而是在很大程度里依赖了用户反馈和调研结果。云鲸研发团队告诉极客公园,在整个研发过程中,他们不仅调研了大量云鲸一代产品用户,还和很多其他品牌洗地机的用户进行了深度沟通。

一代用户里,吐槽最多最集中的问题是毛发缠绕。不同于传统家庭「先扫后拖」的清洁习惯,洗地机用户往往把「扫」和「拖」合为一体,所以大量日常毛发(如掉发、毛絮等)会被吸进机器。这部分毛发垃圾,过往用户大多只能用最简单粗暴的方式「徒手清洁」,既费时费力,而且如果不及时清扫,堵塞后还可能影响后续吸尘效果。

在第一代产品后,解决毛发缠绕是一项优先级很高的工作。今年 4 月,在第二代洗地机产品云鲸 S2 里,云鲸给出了第一版解题思路:通过在滚刷里内置一个 L 型双排齿梳,可以将日常生活里大量细碎的毛发拦截,并通过大吸力吸入污水箱,从而达到防缠绕的效果。

市场反馈也证明,绝大部分用户对云鲸 S2 在防缠绕上的提升表示满意。但仍有一些用户觉得,在少量场景里还可以「做得更好」,例如养宠家庭里,长发和宠物毛发混杂在一起的毛团;多人家庭里的长短发混杂;浴室地面上大量的湿发……

云鲸研发团队告诉极客公园,尽管这些需求只对应着少数特殊工况,但大家一致认为,既然要做「更科学的自清洁」,产品就应该提供极致的使用和维护体验。因此,云鲸 S2 Island 在保留双排梳齿刮条的机身滚刷基础上,又在基站上升级「主动伸缩型 mini 剪刀手」,自清洁时能自动进行毛发剪切。既能应对日常工况,在复杂工况下也能高效解缠,真正实现了整机 0 缠绕。

值得一提的是,「剪刀手」的设计除了能提升用户在每一次使用中的体验,也可以让洗地机滚刷在 3-6 个月的使用生命周期内,始终拥有稳定的防缠绕效果。

搭载「剪刀手」的云鲸 S2 Island,可以在更复杂的工况高效解缠 | 图片来源:云鲸

对自清洁来说,除了防缠绕,另一个关键问题就是要把滚刷上各种或复杂或顽固的污渍除净。只有保证机器本身干净了,才不至于「越洗越脏」,造成二次污染。

一个很典型的场景就是,如果家里地面上出现了大面积油污或者含糖的污渍,那么清洁完地面之后,我们都会把拖布或抹布额外用热水+清洗剂多洗一遍。

云鲸团队正是从中国家庭对热水的智慧里得到启发。在 S2 Island 上,通过多个步骤实现机器的自清洁:当毛发剪切步骤结束后,洗地机会先用 35℃左右的水对滚刷和管道进行冲洗,可以清除包括淀粉类在内的大部分脏污,接着再进入 70℃高温热水除菌清洁,进一步溶解深色污渍或重油污。

在洗地机最后的干燥阶段,云鲸在 S2 Island 上也根据用户反馈,选择出了更好的解法。

在传统的「拖地」作业方式里,整个拖地过程会包括多次拖布的清洗,因此需要配套设计出一系列的速干方式——例如利用离心力等快速甩干,以提高整个家庭清洁的效率。在早期的洗地机上,很多产品也借鉴了「速干」这一思路,利用高温烘干的方式,达到短时间内快速干燥的效果。

和传统拖地不同的是,使用洗地机清洁房屋大多并不需要分成多次操作,机器干燥的过程往往发生在清洁结束之后,并不会额外占用用户的时间。这意味着速度并不成为干燥的第一优先级,干燥效果和用户体验才是这个阶段最值得考量的点。

除此之外,「烘干」还会带来噪音和空气的污染。即使过程只有 5 分钟,也会给家里的其他成员甚至宠物带来很大的影响。而且传统烘干并不能根据温湿度调节干燥时长,在南方的回南天、梅雨季可能出现干不透,甚至发霉发臭的现象。而且,对于没有搭载「智能检测」的速干功能,还需要用户手动拆下滚刷检查是否烘干,过程非常麻烦。

为了实际了解用户对于机器干燥方式的体验,云鲸研发团队特地设置了一组用户对照实验。一组是对洗地机品类没有太多了解的小白;另一组则是已经被「快速烘干」种草的潜在用户。在实际深度体验后,两组用户都对「速干」功能祛魅,更愿意选择烘干安静不打扰的方案。

S2 Island 使用了 90°C 双熨干功能 | 图片来源:云鲸

最终,云鲸团队选择延续 S2 的「接触式智能熨干方案」,保持了「低噪熨干」和「智能检测滚刷干燥度」的产品优势。

这其实也是云鲸团队产品研发的理念:与其追求「5 分钟」速干的噱头,不如多听听用户的声音——了解大多数用户真正想要的是什么,再决定团队到底做什么。

 

「用户共创」:智能硬件领域未来的开发范式

无论是在防缠绕上死磕复杂工况,还是在「烘干」和「熨干」之间二选一,用户都在产品定义和研发过程扮演了重要角色。

对于任何一家硬件企业来说,和用户之间的沟通都是产品研发环节里一个重要的步骤。但是,多数企业仅停留在了产品早期,主要是收集前一代产品的反馈。而云鲸和用户之间的链接,则体现在产品研发的不同阶段,既有前期对需求的收集,也有后期对功能的验证。可以说,用户共创已经成为了云鲸当下重要的产品哲学,影响着每一代产品的轨迹和方向。

事实上,整个智能硬件行业如今都在经历着某种产品价值体系的变革。

过去,对于硬件行业来说,「参数」是一个优先级非常高的衡量标准。例如,洗地机、吸尘器的客户会额外在意电机转速、最大吸力等数值,而这些数值往往直接对应着肉眼可见的清扫效果。

而随着近年来整个行业规模不断扩大,智能清洁赛道的竞争越来越激烈,各家厂商的技术水平逐渐被拉齐。整个行业陷入了某种瓶颈之中,竞争越来越难以被量化成消费者可见的数值,创新亟需以一种更具新的方式进行呈现。

用户体验是一个在参数之上,更具体感的评判维度。在智能手机行业里,两个像素完全一样的摄像头,经过光学智能计算后,可以达到截然不同的成像效果。而在智能清扫行业里,两个搭载着相同转速的电机,在不同功能的配合下,给用户带来的使用感受也可能大相径庭。

提升用户体验的关键方法,就是让用户深度参与到产品研发的过程中。

在云鲸第一代洗地机产品云鲸 S1 上市后,云鲸的产品经理无意间发现了一组有趣的数据。在参与调研的 2000 多名用户,其中 64% 家里都有木地板,其中不少用户都会使用原本为卫生间设计的「吸水模式」去清洁木地板。云鲸团队经过进一步沟通得知,这部分用户认为木地板一般是在卧室或书房,地面不会很脏,他们更担心木地板在潮湿环境下可能会起霉发泡。

在基于用户调研得到的开发线索中,满足用户对于木地板工况下的控水需求只是起点。云鲸研发团队还有另一个需要考量的维度——卧室、书房这类地面环境的脏污类型一般是毛发、毛絮、皮屑,这就要求清洁上要做到不扬尘、不缠绕、而且水膜均匀。最后,经过多轮对清扫参数、水泵精度的调整,最终完成了一个全新的「木地板模式」的开发。

云鲸智能洗地机上全新的木地板模式 | 图片来源:云鲸

在以参数导向的产品升级规则下,升级效果很容易通过数值的变化得以体现。但当用户体验成为目标后,如何量化升级效果就成为了一个新的课题。

对于这个问题,雷军曾经在今年个人演讲复盘小米 SU7 时,分享过一个小米的经验。在上市前,小米 SU7 曾经面临两种截然不同的评价。一种观点来自外部,认为这辆车大概率卖不好,核心原因不看好小米 SU7 所在纯电轿车品类;而另一种观点则来自小米工程师团队,雷军说,当他看到这帮爱车懂车的人都给与了正面评价,他就知道小米 SU7「好看好开」的设计目标达成了。

对于云鲸来说也同样如此。在每一项功能升级后,云鲸除了收集实验室数据外,也会把样机寄到一部分核心用户手中,以在真实使用场景中得到反馈,从而达到提升用户体验的目的。

如前文所提到的「剪刀手」防缠绕案例,云鲸就在升级后将样机寄给了此前反馈需要升级的用户。最后,有 90% 的用户反馈问题得到解决,云鲸又仔细分析了剩余 10% 用户反馈的场景,发现是样机的工程版本问题,在量产阶段可以解决。至此,对于 S2 Island 防缠绕功能的迭代,才正式结束。

这部分用户既是最初提出需求的建议者,也是最后完成测试的验证官。在整个产品创作周期里,他们都深度参与了新品的打磨。

可以看出,无论是智能清洁硬件,还是智能电动汽车,对于大多数消费者来说,都是最近几年才出现的「新玩意」。选择和消费的过程,并不像买一部电视或者买一台手机一样成熟,因为对于这些新东西的产品形态,可能连开发者都没有达成共识。

因此,在智能硬件时代,大量进行用户调研、沟通,和用户深度共创,是一个越来越受企业重视的开发范式。这不再是一个营销噱头,而是可以决定达成最终目标具体路径的关键开发工具。

2023 年,国内洗地机市场销量已经超过扫地机器人。对于研发者而言,用心倾听用户声音和攻克技术难关一样重要。因为对于这些全新领域的新硬件来说,研发更是一个用户和产品经理共创的过程。

浏览量: 97

OpenAI 发布新模型,Sam Altman:耐心时刻结束了!

作者 | Li Yuan

北京时间凌晨一点,OpenAI 突然进行了重大更新。

已经预热了接近一年的 Q*/草莓项目,传说中能够进行高级推理的大语言模型,今晚终于露出了真面目。

OpenAI 发推表示,刚刚推出了 OpenAI o1-preview 模型——名字的含义之前外媒已经爆料过,o1 应该代表着 OpenAI 下一代大模型的 Orion(猎户座)一代。

OpenAI 在发布文档中写道,新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为 1 ——这意味着未来很可能不会有 GPT-5 了,o1 将代表未来 OpenAI 的最强水平。

且从今天开始,ChatGPTPlus 和 Team 用户就能够直接访问模型。

用户可以手动选择使用 o1 模型的预览版——o1-preview,或者使用 o1 模型的小尺寸版——o1-mini。o1-preview 的每周限制为 30 条消息,o1-mini 的每周限制为 50 条。

在 OpenAI 的模型介绍网页上,可以看到 o1 模型的训练数据截止时间为去年十月份,而最早的 Q*项目的爆料,正好大概出现在去年十一月份。

OpenAI 憋了一年的大招究竟如何?OpenAI 能否再一次引领大模型的潮流,甚至让人们看到通用人工智能之路不再遥远?很快,每个人都能检验这一点了。

Sam Altman 凌晨一点在 X 上发帖:「需要耐心等待的时刻结束了!」

o1 模型:解决博士级别的科学问题超越人类

截止发稿时,笔者还不能使用 o1 模型。

不过 OpenAI 已经放出了大量相关的 o1 模型表现展示。

最引人关注的当然是新模型的推理能力。Sam Altman 直接在 X 上贴出了 o1 与 GPT-4o 在数学、编程和解决博士级别科学题目上的能力对比。

最左边的柱形代表目前 OpenAI 的主力模型 GPT-4o。今天放出来的 o1 预览版为中间的橙色柱形。

可以看到,在 2024 年美国数学邀请赛的竞赛题和 Codeforces 算法竞赛题上,o1 预览版解决数学和编程问题的能力,比起 GPT-4o,提升了 5-6 倍。而可怕的是,深橙色的柱形,代表真正的 o1,相比于 GPT-4o,提升了 8-9 倍!

最后一个图中,OpenAI 还列出了人类专家在解决博士级别科学题目的时的成功率,大约在 69.7%,而 o1 预览版和 o1,都已经超过了人类专家的水平。

OpenAI 的技术博客提到了更具体的数字,目前 o1 模型的成绩,在美国数学邀请赛上,可以排名进入美国前 500 名。而物理、生物和化学问题上的准确度,超过了人类博士的水平。

在大模型技术进入公众视野的两年内,一个经常为人们所使用的比喻是,大模型像一个什么都懂一点的大学生,在知识专精方面远远不行,但是从天文到地理,最基础的知识都能懂一点点。OpenAI 的新模型,很有可能要刷新人们的这一认知了。

在官方博客中,OpenAI 简单解释了这一进步背后的原理。

类似于人类在回答难题之前可能会思考很长时间,o1 在尝试解决问题时会使用一系列思维。通过强化学习,o1 学会了磨练其思维链并完善其使用的策略。它学会了认识并纠正错误,将棘手的步骤分解为更简单的步骤。当当前方法不起作用时,它会尝试另一种方法。这个过程极大地提高了模型的推理能力。

在 OpenAI 给的案例中。GPT-4o 和 o1 模型同时回答同一个问题——读一段长文,然后做阅读理解。在 o1 模型中,会多一个选项叫做展开思维链。

如果不展开思维链,我们可以看到两个模型本身给出的答案是不同的。而打开思维链后,则会看到一段非常长的模型和自己的思维对话,解释为什么做出了不同的选择。

选 A 吗?emm,好像不是很好。选 B 吗?好像没有关联。模型完全在自己和自己提问和回答,最后判断出了哪个答案更好。

而在另一个例子中,解决化学问题时,我们可以看到 o1 模型甚至自己在选择多种方案对比。

标准的计算方式是这样。但是我们也可以这么计算,但这样或许没有必要?

在多次纠正自己之后,它得出了正确的答案。

之前,也已经有很多报道透露过 o1 模型能够有高推理能力的原理——这一训练方法,最早来自于斯坦福大学 2022 年开发的一种「自学推理」(Self-Taught Reasoner,STaR)。

后来研究人员进一步开发了一种名为”Quiet-STaR”的新技术,翻译过来大概为”安静的自学推理”。核心为在每个输入 token 之后插入一个”思考”步骤,让 AI 生成内部推理。然后,系统会评估这些推理是否有助于预测后续文本,并相应地调整模型参数。这也是人们推测 OpenAI 最早的模型项目为什么叫 Q*(读作 Q Star)的原因。

在 o1 模型出现之前,用户通常也可以自己通过和模型对话的方式,让模型进行一步一步的思考,也就是所谓的慢思考,进行更准确的回答。但是很明显,o1 模型此次将思维链放大到了完全不同的量级上。

而且,在之前的用户 prompt 引导中,模型能够回答出什么答案,最终也还要被模型能力限制。而通过不同的训练方式训练出来的 o1 模型,很有可能能够通过自己的推理,超越自身训练材料的限制,产出更高级和准确的答案。

在复杂推理任务上的进步,可能对编程和科学研究两个方向产生直接的推动。

OpenAI 提到,在未来,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。

OpenAI提供了一个例子,真正做到了只使用提示词,就完成了一个游戏的编程。

而推理能力的进步,如果能够进一步消除模型的幻觉,还可能对 AI 应用的建构产生间接的影响。对未来的AI安全也有积极的影响——之前的一些通过提示词工程误导模型进行错误输出的手段,可能会直接被模型通过更强的思考能力解决。

OpenAI o1-preview 将在今天开始能够在 ChatGPT 上使用,并提供给受信任的API用户。

价格没涨,OpenAI 用 o1-mini 解决推理成本问题

在 OpenAI 此次发布之前,曾有不少媒体爆料,新模型因为内部推理链条较长,对于推理的算力成本的需求进一步增高,OpenAI 很有可能将提高使用模型的费用,甚至最离谱的猜测数字达到每月 2000 美金。

而此次 OpenAI 的发布,却令人惊讶,新模型的使用价格并没有上涨,虽然因为推理成本的原因,使用次数受到了大大的限制。o1-preview 的每周限制使用条数为 30 条消息。

除了限制使用条数,OpenAI管控推理成本的另一个重要举措,是随着 o1 模型的推出,同时推出了 o1-mini 版。

OpenAI 没有具体说明 o1-mini 的参数量有多大,但通过技术文档可以看出,o1mini 版,和 o1 版上下文长度没有区别,甚至最大输出 token 数更高。

OpenAI 表示 o1-mini 尤其擅长准确生成和调试复杂代码,对于开发人员尤其有用。作为较小的模型,o1-mini 比 o1-preview 便宜 80%,这使其成为需要推理但不需要广泛的世界知识的应用程序的强大且经济高效的模型。

OpenAI 甚至还计划之后为所有 ChatGPT 免费用户提供 o1-mini 访问权限。

不过,作为新模型,o1 系列模型,目前仍然不能浏览网页以获取信息以及上传文件和图像。OpenAI 也提示道,GPT-4o 在短期内,在某些任务上会更强一些。

Scaling Law 后最重要的进展?

事实上,此次发布了新的模型,甚至不是 OpenAI 的发布中唯一重要的事情。

OpenAI 还提及了自己训练中发现的一个现象:随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能能持续提高。扩展这种方法的限制与 LLM 预训练的限制有很大不同。

事实上,英伟达的具身团队领导者 Jim Fan 直接在 X 上点评了这一事件的历史意义——模型不仅仅拥有训练时的 scaling law,还拥有推理层面的 scaling law,双曲线的共同增长,将突破之前大模型能力的提升瓶颈。

Jim Fan 表示,2022 年,人们提出了原始的 scaling law(尺度定律),大概意为随着模型的参数量、数据量和计算量的增加,模型的性能能够不断提高。

这指的是在模型的训练过程中。而 scaling law 在今年看起来,似乎已经有停滞的意味——他提到在 self-rewarding language 文章中,感受到 3 轮自我提升似乎是大语言模型的饱和极限了。

而此次 OpenAI 新模型,除了在训练时,通过增大参数量和数据量,得到了性能上的提升,同时通过增加推理时间——也就是前面所说的模型在自我内部思考的时间——得到了能力上的提升。

也就是说,如果模型未来自己和自己思考的时间越长,得到的答案可能会越准确。这很接近于我们对AI的终极想象了——像最早在 AlphaGo 中所展现出来的,AI 通过自己和自己下棋,提升自己的棋艺。

OpenAI 的新模型,展现出的,是一条新的大模型的提升路径。

Jim Fan 在 X 上的一句话令人耸动:「之前,没人能将 AlphaGo 的成功复制到大模型上,使用更多的计算让模型走向超人的能力。目前,我们已经翻过这一页了。」

回看 2023 年,许多人在问,Ilya 看到了什么?

大家都怀疑是一个超级强有力的模型——是的,此次发布的 o1 模型确实很强。

但或许,更有可能是这个——推理层面的 scaling law 的发现,再一次让人们意识到,超人的AI,或许不再遥远。

 

 

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

 

浏览量: 64

刚发布完 iPhone 16 的苹果,就要补交 1000 亿天价税款

就在全球「科技春晚」苹果秋季发布新 iPhone 16 系列当天,欧盟决定给硅谷巨头添一点堵。

 

据报道,欧盟最高法院裁定,苹果在一起长达十年的税务诉讼中败诉。在这起案件中,欧盟委员会要求爱尔兰从苹果收回高达 130 亿欧元(约合人民币 1020 亿元)的补缴税款。

欧盟的目标,不只是苹果一家公司。这十年来,无论是税收,数据保护,还是反垄断,欧盟对科技行业各类行为的广泛打击愈演愈烈,尤其针对几家美国最著名的科技巨头,并以「正义」为名。

苹果和众多科技巨头们的跨国业务,可以说压力越来越大。

 

01 苹果,1000 亿税款定了

 

2014 年,欧盟委员会对苹果在爱尔兰的税务支付情况展开调查。

调查后,2016 年,欧盟委员会命令都柏林从苹果收回高达 130 亿欧元的补缴税款。欧盟委员会当时称,苹果在过去二十年里从爱尔兰获得的税收优惠是「非法」的。

苹果公司曾将其欧洲总部设在爱尔兰,某些年份缴纳的企业税率极低,据称甚至不到 1%。

爱尔兰政府显然和苹果是「一伙的」,一直不愿多收税,因为在其看来,即使有税收损失的成本,苹果公司的欧洲总部设在爱尔兰的好处也超过了前者。

苹果和爱尔兰于 2019 年对欧盟委员会的决定一起提出上诉。2020 年欧盟普通法院站在了苹果这一边,推翻了欧盟委员会 2016 年的决定,认为欧盟委员会未能证明爱尔兰政府给予了苹果税收优惠。

然而,事情后来对苹果又急转直下。欧盟委员会对普通法院的决定提出上诉,将诉讼送至欧盟最高法院——欧洲法院(ECJ)。欧盟最高法院近日正式推翻了普通法院的裁决,并确认了欧盟委员会 2016 年的原始裁定。

最初发起这起案件的欧盟相关负责人在声明中称,这「对于欧洲公民和税收正义来说是一个巨大的胜利。」

法院认为,爱尔兰的税务安排让苹果支付的税款比其他公司少得多,这让苹果获得了不公平的优势。另一方面,苹果则辩称,它一直在支付税款,问题只是哪个政府获得税收的问题。

苹果发言人在回应裁决的声明中称:「这个案件从来不是关于我们需要支付多少税款,而是关于我们需要向哪个政府支付税款。我们总是全额缴纳我们在各地应缴的税款,而且从未有过特别的交易。」

他还补充说:「欧盟委员会正试图追溯性地更改规则,忽视了根据国际税法,我们的收入已经在美国缴纳了税款。」

苹果周二在一份文件中表示,在其截至 2024 年 9 月 28 日的第四财季中,将因一次性所得税费用承担约 100 亿美元的税款。

 

02 科技巨头屡被罚

 

事实上,苹果的这起案件,只是美国科技巨头与欧盟之间无数冲突的其中一件,这些冲突大多围绕着「数据隐私保护」「反垄断」「税收」和「虚假信息」等问题做文章。

欧盟对苹果的阻击,除了税收,还有反垄断。今年,欧盟委员会在 3 月份对苹果处以 18 亿欧元的反垄断罚款,指控其滥用在音乐流媒体应用分发市场中的主导地位。

今年 6 月,欧盟还警告称苹果应用商店违反了竞争规则,这促使苹果宣布将允许欧洲用户删除包括 App Store 和 Safari 浏览器在内的应用程序。

这些年来,面临类似问题的也不只是苹果,包括 Facebook(现 Meta)、谷歌、微软、亚马逊等科技巨头是欧盟调查的主要目标。

欧盟认为谷歌在购物搜索服务中偏袒自家产品,2017 年就要求罚谷歌 24 亿欧元,这还没完,2018 年又指谷歌滥用其在安卓操作系统上的市场主导地位,要罚谷歌 43.4 亿欧元。欧盟去年还建议谷歌出售部分业务,否则还可能面临更多罚款。

同样是「滥用市场主导地位」,亚马逊 2021 年被意大利法院处以 11 亿欧元罚款,微软早些年则因在 Windows 7 中强制捆绑 Internet Explorer,被欧盟处以 5.61 亿欧元罚款。

另外,在税收问题上,欧盟委员会一直声称,科技公司将利润转移到爱尔兰和卢森堡等低税率经济体是「违法」的。欧盟委员会 2017 年对亚马逊进行过类似于苹果的诉讼,要求亚马逊向卢森堡支付 2.5 亿欧元的补缴税款,但亚马逊在此案中赢得了上诉。

在众多巨头里,Meta 可能是名声问题最大的那家,其商业模式依赖收集数据,不仅在美国被指控侵犯用户隐私,也因违反欧盟数据保护规则,被卢森堡当局处以 7.46 亿欧元罚款。几个月前,欧盟又对 Meta 处以 12 亿欧元的罚款,原因是其在欧洲和美国之间非法传输个人数据。

此外,Meta 的平台多年来一直面临未能打击仇恨言论、虚假信息的指责。一些监管机构曾对 Facebook 和 Instagram 展开调查,因其未能处理与选举有关的虚假信息。

《通用数据保护条例》和《数字市场法案》是欧盟打击美国科技巨头的各类案件中最常被提及的,已迫使公司改变其在欧洲的一些做法。违反它们的话,罚款可以高达科技公司年收入的 10%,甚至 20%。

欧盟 2018 年实施的《通用数据保护条例》(GDPR)对数据保护制定了严格的规则。《数字市场法案》(DMA)于 2022 年通过,针对被视为「守门人」的大型科技公司,实施严格的规定以确保公平竞争。

在税务问题方面,欧盟越来越关注那些有利于大型科技公司的税收漏洞,据称正在推进的数字税计划,旨在对在欧盟境内通过数字服务产生的收入进行征税。

这些问题,现在已经是压在美国科技巨头身上的大山,成为欧洲阻挡海外巨头攻城略地的武器。

 

浏览量: 52

罗永浩敦促俞敏洪主动退一赔三:出来混迟早都要还;OpenAI 正商谈以 1500 亿美元估值筹集资金;三星电子开启海外裁员,部分部门高达 30%|极客早知道

消息称 OpenAI 正商谈以 1500 亿美元估值筹集资金

9 月 12 日,彭博社报道称,OpenAI 正在与投资者洽谈以 1500 亿美元(当前约 1.07 万亿元人民币)的估值筹集 65 亿美元(当前约 463.38 亿元人民币)。

一位知情人士还表示,OpenAI 还在洽谈以循环贷款的形式向银行借款 50 亿美元(当前约 356.45 亿元人民币)。

作为 AI 行业的最顶级的独角兽公司之一,OpenAI 最新估值为 1500 亿美元,已经远远高于该公司今年早些时候要约收购的 860 亿美元估值。

《华尔街日报》8 月 29 日曾报道称,OpenAI 正在进行一轮融资谈判。此次融资以 Thrive Capital 为主导,并将投资 10 亿美元(当前约 71.29 亿元人民币)。据称,微软作为 OpenAI 最大的支持者也参与了本轮融资,但微软拒绝发表评论。(来源:IT之家)

 

曝小米澎湃 OS 2.0 已开启内部员工测试:10 月随小米 15 系列发布

9 月 12 日消息,据爆料,小米澎湃 OS 2.0 系统已经开启了员工内部测试,距离正式发布越来越近了。

据悉,澎湃 OS 2.0 将会带来多想优化,包括底层架构的完善,是真正的澎湃 OS 完全体。

该系统还会主攻 AI,卢伟冰此前就曾透露,到目前发布的号称 AI 手机的都是 AI Feature 手机,也就是用 AI 的技术做了一些 AI 功能。

在卢伟冰看来,真正的 AI 手机是搭载基于 AI 大模型重构的操作系统,小米澎湃 OS2.0 就承担这一使命。(来源:快科技)

印度部长:印度产 iPhone 16 将供应全球,印度制造走向世界

9 月 11 日,印度电子与信息技术部长阿什维尼·维什瑙在社交平台 X 上宣布,苹果最新的 iPhone 16 已经在印度工厂生产,并将用于全球发售。维什瑙在帖子中表示,「莫迪总理的『印度制造』计划正推动为全球创造标志性产品。」他对这一成就表达了庆祝与自豪。

苹果近年来加快了在印度的生产布局,此举不仅让其在全球供应链中获得更安全的位置,也有助于分散生产风险。在全球供应链格局复杂的背景下,苹果通过依托印度政府提供的政策支持和经济激励,苹果得以进一步拓展其在印度的生产能力。

印度总理纳伦德拉·莫迪也在最新演讲中称赞了印度在科技方面的潜力,并计划在本十年末将该国的电子产业规模扩大到 5000 亿美元。

不过印度产 iPhone 良品率此前一直受到不少人质疑。有媒体称,印度工厂的良品率比中国和越南低大约 10%,但这仍在苹果的接受范围内。以郑州富士康的苹果手机良品率 98% 为参考,可以推测印度制造的 iPhone 良品率至少在 85% 以上。(来源:手机中国)

 

消息称三星电子开启海外裁员,部分部门高达 30%

9 月 11 日,据路透社报道,全球最大的智能手机、电视和内存芯片制造商三星电子正在裁减其海外员工,部分部门裁员幅度高达 30%。

报道称,两名消息人士称,三星已指示全球子公司将销售和营销人员裁减约 15%,行政人员裁减高达 30%。该计划将在 2024 年年底前实施,将影响美洲、欧洲、亚洲和非洲的职位。目前尚不清楚有多少人会被裁员,以及哪些国家和业务部门将受到最大影响。

三星在一份声明中表示,在一些海外运营部门进行的劳动力调整是常规性的,旨在提高效率。该公司表示,这些计划没有具体目标,并补充称不会影响其生产人员。

本月初,三星电子曾回应中国销售部门裁员 130 人传闻,称其为必要的业务调整和人员优化。(来源:DoNews)

罗永浩敦促俞敏洪主动退一赔三:出来混迟早都要还

9 月 11 日,罗永浩在微博发长文,谈到交个朋友直播间售卖「假洋鬼子品牌」的「芬迪卡萨月饼」,并决定退一赔三给消费者。

罗永浩表示,作为交个朋友聘请的首席监督官,我和公司一起,向购买了假洋鬼子品牌月饼的消费者诚挚致歉,退一赔三的钱款大概会在十个工作日内自动到账。

他指出:「除了交个朋友和辛选,是不是那些卖了假货和恶性问题产品的大直播间,几乎从来不做全部订单的主动退一赔三啊?同样卖过 3.15 槽头肉、TiQ 天萁西梅汁、假冒野生厄瓜多尔白虾等一系列恶性问题食品后,装聋作哑的「教育家」俞敏洪老师,你夜里还睡得安稳吗?

『建议』审判日到来之前,把东方甄选历史上所有的恶性问题产品主动做退一赔三,否则… 还是那句话,出来混,迟早都要还的。」罗永浩说。(来源:快科技)

 

微软量子计算新突破:成功纠缠了 12 个逻辑量子位

9 月 11 日,微软公司与 Atom Computing 公司联合宣布计划打造全球最强大的量子计算机。这款量子计算机融合了量子比特虚拟化系统和 Atom Computing 公司的中性原子硬件,成功制造出了逻辑量子比特,并致力于提供可靠的量子计算功能和结果。

Atom Computing 的硬件具备扩展纠错所需的关键能力,包括大量高保真量子比特、全互联量子比特连接、长相干时间和带有量子比特重置与复用的中间电路测量。该公司正在构建第二代系统,拥有超过 1200 个物理量子比特,并计划每一代硬件都将物理量子比特数量提升十倍。

据悉,Atom Computing 的硬件将采用微软的容错协议。这项合作旨在展示微软 Azure Quantum 平台能够通过多种不同硬件解决方案提供可靠的逻辑量子比特。

关于搭载微软平台的 Atom Computing 设备何时可以投入商用,微软并未透露具体信息。(来源:中关村在线)

 

苹果 iPhone 16 Pro 系列「正常」跑分出炉:A18 Pro 单核 3409 分、多核 8492 分

9 月 11 日,代号 iPhone 17,2 的 iPhone 16 Pro 系列机型 GeekBench 最新跑分已出炉。其单核成绩高达 3409 分,多核成绩为 8492 分。相较于之前的跑分大幅提升,也比之前 iPhone 16 的 A18 跑分高出不少。

新跑分相较于 iPhone 15 Pro Max,单核成绩提升超 20%,多核成绩提升超 21%。

iPhone 16 Pro 和 Pro Max 均搭载 A18 Pro 芯片,采用台积电第二代 3nm 技术;拥有 6 核 CPU,其中 2 个性能核心和 4 个效率核心,官方称比 A17 Pro 速度提升 15%,能在提供相同性能的同时降低 20% 的功耗;采用 6 核 GPU,运行速度比 A17 Pro 快 20%。(来源:IT之家)

 

滴滴包车服务全国上线:3 种车型可选,提供 24 小时专属人工客服

9 月 11 日,滴滴出行宣布,滴滴包车将服务推广至全国,并上线「中秋、国庆包车 5 折起」活动。此前,滴滴包车已在全国的 44 座城市陆续上线,这次滴滴包车进一步扩大包车服务范围。

截至目前,滴滴包车共提供经济 5 座、舒适 5 座和商务 7 座 3 种车型。每种车型共有 6 种套餐选项,包括 4 小时 50 公里、4 小时 100 公里、8 小时 100 公里、8 小时 200 公里、10 小时 125 公里和 10 小时 250 公里。

用户通过滴滴 App 或小程序首页,即可进入「滴滴包车」服务,输入起终点和用车时间后,点击立即包车,选择符合需要的套餐,在预付完车费后,即可等待司机接单服务。

滴滴出行官方承诺,滴滴包车对基础套餐费、超时长费、超公里费等均进行标注。在服务标准上,滴滴包车司机需满足 5 年以上驾龄和「优良服务口碑」,入选车辆也必须为 3 年以内的准新车。滴滴包车还推出「无忧退、爽约赔、免费等」三大服务承诺,并提供 24 小时专属人工客服。(来源:IT之家)

 

法拉利首款电动车路测曝光:模拟 V8 引擎超跑声浪,将于明年亮相 

9 月 11 日,据 Acriore 频道最新一期 YouTube 视频中,抓拍到法拉利首款电动车,并记录了声浪,酷似 V-8 引擎发出的声音。

Acriore 本次拍摄到的是一辆测试车,伪装排气管末端用大量锡箔纸固定,根据视频所展示的声音,听起来像是引擎盖下藏着一台 V-8 发动机。

法拉利首席执行官内德托维尼亚(Benedetto Vigna)此前曾表示:「电动汽车不会是静音。」

根据法律规定,电动汽车需配备某种噪音发生器,通常以安装在车身下方的扬声器形式呈现,主要警示行人有车辆接近。法拉利并不满足于使用普通的嗡嗡声,而是致力于模拟内燃机的声音。(来源:IT之家)

 

华为商城上架 BOW 折叠触控蓝牙键盘:适配 Mate XT 非凡大师,299 元

9 月 11 日,华为商城上架 BOW 折叠触控蓝牙键盘,这款键盘通过了「DESIGN FOR HUAWEI」认证,适配华为 Mate XT 非凡大师,售价 299 元,将于 9 月 20 日 10:08 开售。

这款键盘有红色和黑色两种颜色可选;采用磁吸设计,折叠时自动合拢;机身厚 11mm、重 126g;靠近电脑或平板等设备,可被发现并配对连接。

这款键盘兼容 HarmonyOS、安卓、iOS、Windows 和 macOS 系统;右下角有一个迷你触摸板(iOS 不支持);可连续工作超 20 小时。(来源:IT之家)

 

苹果尝试引入日本 JDI 低分辨率 OLED 面板,预计将用于「平价版 Vision Pro」头显

9 月 11 日,据 TheElec 报道,苹果最近从日本 JDI 那里拿到了一个基于玻璃基板的 OLED 面板,旨在用于其性价比型 Vision Pro 类 MR 设备。

据称,该面板像素密度仅有 1500 PPI(现款 Vision Pro 为 3391 PPI),可有效降低成本。此外,苹果今年早些时候还要求三星显示开发具有 1700ppi 像素密度的 OLEDoS(硅基 OLED)。

消息人士称,JDI 这些样品还得到了索尼的技术支持,而索尼正是苹果 Vision Pro 中 OLEDoS 供应商。相对于索尼面板,JDI 样品分辨率较低,而且使用的是玻璃而非硅作为基板,因此有望大幅降低成本。(来源:IT之家)

研究生起诉微信提现手续费高:提现 5 万收 50 元,腾讯回应

9 月 11 日,近日,将就读华东政法大学研一的杨同学起诉微信提现手续费一案顺利开庭。在杨同学社交平台主页上,杨同学分享了庭审前后与腾讯的对峙过程和起诉腾讯的思路。

起诉腾讯的契机是自己的好友上半年用微信提现了一笔五万块钱的零钱,被收取了将近五十块钱的手续费,他们深感这笔费用收的不是很合理,就去搜寻了很多数据,经过初步估算,结论是微信提现的手续费其实是偏高的。

对此,微信客服表示,微信收取提现手续费是因为银行侧有交易成本,收取部分手续费是为了平衡成本和可持续发展。但并未具体说明银行侧交易成本的构成和情况。

当被问及为什么是 0.1% 时,微信客服表示需转接专业人士,截至目前尚未收到相关答复。目前,案件已在深圳前海合作区人民法院开庭。

杨同学表示,即使败诉,也认为这次诉讼是一种尝试和反制,目的是希望通过法律途径让平台对用户的声音给予更多的关注和回应。(来源:新浪科技)

浏览量: 49

文章分页

上一页 1 … 126 127 128 … 144 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间