Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 兼职翻译 / 求职
    • 英语
    • 俄语
    • 德语
    • 日语
    • 法语
    • 西班牙语
    • 韩语
    • 小语种
  • 兼职翻译 / 招聘
  • 短视频
  • 即时新闻
  • 生活
  • 亚洲时事
  • 科技
  • 51蛙吖蛙公告
  • 金融
  • 杂谈
  • Toggle search form

标签: 科技

马斯克怒怼特斯拉换帅报道;苹果库克称关税成本暂不转嫁给消费者,但未来难说;游戏科学获五四青年奖章集体

马斯克怒怼特斯拉换帅报道:蓄意造假、严重违反职业道德!

快科技 5 月 1 日消息,今天有报道称,由于特斯拉股价下跌以及部分投资者对马斯克过度关注白宫事务表示不满,特斯拉董事会已开始考虑寻找马斯克的继任者。

特斯拉 CEO 伊隆·马斯克对此报道进行了强烈批评,指责其「蓄意造假」并「有损新闻业声誉」。

马斯克还指出,报道中未提及特斯拉董事会此前对相关传闻的明确否认声明,认为这是严重违反职业道德的行为。

此外,特斯拉董事长 Robyn Denholm 也澄清称,有关董事会联系猎头公司寻找新任 CEO 的报道「完全不实」,并强调董事会对马斯克「充满信心」。(来源:快科技)

关税重压本季度成本将增加 9 亿美元:苹果库克称暂不转嫁给消费者,但未来难说

5 月 2 日消息,在今天召开的财报电话会议上,苹果首席执行官蒂姆・库克(Tim Cook)预估,美国关税政策导致公司第 3 财季(4~6 月)将额外增加 9 亿美元(现汇率约合 65.41 亿元人民币)成本,但公司决定自行消化这一费用,暂不将成本转嫁给消费者。

库克首先称赞了公司的运营团队,表示其在优化供应链和库存管理方面表现出色,尽力减轻关税带来的冲击。不过他也坦言未来关税政策充满诸多不确定性,因此不排除 iPhone、iPad 等产品未来涨价的可能。

苹果公司为应对关税压力,正迅速调整全球制造布局,一方面积极调整在印度、越南等地区的生产力度,另一方面持续与各方沟通,高度参与关税相关讨论。分析指出,若白宫进一步推动美国本土制造政策,苹果在印度和越南的替代供应链也可能成为施压目标。(来源:IT 之家)

 

英伟达黄仁勋称华为是全球最强科技公司之一,中美在 AI 发展领域的水平非常接近 

5 月 1 日消息,据 CCTV 国际时讯今日报道,当地时间 4 月 30 日,美国英伟达公司总裁兼首席执行官黄仁勋在出席美国国会活动后接受采访时表示,中美在人工智能(AI)发展领域的水平非常接近。

黄仁勋强调,中国是一个意志坚定、能力超群的国家,全球一半的人工智能领域研究人员都是中国人,而人工智能领域的竞争是一场「持久战」,无法速胜。

黄仁勋在回答有关华为芯片技术问题时表示,「华为毫无疑问是全球最强大的科技公司之一,在计算技术、网络技术和软件能力方面强得令人难以置信,拥有推动人工智能(AI)发展的所有必要能力。」(来源:IT 之家)

 

快手研发线换帅,陈彬接任高级副总裁于冰职务 

快手公司近期宣布了一项重要的人事变动决定,涉及公司的技术研发领域。此次调整中,前任研发线负责人、高级副总裁于冰将卸任现有管理职务,转而担任公司的技术顾问角色。这一变动标志着快手在技术研发管理层面的一次全新布局。

接替于冰重任的是陈彬,他将被任命为快手研发线的新负责人,并同时加入公司的经营管理委员会。在新的岗位上,陈彬将直接向快手 CEO 程一笑汇报工作,共同推动公司在技术研发领域的持续创新与发展。(来源:ITBEAR)

 

加入小米 15 年,小米女高管许斐新任国际市场部总经理 

快科技 4 月 30 日消息,日前,小米集团副总裁、CMO 许斐通过微博宣布,其已任职小米国际市场部总经理。

许斐表示,「4 月我有一个新身份,今天作为 CMO 兼国际市场部总经理,跟大家汇报市场部的工作」。

在 4 月小米集团市场体系全员会上,许斐称,未来国际市场一定是我们发展空间最大的市场,我们的高端化在国际战区一定是大有可为。(来源:快科技)

多邻国借助 AI 推出 148 门新语言课程引争议   

多邻国近期在语言学习领域迈出了重大步伐,宣布推出了一系列由生成式 AI 精心打造的语言课程,总数高达 148 门。

多邻国的联合创始人兼首席执行官 Luis von Ahn 表示,公司曾花费了长达 12 年的时间开发了前 100 门课程,而现在,借助生成式 AI 的力量,仅用一年时间就成功推出了近 150 门新课程。这一成就不仅彰显了生成式 AI 在教育领域的巨大潜力,也体现了多邻国在 AI 和自动化方面投资的显著回报。

然而,尽管多邻国在 AI 应用方面取得了显著成果,并大力宣传其优势,但这一举措并未赢得所有用户的认可。事实上,许多用户对公司计划通过 AI 取代工人并在应用中深入使用 AI 的做法表示了失望和担忧。他们认为,AI 的应用可能导致 App 内容质量下降,变得不准确且不可靠。

面对诸多争议和挑战,多邻国坚持其 AI 转型的道路。公司方面表示,将继续致力于提升 AI 技术的准确性和可靠性,以确保为学习者提供高质量的语言学习体验。同时,他们也将密切关注用户的反馈和需求,不断优化和改进产品和服务。(来源:ITBEAR)

 

马斯克的 X 平台(推特)开始支持上传 4K 视频 

5 月 1 日消息,埃隆・马斯克的社交网站 X(推特)现在开始为部分创作者推出上传 4K 分辨率视频的功能,旨在提高参与度并防止用户流失到 YouTube 或 Vimeo 观看视频。

根据 X 工程账户昨日发布的帖子,该功能将很快向所有高级订阅者开放。(来源:IT 之家)

 

任天堂修改 eShop 排行榜规则,过滤廉价「AI 垃圾」游戏

5 月 1 日消息,任天堂改变了其 eShop 排行榜的上榜规则,这一举措有望减少大量被过度展示的廉价「AI 垃圾」游戏。

近年来,数字商店如 PlayStation Store、任天堂 eShop 和 Steam 因对游戏发布采取宽松态度而受到批评,导致一些极其廉价的游戏出现在平台上,这些游戏通常被称为「推土机游戏」或「AI 垃圾」(这类游戏经常使用生成式 AI 图像)。

这些游戏的开发者将每款游戏的价格定得极低,因为通过卖出足够多的副本,游戏就会出现在商店排行榜上,给人一种游戏很受欢迎的印象,从而卖出更多副本。

现在,任天堂采取了一项举措,改变了 eShop 销售图表的计算方式。它不再根据过去 48 小时内售出的游戏数量来排名,而是根据过去 72 小时内的收入来排名。这意味着价格极低的游戏将不再出现在排行榜上,因为售价 1 元的游戏需要售出 60 份才能与售价 60 元的游戏收入相当。(来源:IT 之家)

 

皮查伊的新野心:推动谷歌 Gemini 成为 iPhone 内置 AI 新选项 

5 月 1 日消息,据彭博社报道,在当地时间周三的庭审中,Alphabet 公司首席执行官桑达尔・皮查伊表示,他希望 Gemini 今年能够成为 iPhone 的内置 AI 选项之一。

苹果的 AI 系统 Apple Intelligence 在其 iPhone、iPad 和 Mac 设备上负责大多数 AI 任务,使用的是苹果自家的模型。不过,苹果也与 OpenAI 的 ChatGPT 达成了合作,将其整合进 Siri 和写作工具中,这一功能能够帮助用户在苹果操作系统中进行文本创作和编辑。(来源:IT 之家)

 

2025 年五一档首日票房 1.83 亿,《水饺皇后》《猎金・游戏》《人生开门红》前三

5 月 2 日消息,据灯塔专业版,截至 21 时,2025 年五一档首日票房 1.83 亿,影片《水饺皇后》《猎金・游戏》《人生开门红》《幽灵公主》《苍茫的天涯是我的爱》位列票房前五。

整理如下:

-《水饺皇后》票房 4308.9 万

-《猎金・游戏》票房 3285.2 万

-《人生开门红》票房 1877.5 万

-《幽灵公主》票房 1779.0 万

-《苍茫的天涯是我的爱》票房 1728.8 万

作为对比,2024 年五一档首日票房 4.12 亿,今年的五一档票房同比下滑 55.58%。(来源:IT 之家)

小米 SU7 Ultra 汽车更新 1.7.0 限制最大马力,打卡赛道成绩才能解锁 1548 匹 

5 月 1 日消息,博主 @ 大头玩车日记 (杠裂哥) 今日凌晨发布视频称,小米 SU7 Ultra 汽车更新 1.7.0 车机版本,1548 匹最大马力被限制,需要达成赛道成绩才能解锁,否则只能用大约 900 匹马力。(来源:IT 之家)

 

谷歌 Gemini AI 酝酿新高级订阅层级,Ultra 蓄势待发 

5 月 1 日消息,科技媒体 testingcatalog 今天(5 月 1 日)发布博文,报道称谷歌计划扩展 Gemini AI 服务,可能扩展推出「Gemini Ultra」订阅层级。

据博文介绍,谷歌目前通过 Google One AI Premium 计划的,推出「Gemini Advanced」订阅层级,月费 19.99 美元,涵盖 Gemini 2.5 Pro 等先进 AI 模型,以及 Deep Research、Veo 2 视频生成和 Google Workspace 应用集成等功能。(来源:IT 之家)

 

微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1

5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量「可教导」提示数据集训练,专为复杂推理任务设计。

IT 之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系列模型不仅延续了小型模型的高效特性,还在推理能力上实现重大突破。(来源:IT 之家)

全球最大「人造太阳」完成其「电磁心脏」组件制造,30 多个国家通力合作 

5 月 1 日消息,国际热核聚变实验堆(ITER)组织官网 4 月 30 日宣布,其已完成全球最大、最强的脉冲超导电磁体系统的所有组件制造,这是聚变能源领域的一项里程碑式成就。

据介绍,最后一个完成制造的组件是中心螺线管的第六个模块,由美国制造并完成测试。该模块将运往法国南部圣保罗-莱迪朗斯的 ITER 现场进行组装,届时中心螺线管将成为整个系统中最强大的磁体,其磁力强大到足以举起一艘航空母舰。

中心螺线管将与六个环形极向场(PF)磁体协同工作,这些磁体由俄罗斯、欧洲和中国制造并交付。完整组装后的脉冲磁体系统重量将接近 3000 吨。它将作为 ITER 甜甜圈形反应堆的「电磁心脏」,发挥核心作用。

ITER 是由 30 多个国家组成的国际合作项目,旨在证明聚变——即太阳和恒星所拥有的能量——作为一种丰富、安全、无碳的地球能源的可行性。(来源:IT 之家)

《黑神话:悟空》开发商游戏科学团队荣获 2025 年度中国青年五四奖章集体

5 月 1 日消息,据「共青团中央」公众号 4 月 30 日消息,为表彰我国优秀青年在推进中国式现代化中的贡献,集中展示新时代青年的精神品格和价值追求,激励引导全国广大青年积极投身强国建设、民族复兴伟业,共青团中央、全国青联决定:

– 授予王传英等 30 名同志 2025 年度中国青年五四奖章

– 授予新疆克州阿图什市哈拉峻乡谢依特小学戍边支教西部计划志愿者服务队等 30 个青年集体 2025 年度中国青年五四奖章集体

– 授予王崇鹏等 677 名同志 2025 年度新时代青年先锋

此外,杭州游科互动科技有限公司青年团队荣获 2025 年度中国青年五四奖章集体,也就是《黑神话:悟空》的开发团队。同时,大家熟知的宇树科技创始人王兴兴、神舟十六号航天员朱杨柱荣获 2025 年度中国青年五四奖章。(来源:IT 之家)

 

浏览量: 0

一个月 78 块的 AI 日历,治好了我的「万事开头难」

 

作者 | Li Yuan 

编辑 | 郑玄

你有没有一件事,因为做起来太麻烦,拖到一直都不想开始?

好吧,笔者承认,我有这个问题。这也是笔者自从拥有智能手机以来,一直在不断尝试各种日程管理和 To-do List 应用的原因。

不过笔者很快就发现,对于一个擅长规划的人而言,似乎只用一个日历,也已经能很好地规划自己的工作了。而对于一个本来就讨厌规划的人而言,添加任务,添加截止日期,添加子任务,添加截止日期,分配优先级,本身就是一项令人头疼到不想开始的事情。

于是,我和日程软件的关系,最后变得很像一对怨偶——只有任务变得又紧急又多又重要的时候,我才会鼓起勇气,把一件一件任务登记到软件里,设置好截止日期和提醒时间。而只要能够稍得喘息,我就永远想不起来打开这个软件。

而如果一件事情虽然重要,比如我知道我想学习拳击,但是这件事并不十分紧急,对我来说又很麻烦——又要去买装备又要去对比课程,哪个 To-do List 也很难帮我开启这一任务。

作为一个日程管理 app 的资深用户,笔者本来已经对这个「老怨偶」不再抱有太多期望了。大多数 To-do List 的软件,功能都大同小异,区别无非是 UI 和使用上的繁琐程度。

不过,最近,机缘巧合之下,笔者发现了一款 AI-native 的日程管理软件,让我突然眼前一亮。

日程管理领域,早已有一整套成熟完整的理论体系,无论是「重要 vs 紧急」四象限理论、番茄工作法、还是 GTD 理论,都早在上世纪就已经被提出。而这款软件,却在这样一个「历史悠久、创新稀少」的领域中,依然借助 AI 做出了突破,甚至意外地,在我的日常生活里真正起到了点作用。

 

AI-native 的日程软件长什么样?

 

笔者是在小红书最开始发现了这款软件。

名叫 Splitti,这款由国外独立开发者设计的日程管理软件,最先在 ADHD 社群中有了小范围的传播——ADHD 人群注意力不集中,因此对于日程管理软件本身的需求,也相对比较旺盛。

而这款 app,主打的是能够使用 AI,帮助 ADHD 人群,更快地启动任务和安排生活。

一打开这个 app,我就感受到了这个软件的与众不同之处。

作为日程软件的老用户,笔者已经对日程软件的界面十分熟悉——一般不是一个日历,就是一个任务添加界面。

而打开 Splitti,则很不一样——你被要求写一段自我介绍,让 AI 更好地了解你。

 

 

不明所以,笔者填写了几个关键信息:「Li Yuan、女、科技作者、INTP」,并填写了一个规划痛点「养猫,猫会打扰我的工作。」

接下来,出乎笔者的意料,app 马上根据笔者输入的内容,生成了一段非常长的对笔者个人的情况分析,包括「注意她可能喜欢深度专注,应该在交流中增加智识性内容。」等等。并马上提出了三个追问问题,包括「在做科技作者的过程中,你遇到的最大挑战是什么?」

这种体验确实是在 AI 时代之前难以想象的。软件并不像之前的日程软件一样,提供的是一个标准化的工具体验,而更像一个真正的私人教练,在接触中,会选择先了解你的情况。

而在获得笔者的私人情况后,Splitti 开始建议笔者增加一条新任务。

任务可以直接用自然语言,甚至语音输入,直接输入关于这条任务,我的所有思考就可以了。

 

 

接下来,AI 则根据它对我,和对人物的理解,直接将这个任务分成了多个子任务。

 

 

除了分解任务之外,笔者还惊喜地发现,AI 已经为我的每个任务,规划了一个大概能完成的时间,并给他们自动设置了截止日期。

每一个子任务,如果过于抽象,还可以点击,再次进行任务分解。比如「找到拳击课程」可以进一步拆解为「在网上调研」,「在线下调研」,「阅读评论」,「给场馆打电话」,「列出不同场馆的对比」。

在任务被拆解到足够细之后,即使是启动困难的人,似乎也有了可以开始的动力。而 Splitti 正是用 AI 为用户垫好了这关键的一步。

甚至在深度使用中,笔者发现, 这样的任务拆解,甚至是根据个人使用定制化的——在笔者添加了一个写作任务之后, AI 进行任务拆解时,会单独拆解出一条任务:请寻找一个合适的工作环境,尽量免受猫咪打扰。

使用越多,把自己的需求和困惑向 AI 讲解地越明确,AI 就会生成一个越完美的私人定制规划。

笔者还惊喜地发现,AI 能做的还不仅如此。

AI 还能为我的任务生成经典的「重要 vs 紧急」四象限图。在得知我是一个科技作者后,AI 自动把我列出的「撰写一个机器人方向稿件」列入了重要且紧急的象限中,而把寻找拳击场馆列入了不那么重要且不紧急的象限中,并在下面给出了自己的原因。

 

 

在添加多条任务后,AI 还可以根据添加的任务,直接帮你规划出日程安排,重要紧急事项靠前,而不那么紧急的事项靠后。甚至还加入了一些不完全符合中国水土的考量——AI 把工作事项都尽量安排在了每天晚上五点之前,五点之后安排了健身和娱乐。

 

 

甚至除了传统的日程软件的功能之外,Splitti 还会提供对于添加任务的分析——事业方向的任务过多了,也需要多安排一些朋友聚会;当日的情绪疏导——用户可以选择不同的 AI 导师,从幽默风趣型的,到正念冥想型的;还可以收到针对用户定制化的通知——Yuan,你想要力量的话,就应该赶紧来挑拳击设备了!

笔者第一次感觉到 AI-Native 的应用的魅力。

相比于传统 To-do List 软件,用户所需要付出的努力非常少,只需要用「人话」把自己想做的事,想长期实现的目标简单说一遍,而获得的体验,却是完全翻倍的。

相比于传统更像「电子化日历」的应用,Splitti 更像是一个能听懂人话、但比人类更强的助手——它不会遗漏细节,也不会被复杂的规划问题搞得头疼。

对人来说,添加一项新任务,往往意味着整个日程都需要重新调整:要重新评估每项任务的重要性和紧急性,考虑购物是否安排在促销日,健身是否避开生理期,最后才能决定新任务的最佳插入点。

但对 AI 而言,这一切只需一秒,整个日程就能被即时、自动、合理地重新安排。

 

AI-Native App 的一种新思路:不同档位 AI 进行不同定价

 

Splitti 的另一个有趣之处,是它尝试了一种完全 AI-Native 的定价方式。

通常情况下,To-do List App 有自己的一套定价方式。

以 2013–2014 年就已推出的知名应用滴答清单为例,目前采用「免费+付费解锁高级功能」的模式:免费用户可以使用基础的日历视图,并创建有限数量的清单和任务;而成为高级会员后,才能解锁如持续提醒、时间段设置、高级数据统计、更大的任务和清单容量等功能。

这样的定价策略,反映了传统的日程软件的电子工具属性——免费用户只能使用不那么好用的工具,而付费用户,则可以获得更强大的工具。

而 Splitti 在这点上,设计理念是完全不同的。

 

 

虽然 Splitti 的不同付费档位也存在一定的功能差异,但它的核心定价逻辑,并不在于「能用多少功能」,而在于「用的是哪种 AI」。

免费用户几乎可以使用与付费用户相同的功能,但调用的是被称为「简单 AI 」的基础模型。中档付费用户则可以获得「更智能的 AI」,而最高档位的用户,使用的则是 Splitti 提供的「最先进的 AI」。

在功能层面,最高档付费用户获得的也并不是更多的工具选项,而是更深度的 AI 交互权限——他们可以更频繁地与 AI 沟通,提出更复杂的请求,享受更个性化、更智能的任务规划体验。

对 Splitti 来说,贵的不是功能多,而是你可以「更多地跟更聪明的大脑对话」。

作为一个小众 app,这样的定价方式是不是能够获得接受还不明确,不过笔者在美区的 app 评论下,找到了一个有趣的评价:

 

 

 

「我用了二十年的手机,这是我人生中第一次留下应用评论。我之所以写这条评论,是因为我觉得这个 App 对像我这样的人来说简直是救星。我有决策瘫痪、注意力缺陷障碍(ADHD),总是对生活感到极度压力大、难以招架。过去,我曾是个高效能人士,但自从有了孩子,加上每天被各种紧急事务压得喘不过气来,我的生活节奏彻底被打乱了。过去两年我几乎是在痛苦中熬过来的。

 

我曾考虑过请一位生活教练,希望有人能帮助我找回动力、重新接触我热爱的事情,同时也帮我理清思路、保持条理。然而,当我得知报价在 6000 到 7000 美元之间时,我意识到这条路对我来说并不可行。

 

我知道自己非常需要那种「有个人真正关心我、会问我怎么了、会追问细节、会提出前进建议」的帮助。所以我开始寻找带有 AI 辅助的任务管理工具,尝试了大概四款,最终选择了这一个。

 

它真的非常棒,我目前还没有用完所有功能,但已经印象深刻。当然,它还有一些 bug 和小问题需要完善,毕竟这款应用还比较新。但我真的很认可他们的思路,也希望借由这条评论表达我的感谢,并为他们的成长和改进贡献一份力量。

 

谢谢你们!」

 

当用户真的能够将 app 与 life coach(生活教练)这样的服务开始对比的时候,或许 Splitti 已经成功了一半了。

 

AI 时代的软件开发——或许从 Day One 就可以跨国

 

相信读者或许注意到了,在本文的配图中,Splitti 的软件中,有时文字是中文,而有时文字是英文。

这或许也是下一个时代的 AI 应用中,非常有趣的一点。

在上一个时代中,如果想做出非常好的应用出海,翻译和本地化是非常重要的一点。而对于新时代的 AI 应用而言,却不一定完全如此。

笔者在第一次使用 Splitti 的时候,使用的是 Splitti 的英文版本软件 。然而从一开始,笔者输入的个人简介,就是全中文输入。而在 AI 时代,这并没有任何影响。

软件背后的 AI,认识每一种语言,虽然前端使用了英文提示,但无论你输入的是哪种小众的语言,并不会影响 AI 的核心功能,AI 仍然能我把任务进行成功分解,进行规划。

对于应用出海而言,现在或许是前所未有的好时机。

不过同时,用 AI 开发应用,也仍然存在许多不稳定性。

Splitti 的评论中,也有不少评论都在批评软件的 bug。

这与软件本身由两位独立开发者开发有关。作为一项准日程工具,Splitti 在功能上极其全面。不仅具有 AI 分解任务,AI 规划日程,AI 陪伴提醒这样的创新功能,还具备了比如「重要 vs 紧急」四象限、番茄钟、任务分析、白噪音冥想等一系列传统日程软件可能要付费获得,或者不会全面实现的功能。显然两位独立开发者的野心过于庞大,导致软件仍有不少 bug 影响使用。

而同时,部分原因也仍然根植于 AI 应用开发无法绕开的 AI 本身的局限性中。

如前面所提到,AI 本身虽然能读懂中文,有时候 AI 会选择用英文帮我分解任务,有时 AI 会选择用中文帮我分解任务,这完全无法预料。

而在一些评论中,还有用户提到,有时 AI 设置的截止时间不对,用户手动调整时间的时候,AI 会忽略用户调整的时间,按照自己生成的截止时间规划日程。

经过精调后,这些问题并非不可解决,不过对于新时代的 AI 开发者而言,要不断面临 AI 带来的未知性,将是一项永久的功课。

 

AI 应用从卖生成能力走向卖推理能力

 

在 Splitti 身上,笔者也看见了 AI 应用的未来。

过去我们所熟悉的 AI,多是依赖其生成能力:生成对话,提供情绪价值;或者用来进行文字总结、润色,提升一定程度的生产力。但这些应用的核心,仍然是「生成内容」。

而随着 OpenAI 的 o 系列、DeepSeek R1 等推理模型的逐步成型,AI 的「智力」实现了真正意义上的飞跃。我们终于可以开始依赖 AI,去完成那些过去对人类来说既繁琐又困难的任务——需要进行多个维度的考量最后做出判断的任务。

Splitti 的特别并不在于它重新定义了日程工具的呈现方式,而在于它将任务分解、长期规划、日程安排——这些对人类来说难度较高的工作,交由 AI 处理。

它不是在用户规划之后,用更漂亮的方式「重写」内容,而是从根本上,使用了 AI 的「大脑」来代替人类进行逻辑思考和规划。

表面上,Splitti 似乎只是优化了交互方式——用户可以用自然语言来安排日程,使用体验更舒适;但实质上,它真正改变的是交付的内容:用户需要做的越来越少,而 AI 能承担的越来越多。

这样的变化,正在各个行业发生。

比如在 极客公园的采访 中,猿辅导的硬件负责人提到:在推理模型出现之前,AI 主要被用来解题和扩充题库,依赖的仍是生成能力。而现在,小猿 AI 会将用户的数据直接交给 AI,由它来判断用户不理解的知识点,并安排接下来的学习任务——这正是推理能力的体现。

旅游行业也有类似趋势。生成旅行规划在 2023 年就已成为 AI 应用的重点方向之一。但当时的产品更多是重新包装网络信息,充其量告诉用户某地有哪些景点、评分如何。而进入推理时代,我们有望看到 AI 真正「理解人类」,为用户制定出合理而个性化的行程规划。

AI 时代就是如此。看似没有太多变化,但实际已经走过沧海桑田。前一年 AI 能力尚不足以完成的,今年或许就可以了。

我们曾一度觉得 AI 像是个「情商高、但做事不太靠谱」的搭子——擅长聊天、擅长安慰,却难以真正承担任务。

而从今年开始,随着推理模型的成熟,这种印象或许将被颠覆:AI 的面孔开始更像一个智商高、逻辑缜密、执行力强的勤勉高管,能独立完成任务,也能做出判断和规划。

 

*头图来源 :AI 生成

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 0

一个月 78 块的 AI 日历,治好了我的「万事开头难」

 

作者 | Li Yuan 

编辑 | 郑玄

你有没有一件事,因为做起来太麻烦,拖到一直都不想开始?

好吧,笔者承认,我有这个问题。这也是笔者自从拥有智能手机以来,一直在不断尝试各种日程管理和 To-do List 应用的原因。

不过笔者很快就发现,对于一个擅长规划的人而言,似乎只用一个日历,也已经能很好地规划自己的工作了。而对于一个本来就讨厌规划的人而言,添加任务,添加截止日期,添加子任务,添加截止日期,分配优先级,本身就是一项令人头疼到不想开始的事情。

于是,我和日程软件的关系,最后变得很像一对怨偶——只有任务变得又紧急又多又重要的时候,我才会鼓起勇气,把一件一件任务登记到软件里,设置好截止日期和提醒时间。而只要能够稍得喘息,我就永远想不起来打开这个软件。

而如果一件事情虽然重要,比如我知道我想学习拳击,但是这件事并不十分紧急,对我来说又很麻烦——又要去买装备又要去对比课程,哪个 To-do List 也很难帮我开启这一任务。

作为一个日程管理 app 的资深用户,笔者本来已经对这个「老怨偶」不再抱有太多期望了。大多数 To-do List 的软件,功能都大同小异,区别无非是 UI 和使用上的繁琐程度。

不过,最近,机缘巧合之下,笔者发现了一款 AI-native 的日程管理软件,让我突然眼前一亮。

日程管理领域,早已有一整套成熟完整的理论体系,无论是「重要 vs 紧急」四象限理论、番茄工作法、还是 GTD 理论,都早在上世纪就已经被提出。而这款软件,却在这样一个「历史悠久、创新稀少」的领域中,依然借助 AI 做出了突破,甚至意外地,在我的日常生活里真正起到了点作用。

 

AI-native 的日程软件长什么样?

 

笔者是在小红书最开始发现了这款软件。

名叫 Splitti,这款由国外独立开发者设计的日程管理软件,最先在 ADHD 社群中有了小范围的传播——ADHD 人群注意力不集中,因此对于日程管理软件本身的需求,也相对比较旺盛。

而这款 app,主打的是能够使用 AI,帮助 ADHD 人群,更快地启动任务和安排生活。

一打开这个 app,我就感受到了这个软件的与众不同之处。

作为日程软件的老用户,笔者已经对日程软件的界面十分熟悉——一般不是一个日历,就是一个任务添加界面。

而打开 Splitti,则很不一样——你被要求写一段自我介绍,让 AI 更好地了解你。

 

 

不明所以,笔者填写了几个关键信息:「Li Yuan、女、科技作者、INTP」,并填写了一个规划痛点「养猫,猫会打扰我的工作。」

接下来,出乎笔者的意料,app 马上根据笔者输入的内容,生成了一段非常长的对笔者个人的情况分析,包括「注意她可能喜欢深度专注,应该在交流中增加智识性内容。」等等。并马上提出了三个追问问题,包括「在做科技作者的过程中,你遇到的最大挑战是什么?」

这种体验确实是在 AI 时代之前难以想象的。软件并不像之前的日程软件一样,提供的是一个标准化的工具体验,而更像一个真正的私人教练,在接触中,会选择先了解你的情况。

而在获得笔者的私人情况后,Splitti 开始建议笔者增加一条新任务。

任务可以直接用自然语言,甚至语音输入,直接输入关于这条任务,我的所有思考就可以了。

 

 

接下来,AI 则根据它对我,和对人物的理解,直接将这个任务分成了多个子任务。

 

 

除了分解任务之外,笔者还惊喜地发现,AI 已经为我的每个任务,规划了一个大概能完成的时间,并给他们自动设置了截止日期。

每一个子任务,如果过于抽象,还可以点击,再次进行任务分解。比如「找到拳击课程」可以进一步拆解为「在网上调研」,「在线下调研」,「阅读评论」,「给场馆打电话」,「列出不同场馆的对比」。

在任务被拆解到足够细之后,即使是启动困难的人,似乎也有了可以开始的动力。而 Splitti 正是用 AI 为用户垫好了这关键的一步。

甚至在深度使用中,笔者发现, 这样的任务拆解,甚至是根据个人使用定制化的——在笔者添加了一个写作任务之后, AI 进行任务拆解时,会单独拆解出一条任务:请寻找一个合适的工作环境,尽量免受猫咪打扰。

使用越多,把自己的需求和困惑向 AI 讲解地越明确,AI 就会生成一个越完美的私人定制规划。

笔者还惊喜地发现,AI 能做的还不仅如此。

AI 还能为我的任务生成经典的「重要 vs 紧急」四象限图。在得知我是一个科技作者后,AI 自动把我列出的「撰写一个机器人方向稿件」列入了重要且紧急的象限中,而把寻找拳击场馆列入了不那么重要且不紧急的象限中,并在下面给出了自己的原因。

 

 

在添加多条任务后,AI 还可以根据添加的任务,直接帮你规划出日程安排,重要紧急事项靠前,而不那么紧急的事项靠后。甚至还加入了一些不完全符合中国水土的考量——AI 把工作事项都尽量安排在了每天晚上五点之前,五点之后安排了健身和娱乐。

 

 

甚至除了传统的日程软件的功能之外,Splitti 还会提供对于添加任务的分析——事业方向的任务过多了,也需要多安排一些朋友聚会;当日的情绪疏导——用户可以选择不同的 AI 导师,从幽默风趣型的,到正念冥想型的;还可以收到针对用户定制化的通知——Yuan,你想要力量的话,就应该赶紧来挑拳击设备了!

笔者第一次感觉到 AI-Native 的应用的魅力。

相比于传统 To-do List 软件,用户所需要付出的努力非常少,只需要用「人话」把自己想做的事,想长期实现的目标简单说一遍,而获得的体验,却是完全翻倍的。

相比于传统更像「电子化日历」的应用,Splitti 更像是一个能听懂人话、但比人类更强的助手——它不会遗漏细节,也不会被复杂的规划问题搞得头疼。

对人来说,添加一项新任务,往往意味着整个日程都需要重新调整:要重新评估每项任务的重要性和紧急性,考虑购物是否安排在促销日,健身是否避开生理期,最后才能决定新任务的最佳插入点。

但对 AI 而言,这一切只需一秒,整个日程就能被即时、自动、合理地重新安排。

 

AI-Native App 的一种新思路:不同档位 AI 进行不同定价

 

Splitti 的另一个有趣之处,是它尝试了一种完全 AI-Native 的定价方式。

通常情况下,To-do List App 有自己的一套定价方式。

以 2013–2014 年就已推出的知名应用滴答清单为例,目前采用「免费+付费解锁高级功能」的模式:免费用户可以使用基础的日历视图,并创建有限数量的清单和任务;而成为高级会员后,才能解锁如持续提醒、时间段设置、高级数据统计、更大的任务和清单容量等功能。

这样的定价策略,反映了传统的日程软件的电子工具属性——免费用户只能使用不那么好用的工具,而付费用户,则可以获得更强大的工具。

而 Splitti 在这点上,设计理念是完全不同的。

 

 

虽然 Splitti 的不同付费档位也存在一定的功能差异,但它的核心定价逻辑,并不在于「能用多少功能」,而在于「用的是哪种 AI」。

免费用户几乎可以使用与付费用户相同的功能,但调用的是被称为「简单 AI 」的基础模型。中档付费用户则可以获得「更智能的 AI」,而最高档位的用户,使用的则是 Splitti 提供的「最先进的 AI」。

在功能层面,最高档付费用户获得的也并不是更多的工具选项,而是更深度的 AI 交互权限——他们可以更频繁地与 AI 沟通,提出更复杂的请求,享受更个性化、更智能的任务规划体验。

对 Splitti 来说,贵的不是功能多,而是你可以「更多地跟更聪明的大脑对话」。

作为一个小众 app,这样的定价方式是不是能够获得接受还不明确,不过笔者在美区的 app 评论下,找到了一个有趣的评价:

 

 

 

「我用了二十年的手机,这是我人生中第一次留下应用评论。我之所以写这条评论,是因为我觉得这个 App 对像我这样的人来说简直是救星。我有决策瘫痪、注意力缺陷障碍(ADHD),总是对生活感到极度压力大、难以招架。过去,我曾是个高效能人士,但自从有了孩子,加上每天被各种紧急事务压得喘不过气来,我的生活节奏彻底被打乱了。过去两年我几乎是在痛苦中熬过来的。

 

我曾考虑过请一位生活教练,希望有人能帮助我找回动力、重新接触我热爱的事情,同时也帮我理清思路、保持条理。然而,当我得知报价在 6000 到 7000 美元之间时,我意识到这条路对我来说并不可行。

 

我知道自己非常需要那种「有个人真正关心我、会问我怎么了、会追问细节、会提出前进建议」的帮助。所以我开始寻找带有 AI 辅助的任务管理工具,尝试了大概四款,最终选择了这一个。

 

它真的非常棒,我目前还没有用完所有功能,但已经印象深刻。当然,它还有一些 bug 和小问题需要完善,毕竟这款应用还比较新。但我真的很认可他们的思路,也希望借由这条评论表达我的感谢,并为他们的成长和改进贡献一份力量。

 

谢谢你们!」

 

当用户真的能够将 app 与 life coach(生活教练)这样的服务开始对比的时候,或许 Splitti 已经成功了一半了。

 

AI 时代的软件开发——或许从 Day One 就可以跨国

 

相信读者或许注意到了,在本文的配图中,Splitti 的软件中,有时文字是中文,而有时文字是英文。

这或许也是下一个时代的 AI 应用中,非常有趣的一点。

在上一个时代中,如果想做出非常好的应用出海,翻译和本地化是非常重要的一点。而对于新时代的 AI 应用而言,却不一定完全如此。

笔者在第一次使用 Splitti 的时候,使用的是 Splitti 的英文版本软件 。然而从一开始,笔者输入的个人简介,就是全中文输入。而在 AI 时代,这并没有任何影响。

软件背后的 AI,认识每一种语言,虽然前端使用了英文提示,但无论你输入的是哪种小众的语言,并不会影响 AI 的核心功能,AI 仍然能我把任务进行成功分解,进行规划。

对于应用出海而言,现在或许是前所未有的好时机。

不过同时,用 AI 开发应用,也仍然存在许多不稳定性。

Splitti 的评论中,也有不少评论都在批评软件的 bug。

这与软件本身由两位独立开发者开发有关。作为一项准日程工具,Splitti 在功能上极其全面。不仅具有 AI 分解任务,AI 规划日程,AI 陪伴提醒这样的创新功能,还具备了比如「重要 vs 紧急」四象限、番茄钟、任务分析、白噪音冥想等一系列传统日程软件可能要付费获得,或者不会全面实现的功能。显然两位独立开发者的野心过于庞大,导致软件仍有不少 bug 影响使用。

而同时,部分原因也仍然根植于 AI 应用开发无法绕开的 AI 本身的局限性中。

如前面所提到,AI 本身虽然能读懂中文,有时候 AI 会选择用英文帮我分解任务,有时 AI 会选择用中文帮我分解任务,这完全无法预料。

而在一些评论中,还有用户提到,有时 AI 设置的截止时间不对,用户手动调整时间的时候,AI 会忽略用户调整的时间,按照自己生成的截止时间规划日程。

经过精调后,这些问题并非不可解决,不过对于新时代的 AI 开发者而言,要不断面临 AI 带来的未知性,将是一项永久的功课。

 

AI 应用从卖生成能力走向卖推理能力

 

在 Splitti 身上,笔者也看见了 AI 应用的未来。

过去我们所熟悉的 AI,多是依赖其生成能力:生成对话,提供情绪价值;或者用来进行文字总结、润色,提升一定程度的生产力。但这些应用的核心,仍然是「生成内容」。

而随着 OpenAI 的 o 系列、DeepSeek R1 等推理模型的逐步成型,AI 的「智力」实现了真正意义上的飞跃。我们终于可以开始依赖 AI,去完成那些过去对人类来说既繁琐又困难的任务——需要进行多个维度的考量最后做出判断的任务。

Splitti 的特别并不在于它重新定义了日程工具的呈现方式,而在于它将任务分解、长期规划、日程安排——这些对人类来说难度较高的工作,交由 AI 处理。

它不是在用户规划之后,用更漂亮的方式「重写」内容,而是从根本上,使用了 AI 的「大脑」来代替人类进行逻辑思考和规划。

表面上,Splitti 似乎只是优化了交互方式——用户可以用自然语言来安排日程,使用体验更舒适;但实质上,它真正改变的是交付的内容:用户需要做的越来越少,而 AI 能承担的越来越多。

这样的变化,正在各个行业发生。

比如在 极客公园的采访 中,猿辅导的硬件负责人提到:在推理模型出现之前,AI 主要被用来解题和扩充题库,依赖的仍是生成能力。而现在,小猿 AI 会将用户的数据直接交给 AI,由它来判断用户不理解的知识点,并安排接下来的学习任务——这正是推理能力的体现。

旅游行业也有类似趋势。生成旅行规划在 2023 年就已成为 AI 应用的重点方向之一。但当时的产品更多是重新包装网络信息,充其量告诉用户某地有哪些景点、评分如何。而进入推理时代,我们有望看到 AI 真正「理解人类」,为用户制定出合理而个性化的行程规划。

AI 时代就是如此。看似没有太多变化,但实际已经走过沧海桑田。前一年 AI 能力尚不足以完成的,今年或许就可以了。

我们曾一度觉得 AI 像是个「情商高、但做事不太靠谱」的搭子——擅长聊天、擅长安慰,却难以真正承担任务。

而从今年开始,随着推理模型的成熟,这种印象或许将被颠覆:AI 的面孔开始更像一个智商高、逻辑缜密、执行力强的勤勉高管,能独立完成任务,也能做出判断和规划。

 

*头图来源 :AI 生成

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 0

DeepSeek 发布 Prover-V2 模型;小米首个推理大模型开源;饿了么宣布超百亿补贴加入外卖战局

DeepSeek 发布 Prover-V2 模型,参数量达 6710 亿

4 月 30 日消息,DeepSeek 于 AI 开源社区 Hugging Face 上发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。

据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达 6710 亿,或为去年发布的 Prover-V1.5 数学模型升级版本。在模型架构上,该模型使用了 DeepSeek-V3 架构,采用 MoE(混合专家)模式,具有 61 层 Transformer 层,7168 维隐藏层。同时支持超长上下文,最大位置嵌入达 16.38 万,使其能处理复杂的数学证明,并且采用了 FP8 量化,可通过量化技术减小模型大小,提高推理效率。(来源:新浪科技)

小米开源「Xiaomi MiMo」大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini

4 月 30 日消息,小米大模型团队通过「Xiaomi MiMo」公众号宣布,小米开源首个「为推理而生」的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久的「小米大模型 Core 团队」的初步尝试。

在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括:

  • 预训练:核心是让模型见过更多推理模式

    • 数据:着重挖掘富推理语料,并合成约 200B tokens 推理数据。

    • 训练:进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。

  • 后训练:核心是高效稳定的强化学习算法和框架

    • 算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。

    • 框架:设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证加速 1.96 倍。(来源:IT 之家)

 

可生成 AI 播客:谷歌 NotebookLM 音频概览功能新增 76 种语言支持,包含中文

4 月 30 日消息,谷歌宣布其基于人工智能的笔记和研究助手工具 NotebookLM 的「音频概览(Audio Overviews)」功能新增 76 种语言支持。该功能于去年推出,旨在通过人工智能虚拟主持人根据用户上传到 NotebookLM 的文档(如课程阅读材料或法律摘要)生成播客,帮助用户以另一种方式理解和消化文档中的信息。

谷歌表示,此前「音频概览」功能仅支持用户账户所设置的首选语言。如今,公司新增了「输出语言」选项,用户可以自由选择生成「音频概览」的语言。谷歌强调,用户可以随时更改语言设置,这样就能根据需要轻松创建多语言内容或学习材料。

谷歌在一篇博客文章中举例说明了这一功能的实用性:「例如,一位准备关于亚马逊雨林课程的教师可以与学生共享多种语言的资源,比如葡萄牙语纪录片、西班牙语研究报告和英语学习报告。学生们可以将这些资料上传到 NotebookLM,并在他们偏好的语言中生成关键要点的音频概览。」(来源:IT 之家)

 

Meta 公布 2025 财年第 1 财季财报:营收 423.14 美元,同比增长 16%

5 月 1 日消息,Meta 公司4 月 30 日发布博文,公布了 2025 财年第 1 财季(截至 3 月 31 日)的财报业绩,营收达到 423.14 亿美元,同比增长 16%;净利润 166.44 亿美元,同比增长 35%。

Meta 在 2025 财年第 1 财季交出了一份亮眼的成绩单。总营收达到 423.14 亿美元(IT 之家注:现汇率约合 3078.03 亿元人民币),较去年同期的 364.55 亿美元增长 16%,若按固定汇率计算,增长率更是高达 19%。

净利润从去年的 123.69 亿美元跃升至 166.44 亿美元(现汇率约合 1210.73 亿元人民币),增幅达 35%;每股摊薄收益(EPS)从 4.71 美元提升至 6.43 美元,增长 37%;运营利润为 175.55 亿美元,同比增长 27%,运营利润率从 38% 提升至 41%。

Meta 旗下应用家族(Family of Apps)的日活跃用户(DAP)平均达 34.3 亿,同比增长 6%;广告曝光量(Ad Impressions)同比增长 5%,每条广告平均价格上涨 10%,推动广告收入达到 413.92 亿美元,占总营收的绝大部分。

Meta AI 的月活跃用户接近 10 亿,显示其在人工智能领域的快速布局。此外,公司现金流表现强劲,经营活动现金流为 240.26 亿美元,自由现金流为 103.34 亿美元,现金及有价证券总额达 702.3 亿美元。(来源:IT 之家)

 

微软第三季度营收 700.7 亿美元,高于市场预期

微软第三季度营收 700.7 亿美元,预估 684.8 亿美元;第三季度每股收益 3.46 美元;第三季度智能云业务营收 268 亿美元,预估 259.9 亿美元;第三财季云营收 424 亿美元,分析师预期 422.2 亿美元;第三财季 Azure 增长对人工智能(AI)业务贡献 16 个百分点,分析师预期公司 15.6 个百分点。美股盘后涨超 6%。(来源:新浪科技)

苹果加速印度布局,塔塔 / 富士康新工厂被曝组装生产 iPhone 16e 等机型

4 月 30 日消息,路透社 4 月 29 日发布博文,报道称苹果公司在印度南部的两家新工厂已启动生产。其中一家由塔塔电子(Tata Electronics)运营的工厂已开始生产老款 iPhone,而另一家由富士康(Foxconn)建设的工厂将在 5 月启动发货。

IT 之家援引博文介绍,位于印度南部泰米尔纳德邦霍苏尔(Hosur)的塔塔电子新工厂已于近日投产,首批生产线专注于生产老款 iPhone 型号。

而富士康在卡纳塔克邦班加罗尔投资 26 亿美元建设的新工厂,也将在数日内启动首条生产线。

据悉,该工厂每小时可生产 300 至 500 台 iPhone,首批产品包括 iPhone 16 和 16e 型号。消息人士透露,该富士康工厂预计在 2027 年 12 月全面建成,届时将创造约 5 万个就业机会。(来源:IT 之家)

 

消息称宁德时代拟下月在港上市,或成四年来最大规模新股发行

4 月 30 日消息,据路透社援引两位知情人士消息称,电池制造巨头宁德时代计划于下月启动在香港的上市程序,预计将成为该市四年来规模最大的股票发行。

消息人士称,此次交易的建簿过程——即邀请投资者对股权发行进行投标的过程,预计将于 5 月 12 日起始的一周开始。此前另有知情人士透露,此次发行可能筹集至少 50 亿美元(IT 之家注:现汇率约合 363.71 亿元人民币)。

宁德时代未立即回应置评请求。

其中一位消息人士补充说,宁德时代建簿的规模和时间可能会发生变化。

报道称,宁德时代此次登陆港股将成为近 4 年香港规模最大的一次上市。2021 年,快手通过首次公开募股筹集了 62 亿美元(现汇率约合 451 亿元人民币)。

宁德时代此前在一份监管文件中表示,筹集的部分资金将用于在匈牙利建设一座价值 73 亿欧元(现汇率约合 604.72 亿元人民币)的电池工厂。(来源:IT 之家)

 

饿了么宣布超百亿补贴加入外卖战局

外卖战场的热度再度加码。4 月 30 日,饿了么宣布进一步加大平台补贴力度,即日起开启平台「饿补超百亿」大促。针对补贴,饿了么表示不打竞争口水仗,「只发真福利」。目前,饿了么 App 已上线「超百亿」口令词入口。(来源:富途牛牛)

 

英伟达新工具开放使用,可根据 3D 场景创建 AI 图像,配置要求 RTX 4080

4 月 30 日消息,英伟达推出了一款新工具,允许开发者首先在 3D 中创建图像,然后生成 AI 图像。

这个工具名为 Nvidia AI Blueprint for 3D-guided generative AI,4 月 30 日起即可下载,适用于配备 RTX 4080 GPU 或更高型号的计算机,它通过将 Blender 的 3D 建模软件与 Black Forest Lab 的 FLUX.1 图像生成器连接起来工作。

用户可以使用 Blender 中的 3D 对象(如建筑物、植物、动物和车辆)绘制场景,然后将其用作创建 2D 图像的参考。用户可以手动调整观看位置或某些对象应放置的位置,与仅使用文本描述相比,这种方法在生成 2D 图像时可以提供更多细节控制。

例如,如果你脑海中有一个非常具体的城市图像——建筑物的形状和高度,显示的树木或汽车数量,甚至你观看的角度,此时就可以使用该工具在 Blender 中手动创建一个大概的样子。(来源:IT 之家)

消息称 Meta 第三代雷朋联名智能眼镜将于 10 月发售,配单色显示屏及手环控制器

据彭博社报道,Meta 旗下第三代 Ray-Ban 雷朋联名智能眼镜将于今年 10 月发售,目前 Meta 已安排部分员工在周末加班,加班加点研发这款设备。

该眼镜相比前两代最大的特色就是配备了一块单色(预计为绿色)显示面板,同时带有可以佩戴在手腕上的「手环」风格控制器,定价在 1000 至 1400 美元(IT 之家注:现汇率约合 7274 至 10184 元人民币)之间。

据悉,第三代雷朋联名智能眼镜将内置相机、照片、地图等应用,同时还支持快速查看来自手机应用的通知。该眼镜内置安卓系统,但无法安装第三方 App,同时眼镜的各项功能将「严重依赖手机」。 Meta「内部人士」透露,第三代雷朋联名智能眼镜拍照质量将「媲美 iPhone 13」。(来源:IT 之家)

 

荣耀手表全新系列官宣,两款新品将至

在4 月 30 日下午的荣耀 MagicBook Pro 16 2025 新品发布会上,荣耀预告了荣耀手表全新系列。

从预告海报可以看到,荣耀手表全新系列将包含两款产品,一款是硬朗风格,另一款是圆润风格。

外观方面,新品提供棕色和黑色两款配色,手表屏幕覆盖蓝宝石玻璃,表壳则采用钛合金材质,这款新品的续航时间据称可以达到 15 天。

功能上,新品支持自由潜水等 100 多种运动模式,支持快速健康扫描、健康早晨报告以及全天健康追踪等。(来源:IT 之家)

纽约地铁探索引入 AI 技术:提前预警异常行为,预防犯罪发生

美国纽约大都会运输署(MTA)表示,其正在探索使用人工智能系统对该市地铁站台上的犯罪和危险行为进行「预测性预防」。

MTA 首席安全官迈克尔・肯珀(Michael Kemper)表示,该机构正在「研究并试点使用人工智能等技术,以感知地铁站台上可能出现的麻烦或不当行为」。他在周一的 MTA 安全委员会会议上解释说:「如果有人行为异常、失去理智,这可能会触发警报,从而促使安保人员或警方采取行动。」他强调,警方可能会「在事情发生前」就做出反应。

肯珀补充道:「人工智能是未来。」他提到,MTA 目前正在与科技公司合作,研究「什么样的技术可以在地铁系统中发挥作用」。不过,他并未透露 MTA 正在与哪些公司合作,人工智能将如何实施,以及人工智能摄像头将被期望检测到的具体行为类型。(来源:IT 之家)

浏览量: 0

发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕

2025 年已经过去 1/3,如果用关键词来概括 AI 领域的发展你会想到什么?这是我想到的:开源、创新加速加速加速。

2 月是「DeepSeek」的,R1 以所有人意想不到的方式,让全球执牛耳的 AI 开发者、创业者、投资人把目光锁定在「DeepSeek」「中国」「开源」上。

4 月是「开源模型」的,发令枪是 Meta 喊的。被 DeepSeek 盖过风头后,2025 年 2 月 19 日,坐不住的 Meta 率先官宣——首个生成式 AI 开发者大会 LlamaCon 将于当地 4 月 29 日(北京时间 4 月 30 日)举行,颇有重新夺回「AI 开源界老大」江湖地位的意欲。

但 AI 领域的产品发布节奏就是很微妙,什么时候发布似乎取决于对手的动作,作为一种心照不宣的默契,Meta 一声枪响让 4 月底成为开源模型的主场。

整个 4 月甚至更早,AI 开发者们都在各大社交平台「蹲」开源领域「三大头牌」的新发布:DeepSeek-R2、Qwen3 以及 Llama4。Llama4 由于本月初的发布低于预期,似乎少了一些热度。

目前看起来,4 月底最受关注的还是中国队,R2 呼之欲出,Qwen3 终于来了。

4 月 29 日凌晨 5 点,阿里巴巴开源新一代通义千问模型 Qwen3,参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。X 平台的开发者网友甚至把今天定义为「Happy Qwen3 Day」,不仅因为 Qwen3 全面超越 R1,更因为 Qwen3 家族的多尺寸、内置 MCP 支持、支持混合推理等实用性的功能点。

官方技术报告进一步给出了 Qwen3 的几大亮点:

  • 「探索智能上限」再突破:通过扩大预训练和强化学习的规模,实现了更高层次的智能;

  • 国内首个「混合推理模型」:无缝集成了思考模式与非思考模式,为用户提供了灵活控制思考预算的能力;

  • 增强了 Agent 能力:正从专注于训练模型的时代过渡到以训练 Agent 为中心的时代。

对于 Qwen3,个人用户现在就可以在「通义」APP 或 chat.qwen.ai 网页直接体验,夸克也即将全线接入 Qwen3。开发者和企业则可以免费在魔搭社区、HuggingFace 等平台下载模型并商用,或通过阿里云百炼调用 Qwen3 的 API 服务。

憋了这么久的 Qwen3 到底怎么样?又代表哪些模型发展的趋势?

 

01 Qwen3,登顶全球最强开源模型

Qwen3 包含 2 个 MoE 和 6 个密集模型,阿里云开源了两个 MoE 模型的权重,六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。

其中,旗舰型号 Qwen3-235B-A22B 参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。

此外,据阿里云官方介绍,Qwen3 是国内首个「混合推理模型」。「快思考」与「慢思考」集成进同一个模型,对简单需求可低算力「秒回」答案,对复杂问题可多步骤「深度思考」,大大节省算力消耗。

Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,创下所有国产模型及全球开源模型的性能新高:在奥数水平的 AIME25 测评中,Qwen3 斩获 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,Qwen3 突破 70 分大关,表现甚至超过 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。

性能大幅提升的同时,Qwen3 的部署成本还大幅下降,仅需 4 张 H20 即可部署千问 3 满血版,显存占用仅为性能相近模型的三分之一。

Qwen3 性能|图片来源:阿里云

此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

据介绍,Qwen3-235B-A22B 是一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型;Qwen3-30B-A3B 则是一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

得益于在预训练、大规模强化学习和推理模式整合方面取得的显著进展,Qwen3 主打「思考更深、行动更快」,更好地构建 AI 应用。Qwen3 预训练数据量达 36T,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。

值得注意的是,这次 Qwen3 的发布,主打混合推理,但是需要思考的长度最短也是 1024tokens,否则如果问题所需要的推理预算用不满 1024tokens,根本感受不到可以调节精度的混合推理模型的好。也就无法发挥用 Qwen3 不同程度的思考,灵活满足 AI 应用和不同场景对性能和成本的多样需求。

截图来源:X

 

02 大模型全面转向「混合推理模型」和「Agent」

在 Qwen3 发布的前一天,X 平台已有「行业人士」——日本的大模型厂商 SakanaAI 的一位工程师敏锐地捕捉到了 Qwen3 的重点。当天,在 AI 领域最重要的学术会议之一 ICLR 2025 的一个工作坊上,阿里云通义实验室通义千问负责人林俊旸透露了 Qwen 的下一步方向:推理模型和非推理模型的统一,以及面向 agent 的大模型。

这正是今天发布的 Qwen3 最大的两个特点,同时也是大模型厂商们正在集体发生的转向。

2025 年 2 月 25 日,Anthropic 发布了最新的旗舰模型 Claude 3.7 Sonnet,同时也称作是市场上首个混合推理模型。这意味着 Claude 3.7 Sonnet 能够生成即时的响应(快思考),也可以进行延展的、逐步的思考(慢思考)。API 用户还可以细粒度地控制模型的思考时长;当给定更长的思考时间,理论上会有更高质量的答案。

Anthropic 表示,混合推理模型的架构代表下一代前沿模型,可以让模型像人类用同一个大脑一样,既能快速反应又能深度思考,这既能为用户创造更无缝的体验,也能让用户通过 API 使用 Claude 3.7 Sonnet 时,可以控制思考的预算。比如:可以告诉 Claude 最多思考 N 个 token,N 的取值可以达到其输出限制的 128K token,从而在回答质量与速度(及成本)之间进行权衡。

「混合推理架构」也得到了 OpenAI 的青睐。Sam Altman 在更早的时间看到,当前的模型和产品供应已经变得非常复杂,希望 AI 能「开箱即用」、简化产品供应,「我们和你一样讨厌模型选择器,想要回归神奇的统一智能,之后,我们的一个重要目标是通过创建能够使用我们所有工具、知道何时需要长时间思考或不需要的系统,统一 o 系列模型和 GPT 系列模型,整体上能广泛适用于各种任务。」

就像在 DeepSeek-R1 里一样,点选「深度思考」背后调用的是推理模型 R1 做的长推理,不选则调用的是基座模型 V3 即时生成的答案。现在,模型厂商把「思考的颗粒度」这个选择权更灵活、广泛地交给用户来控制推理预算。

在 Qwen3 中,可以滑动「思考预算」的按钮,来控制思考的最大长度,从而匹配合适的推理质量和成本。

在思考模式下,Qwen3 模型会逐步推理,经过深思熟虑后给出最终答案,适合需要深入思考的复杂问题。在非思考模式下,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行「思考」的程度。这两种模式的结合大大增强了模型实现稳定且高效的「思考预算」控制能力,在成本效益和推理质量之间实现更优的平衡。

另一个模型厂商的转向则是 Agent。随着 Manus 验证了 Claude 3.5 Sonnet 达到了通用 agent 的一些能力,加上模型调用工具、实现 agent 能力的统一协议——MCP 在越来越大的范围内被拥抱,下一代模型要面向 agent、面向实际场景来优化。

就 Qwen3 来说,正在迈向以训练 Agent 为中心的阶段,当前 Qwen3 优化了 Agent 和 代码能力,同时也加强了对 MCP 的支持。据称,Qwen3 原生支持 MCP 协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的 Qwen-Agent 框架,将大大降低编码复杂性,实现高效的手机及电脑 Agent 操作等任务。

在该示例中,Qwen3 思考并自主调用工具到 Github 数开源模型获得的 star,继续思考并调用绘图工具制作图片,并调用工具保存。|视频来源:阿里云

 

03 开源模型新一轮竞赛开启

Qwen3 的发布,意味着开源模型领域新一轮「三国杀」已然开始。

事实上,随着 DeepSeek 的横空出世,加上 OpenAI、字节等大厂调整对开源的态度,开源已然成为大模型赛道的大势所趋。而 Llama、Qwen 和 DeepSeek,正是目前开源领域最有竞争力的玩家。

Hugging Face 联合创始人、CEO Clement Delangue 发推暗示 DeepSeek 即将带来新发布。|截图来源:X

而此前 OpenAI 和 DeepSeek 的成功已经证明,互联网时代的生态、用户和产品壁垒,今天在 AI 时代并没有互联网时代那样牢不可摧,模型能力才是基础大模型公司的核心竞争力。而 Llama、Qwen 和 DeepSeek 的胜者,有可能在下一个发布周期到来前(至少在 OpenAI 的开源模型发布前),成为整个 AI 行业的引领者。

虽然新一代模型能力的强弱,还要等待 Llama 和 DeepSeek 的发布,但值得关注的是,这三家开源模型厂商的生态策略亦有差异,这点从模型的侧重点就能看出端倪。

DeepSeek 和 Meta 的侧重点也有不同,但一个共同点都是不太重视 ToB,至少是在服务生态的建设上并不成功。而这点也是 Qwen 和其背后的阿里云最重视的部分。

极客公园曾在此前的文章里写过,脱胎于阿里云 Qwen,是最有以开源模型技术领先性、广泛全面开源的策略,追求生态建设的架势。阿里的 AI 战略里除了追求 AGI,也同样重视 AI 基础设施建设,以及更上层的与阿里的电商、钉钉、夸克等 AI 应用的结合。

此前,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,「阿里云是全世界唯一一家积极研发基础大模型并全方位开源、全方位贡献的云计算厂商。」

而 Qwen 模型下载量和衍生模型数量这两个衡量的生态的指标也同样领先。根据阿里云官方的最新数据,阿里通义已开源 200 余个模型,全球下载量超 3 亿次,千问衍生模型数超 10 万个,已经超越 Llama 位居全球开源模型的第一。

而新模型选择在进一步优化推理成本、混合推理和 Agent 上发力,显然 Qwen 瞄准的是开发者和 B 端用户的部署需求。这也将成为 Qwen 与 DeepSeek、Llama、OpenAI 等竞争对手最大的不同,也是阿里能否赢得 AI 时代的一张船票的关键所在。

 

浏览量: 0

文章分页

上一页 1 … 3 4 5 … 126 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间