【AI 英文奏折】05月31日

x每日奏折1个月前发布 tianming

153 0 0

【AI 英文奏折】2026年05月31日

共收录 12 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

Rimsha Bhardwaj: 两兄弟优化AI训练算法，推动全球开源模型高效运行。
Rohan Paul: 美国制裁倒逼中国半导体技术自主突破。
Rohan Paul: 日本银行获OpenAI和Anthropic新模型权限以提升网络安全。
Rohan Paul: AI代理使用量激增但成本压力凸显。
Amira Zairi: 极简儿童画风搭配发光轮廓和奇幻漂浮元素。
Alex Prompter: AI芯片供应商通过投资客户形成资金循环以锁定需求。
Rohan Paul: 小模型高效完成工具调用，性能优于大模型。
Rohan Paul: 软银将投750亿欧元在法国建欧洲最大核能AI计算设施。
Rohan Paul: 日本AI数据中心转向液体冷却以应对GPU高热问题。
Bearly AI: Waymo推出低成本高性能专用自动驾驶电动车Ojai。
Pierrick Chevallier | IA: 创作者周末坚持输出作品并询问粉丝的创作计划。
AshutoshShrivastava: 世界模型降低机器人训练成本，提升模拟测试效率。

📖 详细内容

Rimsha Bhardwaj @heyrimsha

Helping you master AI daily with step by step AI guides, & practical tools • AI Educator & Writer • DM for Collab | 影响力: 23.09k万粉丝

💡 核心观点: 两兄弟优化AI训练算法，推动全球开源模型高效运行。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

◐ 部分可验证: Daniel和Michael Han重写了PyTorch的反向传播算法，其代码被Canva、NASA及主要开源AI模型使用 (可通过Unsloth官网或GitHub仓库（如公开）查看其技术文档及合作案例，但NASA等机构的具体使用情况需官方声明进一步确认。)
◐ 部分可验证: Daniel在NVIDIA工作时将TSNE算法速度提升2000倍，并创建被NASA和微软使用的Hyperlearn库 (Hyperlearn库若为开源项目可查证，但TSNE加速和NASA/微软的使用需依赖第三方报道或机构公开记录。)
✓ 可验证: Unsloth使LLM微调速度提升2-5倍，GPU内存减少50-70%，且无准确度损失 (可通过Unsloth发布的基准测试报告或开源代码复现结果，但需独立第三方验证其普适性。)

原文内容:

来自悉尼的两个兄弟研究了地球上每个AI实验室训练语言模型的方式，认定底层的数学计算过于浪费，于是亲手重写了PyTorch的反向传播算法。他们的代码如今驱动着Canva、NASA以及地球上大多数主要开源AI模型工作流程的微调任务。

他们的名字是Daniel和Michael Han。公司名叫Unsloth。

这是一个故事，因为开源AI世界之外几乎没人听说过它。

Daniel在悉尼长大，就读于澳大利亚新南威尔士大学。他有个习惯，在业余时间建造各种奇奇怪怪的东西。一个预测自杀风险的机器学习系统。一个自动化澳大利亚难民申请的CRM。可视化悉尼空气质量与流感爆发的相关性分析。所有这些都还列在他的LinkedIn上。

他后来去了NVIDIA工作，在那里他将TSNE算法的速度提升了2000倍，并构建了一个名为Hyperlearn的开源库，最终被NASA和微软的工程师们使用。他还发现了并修复了Gemma、Llama、Mistral和Phi等开源LLM中的20多个bug。

他的兄弟Michael则学习了设计和产品工程。兄弟俩一起在悉尼开始从事AI训练优化工作。

2023年12月，他们发布了Unsloth。

核心理念是那种第一次听到会觉得疯狂的东西。每个现代AI框架——PyTorch、TensorFlow、JAX——都使用自动微分来计算训练过程中的梯度。框架会为你搞定数学计算。这很方便。但它也耗内存且速度慢，因为底层那些通用内核并没有针对LLM微调实际需要的特定操作进行优化。

Daniel亲手为每个Transformer操作推导了反向传播。矩阵微积分。一层一层。注意力机制。RoPE。SwiGLU。MLP。每个梯度都手动写出。

然后，他和Michael用Triton（OpenAI用于低级GPU代码的语言）将这些推导重写为自定义GPU内核。数学计算与标准PyTorch完全相同。执行方式则不同。没有自动微分的开销。没有浪费的中介张量。每个操作都融合并针对LLM训练的实际需求进行了调优。

结果是微调速度提升2到5倍，GPU内存消耗减少50到70%，准确度零损失。你现在可以用不到4GB的VRAM训练一个40亿参数的模型。一个140亿参数的模型能在价值400美元的消费级显卡上运行。

开源AI社区立刻注意到了。Llama。Qwen。DeepSeek。Mistral。每个主要开源模型的微调工作流程都开始运行在Unsloth上。Hugging Face与他们合作。NVIDIA与他们合作。PyTorch与他们合作。Intel、IBM、AMD紧随其后。

到2026年初，Unsloth的月下载量超过1000万，GitHub星标达到4万。Canva和NASA正在其上运行微调工作负载。

2024年9月，他们入选Y Combinator S24并搬到旧金山。Daniel在网上发帖谈论Waymo和AI广告，称SF的人是他遇过的最棒的。他们保持了库的开源状态。他们继续发布新版本。那年晚些时候，他们发布了自定义MoE Triton内核，使专家混合训练速度提升高达12倍，VRAM消耗减少超过35%。

让Unsloth故事显得奇怪的是，其影响力规模相对于团队而言太过巨大。两个兄弟。悉尼公寓变身旧金山YC办公室。整个库运行在其中一人亲手推导的数学计算上。

Daniel仍然亲自回复GitHub问题。他仍然在X上发布发行说明。他仍然免费讲授自己内核的技术讲座。

两个兄弟证明了，整个行业花费数百万美元来扩展的AI训练栈，大部分计算资源都在浪费。

他们修复了它。

⏰ 19:16 | ❤️ 179点赞 | 📝 920字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 美国制裁倒逼中国半导体技术自主突破。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 华为董事长徐直军表示“感谢美国，让我国的半导体产业链真正成长起来” (可通过华为官方发布会视频、文字实录或权威媒体报道（如huaweicentral.com原文链接）直接验证言论真实性。)
◐ 部分可验证: 华为的Tau缩放定律将目标转向“让信号更快到达”，到2031年可能达到与1.4纳米相当的密度 (华为可能已公开Tau缩放定律的技术白皮书或专利（可部分验证），但2031年目标属于未来预测，需依赖后续技术进展验证。)
◐ 部分可验证: LogicFolding技术通过3D堆叠将冗余缓冲器减少50%以上，且无需EUV机器 (技术原理可通过华为公开资料或行业分析报告交叉验证，但具体性能数据（如50%）需实测或第三方测试报告确认。)

原文内容:

华为董事长刚刚将美国的芯片管制变成了中国半导体崛起的胜利演讲。

“我们也感谢美国，让我国的半导体产业链真正成长起来，”徐直军表示。

华为的Tau缩放定律将目标从“让晶体管变小”转向“让信号更快到达”，因为现代芯片的速度往往在长导线、时序缓冲器和布局延迟中丢失，而不是在晶体管本身内部。

华为表示，这条路径到2031年可能达到与1.4纳米相当的密度。

LogicFolding通过3D堆叠逻辑来攻击瓶颈，缩短信号传输距离，在不使用受限EUV机器的情况下增加密度，据报道将冗余缓冲器减少50%以上。

然而，这与拥有台积电式领先节点制造并不相同，因为中国在良率、功耗效率、工具和全球生产规模方面仍面临巨大差距——但这仍然是中国自主芯片设计栈发展的巨大进步。

这个故事展示了制裁如何在减缓一家公司的同时，教会它在何处变得更强大。

---

huaweicentral.com/we-are-thankful-to-us-for-enabling-our-chip-tech-growth-huawei/

⏰ 16:17 | ❤️ 79点赞 | 📝 295字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 日本银行获OpenAI和Anthropic新模型权限以提升网络安全。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 日本银行获得早期访问OpenAI最新模型的机会，用于安全测试 (可通过路透社报道链接（reuters.com）间接验证，但需进一步确认OpenAI或日本银行的官方声明以完全核实。)
✓ 可验证: OpenAI最新模型的性能与Anthropic的Claude Mythos相当 (“据信”表明该声明基于非公开或未明确的测试结果，缺乏直接可查证的性能对比数据或官方报告。)
◐ 部分可验证: 日本三大银行预计将获得Anthropic Mythos的访问权限 (“报道称”暗示信息来自间接来源，需通过Anthropic或相关银行的官方声明进一步验证。)

原文内容:

路透社：日本银行获得优先试用OpenAI最新模型的权限以进行安全测试，据悉该模型性能可匹敌竞争对手Anthropic的Claude Mythos。

另有消息称，日本三大银行有望获准使用Anthropic的Mythos模型。

采用这些新型AI预计将有效防范高级网络攻击。据透露，这两款"前沿人工智能"在漏洞识别方面的表现远超早期版本。

⏰ 16:07 | ❤️ 44点赞 | 📝 104字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI代理使用量激增但成本压力凸显。

可信度: 8/10 – 1项声明可直接验证；3项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 高盛预测到2030年AI代理的令牌使用量将增长24倍 (需查阅高盛公开报告或官方声明确认预测细节（如模型假设、数据来源），但第三方报道可能未提供完整原始数据。)
◐ 部分可验证: 优步和微软因成本问题正重新考虑AI代理的使用 (需核实企业公开声明或财报提及的AI策略调整，但“重新考虑”的具体措施可能涉及内部决策，未完全公开。)
✓ 可验证: AI代理的单次请求令牌消耗量可能比普通回答高10-50倍或更多 (缺乏公开的基准测试数据或企业案例支撑具体倍数，实际消耗因任务复杂度差异较大。)

原文内容:

高盛：“到2030年，AI代理的令牌使用量预计将增长24倍”

AI代理现在正在为AI热潮带来第一个严重的成本考验。正如本周报道的那样，优步和微软已经在重新考虑昂贵的代理使用。

一个聊天机器人可能只回答一次，但一个代理会规划、调用工具、检查结果、编辑错误，并重复这个循环。

那个循环可能让一个用户请求消耗比正常回答多10倍、50倍，甚至远超这些的令牌。

高盛的乐观情景是，到2030年，每月令牌使用量可能达到120万亿，而每个令牌的推理成本每年继续下降60%-70%。

现在的斗争在于代理生产力和令牌浪费之间。

本月早些时候，微软开始撤销开发者对Claude Code的访问权限，并计划在6月30日前将他们迁移到其内部Copilot命令行界面工具。公司将此描述为围绕自家工具整合团队，但这一时机恰逢财政年度末尾，暗示这也可能与降低成本有关。

⏰ 17:18 | ❤️ 431点赞 | 📝 285字 | 查看原文 →

↑ 返回顶部

Amira Zairi @azed_ai

AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝

💡 核心观点: 极简儿童画风搭配发光轮廓和奇幻漂浮元素。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 推文描述了一种极简儿童绘画风格，使用粗白线条和发光的轮廓 (可通过实际生成的图像或官方示例验证是否符合描述，但需依赖具体输出结果，无法仅从文本完全确认。)
◐ 部分可验证: 背景柔和模糊，带有[环境细节]，并包含漂浮元素以增添奇幻趣味 (背景和漂浮元素的可验证性取决于生成的图像是否匹配描述，但“[环境细节]”等占位符需具体填充后才能验证。)
◦ 观点: 全视角，温暖而简约的美学 (美学评价（如“温暖”“简约”）是主观判断，无客观标准验证。)

原文内容:

提示分享：发光的轮廓

提示：
以极简儿童绘画风格描绘的[主体]，使用粗白线条和发光的轮廓。背景柔和模糊，带有[环境细节]。漂浮元素如[漂浮细节]增添一丝奇幻趣味。全视角，温暖而简约的美学。

查看 ATLs 以获取灵感

⏰ 19:02 | ❤️ 248点赞 | 📝 84字 | 查看原文 →

↑ 返回顶部

Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: AI芯片供应商通过投资客户形成资金循环以锁定需求。

可信度: 8/10 – 1项声明可直接验证；3项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Anthropic 的 9650 亿美元轮融资新增了三位投资者：Micron、三星和 SK Hynix。 (Anthropic 的融资信息可通过其官网或权威财经媒体（如彭博、路透）验证，但需确认具体金额是否为 9650 亿美元（数字异常高，可能是笔误或单位错误）。)
✓ 可验证: Anthropic 二月份的融资包括来自 Nvidia 和微软的 150 亿美元，与承诺购买 300 亿美元计算资源的协议挂钩。 (该交易细节已被多家媒体报道（如《金融时报》），且微软和 Nvidia 的公开声明可佐证。)
◐ 部分可验证: Nvidia 向 OpenAI 投资高达 1000 亿美元，华尔街估算其每投资 100 亿美元可收回 350 亿美元芯片销售收益。 (Nvidia 对 OpenAI 的投资金额未公开官方数据，但芯片销售收益估算可能来自华尔街分析报告（需具体来源）。)

原文内容:

Anthropic 的 9650 亿美元轮融资新增了三位投资者：Micron、三星和 SK Hynix。这三家公司制造了地球上每块 AI 芯片内几乎所有的内存。

所以跟着它走。供应商把钱投进 Anthropic。Anthropic 把这些钱花在它们的芯片上。这笔支出被记为需求。需求证明了估值。估值吸引了下一轮融资。

钱在兜圈子。而且这个循环是整个行业，而不是一家公司。

这已经在二月份发生过了。那个月 Anthropic 的融资包括来自 Nvidia 和微软的 150 亿美元，与一项协议挂钩，该协议承诺 Anthropic 从微软购买大约 300 亿美元的计算资源。投资和采购订单是同一张纸。

OpenAI 运行着更大的版本。Nvidia 向这家公司投资高达 1000 亿美元。华尔街的一项估算：Nvidia 每投资 100 亿美元，就能从芯片销售和租赁中收回大约 350 亿美元。投资者也是供应商，而供应商占了上风。

现在内存制造商也想玩同样的把戏。Micron、三星和 SK Hynix 从未同时坐在一家私营公司的股东名单上。他们不是来拿股息的。他们是来锁定客户和路线图的，在别人之前。

这就是为什么一篇报道称这份股东名单是一份产业政策文件，而不是风险交易。资本是真实的。它制造的需求也是真实的。

这个循环悄然解决了一个问题。一家亏损的公司很难证明人们愿意以合理的价格购买其产品。

但如果你的供应商资助你购买他们的商品，你就会获得看起来完全像需求的收入图表。这个图表会送到投资者那里。投资者会给你估值加码。

华尔街对上市公司发生这种情况有一个简单的词。循环交易。这是互联网泡沫破裂的标志，当时电信公司资助自己的客户购买自己的设备，直到客户无力支付，整个链条同时崩盘。

这一切都不违法。每个人都能看到这些交易。这不是重点。重点是 AI 现在占今年美国股市涨幅的约 80%，而这些涨幅下的很大一部分需求是供应商自己的钱在兜圈子庆祝胜利。

考验一直很简单。剔除计算交易、芯片股权、云信用、供应商支票。剩下多少需求来自那些只是想要产品并用现金支付的人？

那个数字是存在的。它甚至可能很大。但这不是本周任何人庆祝的数字。

9650 亿美元才是。

而支撑它的很多东西从未真正离开大楼。

⏰ 22:15 | ❤️ 139点赞 | 📝 702字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 小模型高效完成工具调用，性能优于大模型。

可信度: 8/10 – 1项声明可直接验证；3项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Liquid的LFM2.5-8B-A1B模型在MacBook Pro M5 Max上比gpt-oss-20b更快完成工具调用任务（266tok/s vs 146tok/s），且内存占用更低（4.8GB vs 11GB） (需实测复现相同硬件环境下的任务，但模型性能数据（如tok/s、RAM占用）通常可通过公开基准测试工具验证，前提是模型和测试代码开源。)
◐ 部分可验证: LFM2.5-8B-A1B完成了所有7项工具调用（天气查询、货币转换等），而gpt-oss-20b仅完成3项 (任务完成情况取决于具体测试脚本和工具接口的稳定性，需查看测试日志或复现实验，但缺乏推文中的原始测试细节。)
◦ 观点: 工具调用能力主要取决于模型的控制习惯（如检查清单维护、行动时机判断），而非参数规模 (此结论基于对模型行为的推测，属于主观分析，未提供量化证据（如控制机制的具体训练数据或架构对比）。)

原文内容:

atomic[.]chat（一款在本地运行大型语言模型的桌面应用）在 MacBook Pro M5 Max（64GB 内存）上对本地 AI 代理进行了一次非常有启发性的比较。

Liquid 规模小得多的 LFM2.5-8B-A1B 击败了 gpt-oss-20b，因为它完成了所有必需的工具调用，将运行时间缩短了一半以上，并使用 4.8GB RAM 而非 11GB。

这项任务并非普通的聊天，因为模型必须通过调用外部工具来进行 3 次天气查询、2 次货币转换、1 封电子邮件和 1 个提醒，来规划一次旅行。

令人震惊的是，LFM2.5-8B-A1B 在活跃计算规模上小得多，但它以 266tok/s 的速度完成了所有必需的调用，而 gpt-oss-20b 使用了 11GB RAM，只完成了 7 个调用中的 3 个，运行速度为 146tok/s。

现在，工具调用首先是一个控制问题，然后才是语言问题。

模型必须在上下文中保持一个检查清单，决定何时停止语言生成并开始行动，并抵制以部分完成就足够的假象来回答的诱惑。

一个较小的专家混合模型，如果其训练比一个较大模型的通用流利度更锐利地塑造了这些控制习惯，即使只有一小部分参数处于活跃状态，也能获胜。

⏰ 04:31 | ❤️ 30点赞 | 📝 325字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 软银将投750亿欧元在法国建欧洲最大核能AI计算设施。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

◐ 部分可验证: 软银承诺投资750亿欧元在法国建设欧洲最大的AI计算设施 (可通过FT报道原文（链接已提供）初步验证，但需进一步查阅软银官方公告或法国政府合作文件确认具体投资金额和计划。)
◐ 部分可验证: 该设施将利用以核能为主的廉价、稳定电力支持AI系统运行 (法国核电占比高（公开数据支持），但“廉价、稳定”需对比实际电价和能源政策，且设施具体能源协议未公开。)
◐ 部分可验证: 计划分阶段建设，首期投资450亿欧元实现3.1GW容量，2031年扩展至5GW (FT报道提及具体数字，但项目周期长，需依赖软银或法国政府后续披露进展，目前无法完全验证可行性。)

原文内容:

FT：软银刚刚承诺投资750亿欧元，在法国建设欧洲最大的AI计算设施，将廉价、稳定的以核能为主的电力转化为训练和运行更大AI系统的原始燃料。

该计划首先投资450亿欧元，到2031年在奥德法国地区建设3.1GW容量，然后再增加2GW，打造一个5GW的AI综合体，其电力消耗大致相当于一座大城市的用电量。

敦刻尔克是核心地点，施耐德电气预计将帮助围绕该项目建设AI基础设施和机器人制造中心。

薄弱环节是融资，因为行业估算1GW的AI基础设施成本接近500亿美元，这意味着软银可能需要大量项目债务和外部合作伙伴。

---

ft .com/content/1022f9bd-5b6d-44a5-9303-c8b05b8c6463?syn-25a6b1a6=1

⏰ 03:48 | ❤️ 41点赞 | 📝 197字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 日本AI数据中心转向液体冷却以应对GPU高热问题。

可信度: 9/10 – 2项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: 冷却系统占用了数据中心电力消耗的30%至40% (该数据可能来源于行业报告或研究，但需具体引用来源（如国际能源署或数据中心行业白皮书）才能完全验证。不同数据中心的实际能耗比例可能存在差异。)
✓ 可验证: GPU热量在5年内翻了一番多 (可通过对比主流GPU型号（如NVIDIA或AMD）的TDP（热设计功耗）公开数据（如官方技术文档或第三方评测）验证，但需明确具体比较的时间范围和型号。)
✓ 可验证: 液体冷却系统能更快移除AI GPU热量，减少风扇工作和房间冷却需求 (可通过厂商技术文档（如富士电机、三菱重工的液体冷却方案）或第三方实验数据（如散热效率对比测试）验证其原理和效果。)

原文内容:

日本的人工智能数据中心热潮正在推动企业转向液体冷却，因为高温GPU机架如今已超出空调服务器房间的极限。

冷却系统已占用了数据中心电力消耗的30%至40%，而GPU热量在5年内翻了一番多，因此日本的富士电机、日本电产、三菱重工等公司正在追逐通过液体而非空气转移热量的系统。

普通空气冷却的弱点在于空气导热效果差，因此系统需要大量风扇动力、宽大的气流通道、冷通道、热通道以及大型冷却器来控制房间温度。

液体冷却改变了目标：它不是先试图冷却整个房间，而是直接在GPU或CPU上放置一块冷金属板。

冷液体通过该板内的微小通道流动，芯片的热量传到板上，板将热量传给液体，然后加热后的液体被泵送走。

最大的不同在于热密度：一台强大的AI机架能在如此小的空间内产生大量热量，以至于增加更多空气流动会变得嘈杂、耗电且在物理上受限。

液体可以通过更小的路径携带更多热量，因此它能更快地从AI GPU中移除热量，同时减少风扇工作、减少房间冷却，并保持芯片温度更稳定。

主要缺点是液体系统安装成本更高，需要防漏接头，并且必须在服务器机架设计之初就融入，而不是事后随意添加。

⏰ 15:40 | ❤️ 149点赞 | 📝 409字 | 查看原文 →

↑ 返回顶部

Bearly AI @bearlyai

Privacy-first AI research tool with access to ChatGPT, Grok, Claude, Gemini and DeepSeek in one app. Try it at http://Bearly.AI | 影响力: 0万粉丝

💡 核心观点: Waymo推出低成本高性能专用自动驾驶电动车Ojai。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

✓ 可验证: Waymo正在推出新型自主驾驶电动小型货车（Ojai），是与Zeekr合作专门打造的。 (可通过Waymo或Zeekr的官方公告、新闻稿或合作声明直接验证。)
◐ 部分可验证: Ojai的每辆车成本为7.5万至10万美元，比改装Jaguar I-PACE的成本（20万美元）至少减半。 (成本数据可能来自内部或行业报告，需Waymo或Zeekr官方披露具体财务细节才能完全验证。)
◐ 部分可验证: Ojai的传感器数量比Jaguar I-PACE减少42%（13个摄像头/4个激光雷达 vs. 29个摄像头/5个激光雷达），但性能更好。 (传感器数量可通过官方技术文档验证，但“性能更好”需实测数据或第三方测试报告支持。)

原文内容:

Waymo 正在推出新型自主驾驶电动小型货车（Ojai）。

当前车队每辆车改装 Jaguar I-PACE 的成本为 20 万美元。Ojai 是与中国电动车公司 Zeekr 专门打造的，每辆车的成本至少减半（7.5 万至 10 万美元），即使在关税之后也是如此。

尽管 Ojai 的传感器数量减少了 42%（13 个摄像头/4 个激光雷达），相比 Jaguar I-PACE（29 个摄像头/5 个激光雷达），Ojai 的性能更好，因为它是從零开始设计的。

与更豪华的 Jaguar 相比，Ojai 也更适合大规模制造（即：更便宜的零部件）。

Waymo 计划在年底前让 1000 辆 Ojai 上路（目前有 100 辆在洛杉矶、旧金山和凤凰城进行测试）。

***

更多来自 CNBC：

⏰ 01:32 | ❤️ 144点赞 | 📝 176字 | 查看原文 →

↑ 返回顶部

Pierrick Chevallier | IA @charaspowerai

AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝

💡 核心观点: 创作者周末坚持输出作品并询问粉丝的创作计划。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 周六放松但仍在创作一周已经结束了 (推文未提供具体创作内容或成果的公开链接，无法直接验证其真实性或完成状态。)
◐ 部分可验证: 这周混合了很多图像提示 + 15秒视频 (若推文附带了相关图像或视频链接（如社交媒体平台可见），则可部分验证；若无，则需依赖用户提供额外证据。)
✓ 可验证: 这里有一个不错的放松作品来开启这个周六 (未明确说明“放松作品”的具体形式或公开访问途径，无法独立验证其存在或内容。)

原文内容:

GM   
周六放松但仍在创作一周已经结束了……我们还在输出火爆的渲染图。  
这周混合了很多图像提示 + 15秒视频。这里有一个不错的放松作品来开启这个周六  

你是“今天继续创作”团队还是“完全休息”团队这个周末？  
在下面告诉我

⏰ 14:30 | ❤️ 28点赞 | 📝 89字 | 查看原文 →

↑ 返回顶部

AshutoshShrivastava @ai_for_success

| 影响力: 0万粉丝

💡 核心观点: 世界模型降低机器人训练成本，提升模拟测试效率。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: Genie Envisioner-Sim 2.0 在 WorldArena Track 1 排行榜上以 68.26 的 EWMScore_P 排名第一 (可通过 WorldArena 官方排行榜或 AGIBOT 官方公告直接验证排名和分数)
◐ 部分可验证: EWMScore_P 是 WorldArena 对世界模型的感知分数，衡量视觉模拟质量、物理场景理解及预测能力 (WorldArena 可能公开评分标准，但具体算法细节或权重可能未完全披露，需官方文档进一步确认)
◐ 部分可验证: GE-Sim 2.0 是闭环视频世界模拟器，能生成多视角操作视频、进行长时程推理并估计本体感受状态 (功能描述需依赖 AGIBOT 的技术白皮书或演示验证，但部分细节（如“奖励判断”机制）可能未公开)

原文内容:

机器人在现实世界中训练成本高昂。

每一次失败的部署都会消耗时间、硬件损耗、安全风险以及人工监督。这就是为什么世界模型对于具身人工智能如此重要。

@AGIBOTofficial Genie Envisioner-Sim 2.0 刚刚在 WorldArena Track 1 排行榜上以 68.26 的 EWMScore_P 排名第一。

EWMScore_P 是 WorldArena 对世界模型的感知分数。它衡量视觉模拟质量：模型对变化物理场景的理解程度、对接下来事件的预测能力，以及生成逼真、一致视频序列的质量。

让我印象深刻的是，这并不是一个针对特定基准的系统。AGIBOT 表示，GE-Sim 2.0 使用了其原生世界模型架构，仅在排行榜数据上进行了微调。

更大的理念很简单：

GE-Sim 2.0 不仅仅预测机器人接下来会看到什么，它更像是一个闭环视频世界模拟器。

它可以生成多视角的机器人操作视频，进行更长时程的推理，估计本体感受状态如关节角度和夹持器状态，并使用奖励判断来评估部署。

这意味着机器人策略可以在模拟环境中测试和改进，然后再推向物理世界。

这是人形机器人领域中未得到足够关注的部分。硬件很重要，但可靠的模拟和策略评估可能决定这些系统实际扩展的速度。

1/2

⏰ 12:03 | ❤️ 20点赞 | 📝 365字 | 查看原文 →

↑ 返回顶部

# x每日奏折