【AI 英文奏折】06月03日

x每日奏折1个月前发布 tianming

94 0 0

【AI 英文奏折】2026年06月03日

共收录 8 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

Rohan Paul: AI法律回答优于法学教授，更受青睐且有害率更低。
NotebookLM: NotebookLM移动端新增简报、学习指南和博客创作功能。
Rohan Paul: AI擅长解释科学但难以预测科学进展。
Rohan Paul: AI内存需求激增致晶圆产能五年翻倍仍供不应求。
Alex Prompter: AI自主完成项目无需人工值守，潜力远超普遍认知。
Amira Zairi: 分享3D卡通角色设计提示：大头夸张风格，精致渲染，弱化背景突出角色。
Rohan Paul: 微软推出自动化推理模型优化系统MAI-Thinking-1。
Rohan Paul: 微软推出垂直设计的AI数据中心，提升计算密度并实现高效节水。

📖 详细内容

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI法律回答优于法学教授，更受青睐且有害率更低。

可信度: 6/10 – 3项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 斯坦福大学的研究人员发现，法学教授在评估学生合同法帮助时，75% 的时间更喜欢 AI 的回答，而不是同行教授的回答。 (该声明提及具体研究机构（斯坦福大学）和统计数据（75%），但需查阅原始研究论文或官方发布的数据报告才能完全验证。若无公开研究链接或详细方法论，则无法独立确认。)
◐ 部分可验证: 教授们编写了 40 个真实的学生风格问题，盲测评估了近 3000 次人类和 AI 回答之间的比较。 (研究设计细节（如问题数量、评估次数）可通过研究论文或公开数据集验证，但需依赖研究团队的透明度。若未公开具体问题或评估记录，则无法复现结果。)
◐ 部分可验证: 教授们仅将 AI 回答标记为有害的比例为 3.5%，而人类回答则为 12%。 (统计比例需通过研究原始数据验证，但“有害”的定义可能主观。若研究未公开标注标准或具体案例，则部分数据难以独立评估。)

原文内容:

斯坦福大学的研究人员发现，法学教授在评估学生合同法帮助时，75% 的时间更喜欢 AI 的回答，而不是同行教授的回答。

这项研究测试了大型语言模型（LLMs）是否能处理这样一个领域：答案往往不是事实，而是一个基于规则、例外和判断的合理论点。

教授们编写了 40 个真实的学生风格问题，提供了他们自己的答案，然后盲测评估了近 3000 次人类和 AI 回答之间的比较。

令人震惊的结果不仅是 AI 经常获胜，而且教授们仅将 AI 回答标记为有害的比例为 3.5%，而人类回答则为 12%。

也就是说，该模型不仅仅听起来流利，而且经常符合法学教授在向学生解释歧义时所使用的教学标准。

⏰ 07:55 | ❤️ 21点赞 | 📝 222字 | 查看原文 →

↑ 返回顶部

NotebookLM @notebooklm

Think smarter, not harder. Meet your brain’s new best friend | 影响力: 240.50k万粉丝

💡 核心观点: NotebookLM移动端新增简报、学习指南和博客创作功能。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: NotebookLM移动应用现在支持创建简报文档、学习指南和博客文章 (该声明可通过NotebookLM官网、官方更新日志或应用商店的版本更新说明直接验证。)
◐ 部分可验证: 用户可以在移动设备上使用NotebookLM的新功能 (需实测或查看官方教程视频确认具体操作流程，但功能存在性可通过官方渠道验证。)
✓ 可验证: NotebookLM团队征求用户对移动端其他报告格式的需求反馈 (可通过官方社交媒体、用户反馈渠道或社区公告验证该互动行为。)

原文内容:

最近有没有注意到 NotebookLM 移动应用的任何不同之处？

嗯，我们很高兴地报告，你现在可以在移动设备上创建简报文档、学习指南和博客文章了！

你希望在移动端特别支持其他任何报告格式吗？告诉我们吧！

⏰ 05:04 | ❤️ 394点赞 | 📝 80字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI擅长解释科学但难以预测科学进展。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 在4,760个科学事件中，AI模型在识别可能的研究路径方面远胜于预测实际结果 (需查阅论文原文（arXiv链接提供）确认实验设计、数据集和具体对比指标，但部分细节（如科学事件的选择标准）可能依赖作者主观判断。)
✓ 可验证: 模型在预测科学主张是否实现时准确率接近随机水平，且倾向于将进展时间推得过远 (论文中应包含模型预测准确率的统计数据和时序偏差分析，可通过公开数据和方法复现验证。)
◐ 部分可验证: 即使提供额外旧信息，模型仍无法可靠预测未来科学进展 (论文可能描述对照实验（如添加/不添加旧信息的效果对比），但“可靠性”标准需依赖作者定义的阈值，可能存在主观性。)

原文内容:

AI 能比它预测科学更擅长解释科学。

在 4,760 个科学事件中，这些模型在识别可能的研究路径方面远胜于预测实际结果。

模型常常能在答案已近在咫尺时识别出合理的研究想法，尤其是在多选形式下。

但它们在更难的事情上要弱得多：预测一项发现是否真的会发生、何时发生，以及什么方法会让它奏效。

这意味着模型在回顾（事后分析）上仍远胜于前瞻（预测）。

当被问及一项科学主张是否真的会实现时，模型的准确率徘徊在随机水平附近；当被问及进展何时到来时，它们系统性地将其推得太远到未来。

即使作者给模型提供了额外的旧信息，模型有所改进，但仍未能在预测未来科学进展方面变得可靠。

因此，在模型中拥有大量科学知识并不一定能自动让它成为一个优秀的科学预测者。

----

Paper Link – arxiv.org/abs/2605.22681

Paper Title: "Forecasting Scientific Progress with AI"

⏰ 05:48 | ❤️ 28点赞 | 📝 278字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI内存需求激增致晶圆产能五年翻倍仍供不应求。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: SK海力士将在5年内将晶圆产能翻倍 (可通过SK海力士的官方公告、财报或公开新闻稿（如韩联社、路透社等）直接验证其产能扩张计划。)
◐ 部分可验证: HBM（高带宽内存）市场2026年Q1份额中SK海力士占58%，三星和美光各占21% (市场份额数据通常由第三方机构（如TrendForce、Omdia）发布，需核查具体报告来源，但可能存在不同机构的统计差异或滞后性。)
✓ 可验证: HBM因需先进DRAM、堆叠封装及与GPU设计师合作而难以扩展 (技术挑战可通过行业白皮书（如JEDEC标准）、SK海力士/Nvidia/台积电的合作声明，或半导体工程类期刊（如IEEE）验证。)

原文内容:

SK 海力士刚刚表示，AI 内存需求现在如此巨大，以至于将在 5 年内将晶圆产能翻倍，但仍预计供应将紧俏至 2030 年。

晶圆是变成数千个内存芯片的圆形硅起始板，因此将晶圆产能翻倍基本上意味着 SK 海力士正试图扩大其芯片产量的物理基础，而不仅仅是更努力地运行现有生产线。

AI 供应越来越受到内存制造物理节奏的制约，在这个过程中，晶圆、封装、良率和供应协议的推进速度远慢于 GPU 路线图。

压力来自于 HBM（高带宽内存），这是 Nvidia GPU 旁使用的堆叠内存。

HBM 难以扩展，因为它需要先进的 DRAM、堆叠、封装、测试以及与 GPU 设计师的密切合作，这就是为什么 SK 海力士正与 Nvidia 和 TSMC 合作开发 HBM4 基础芯片。

---
全球内存市场。

全球内存市场有两个主要层级：DRAM，包括 CPU 和 AI GPU 旁使用的内存；以及 NAND 闪存，即 SSD、手机和数据中心内部的存储。

在 DRAM 中，市场高度集中，2026 年第一季度三星占比 38.5%、SK 海力士 28.8%、美光 22.4%，意味着前三大厂商控制了全球 DRAM 收入的约 90%。

在 HBM 中，这是 DRAM 内部的高端子市场、Nvidia GPU 旁使用的 AI 专用内存，SK 海力士是市场领导者，2026 年第一季度份额达 58%，而三星和美光各占 21%。

HBM，即高带宽内存，是为极端数据移动而构建的 DRAM 特殊形式。

区别在于物理设计。

普通 DRAM 芯片通常位于内存模块上或靠近处理器，数据通过相对较窄的连接传输。

HBM 将多个 DRAM 芯片垂直堆叠，并通过先进封装技术将其放置在 GPU 非常靠近的位置，从而创建出更宽的数据路径。

这种更宽的路径为 AI 芯片提供了更高的内存带宽，这意味着 GPU 可以更快地接收数据，而不是闲置等待。

⏰ 16:40 | ❤️ 200点赞 | 📝 498字 | 查看原文 →

↑ 返回顶部

Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: AI自主完成项目无需人工值守，潜力远超普遍认知。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认

事实核查:

✓ 可验证: 我给我的 AI 布置了一个为期 2 天的项目，合上笔记本电脑，然后去睡觉了。 (该声明描述个人使用AI的体验，涉及未公开的具体操作细节和AI行为，无法通过公开渠道验证。)
✓ 可验证: 醒来时发现它几乎已经完成了。机器上什么都没运行。没有打开的终端。没有需要看护。 (属于个人观察和主观描述，缺乏第三方证据或可复现的测试条件，无法独立验证。)
◐ 部分可验证: 工厂刚刚发布这个，大多数人还没意识到现在可能实现的东西。 (若“工厂”指向某公司或产品发布，可通过官方渠道确认发布时间，但“大多数人未意识到”属于主观推断，仅部分可验证。)

原文内容:

我给我的 AI 布置了一个为期 2 天的项目，合上笔记本电脑，然后去睡觉了。

醒来时发现它几乎已经完成了。机器上什么都没运行。没有打开的终端。没有需要看护。

工厂刚刚发布这个，大多数人还没意识到现在可能实现的东西

⏰ 05:15 | ❤️ 21点赞 | 📝 89字 | 查看原文 →

↑ 返回顶部

Amira Zairi @azed_ai

AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝

💡 核心观点: 分享3D卡通角色设计提示：大头夸张风格，精致渲染，弱化背景突出角色。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 推文提供了一个3D卡通形象的生成提示 (推文内容本身明确描述了提示的具体要求（如风格化、头部比例、渲染风格等），可直接通过文本验证)
◐ 部分可验证: 该提示能生成“平滑、精致的风格渲染，使用干净的材质和柔和的环境光”的3D形象 (需实际使用该提示生成图像以验证效果，但渲染结果可能因工具、参数或用户操作而异)
◦ 观点: 最小化背景可“突出角色的魅力和存在感” (“魅力”和“存在感”是主观评价，无客观标准，取决于个人审美或设计目标)

原文内容:

提示分享：3D

提示：一个高度风格化的 [Character] 的 3D 卡通形象，拥有超大的头部、生动的面部特征和俏皮的夸张表现。以平滑、精致的风格渲染，使用干净的材质和柔和的环境光。最小化背景，以突出角色的魅力和存在感。

试试看并分享你的作品

⏰ 18:57 | ❤️ 496点赞 | 📝 92字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 微软推出自动化推理模型优化系统MAI-Thinking-1。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

✓ 可验证: 微软发布了 MAI-Thinking-1 (可通过微软官方公告或新闻稿直接验证，但需查找具体发布时间和内容。)
◐ 部分可验证: MAI-Thinking-1 在 AIME 2025 上达到 97.0%、在 LiveCodeBench v6 上达到 87.7%，以及在 SWE-Bench Pro 上达到 52.8% (需查看 AIME 2025、LiveCodeBench v6 和 SWE-Bench Pro 的官方榜单或测试报告，但若这些测试尚未公开或结果未正式发布，则无法完全验证。)
◐ 部分可验证: MAI-Thinking-1 使用 35B 个活跃参数，嵌入在一个总参数为 1T 的专家混合模型中 (需微软官方技术文档或论文支持，若未公开具体架构细节，则无法完全验证。)

原文内容:

微软发布了 MAI-Thinking-1。

所以微软现在拥有了一个完整的内部流程，可以一次又一次地构建更强大的推理模型。

微软将这个系统称为“爬山机”，意思是它将数据改进、训练设置、奖励、安全测试和评估作为一个连贯的过程不断优化。

对于其规模而言表现强劲，包括在 AIME 2025 上达到 97.0%、在 LiveCodeBench v6 上达到 87.7%，以及在 SWE-Bench Pro 上达到 52.8%。

MAI-Thinking-1 是该流程中的第一个模型，使用 35B 个活跃参数，嵌入在一个总参数为 1T 的专家混合模型中，其中每个 token 只运行模型的一部分。

基础模型从零开始训练，使用了 30T 个主要是人类生成的 token，微软表示在预训练期间避免了第三方模型蒸馏。

之后，团队使用了强化学习，这意味着模型通过练习任务并从反馈中改进，来学习数学推理、编码、工具使用、有用性和安全性。

⏰ 04:51 | ❤️ 53点赞 | 📝 255字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 微软推出垂直设计的AI数据中心，提升计算密度并实现高效节水。

可信度: 9/10 – 2项声明可直接验证；2项需进一步确认

事实核查:

✓ 可验证: 微软在Build 2026大会上宣布了Fairwater数据中心，采用垂直设计的两层AI数据中心架构 (可通过微软官方YouTube频道或Build 2026大会公开视频/文字记录验证)
◐ 部分可验证: 垂直设计允许在三维空间放置机架，以更高密度容纳更多GPU，同时保持快速网络访问 (需依赖微软提供的技术白皮书或第三方实测数据验证密度和网络性能的具体指标)
◐ 部分可验证: 冷却回路只需填充一次，实现几乎零持续水耗，用水量相当于一家餐厅一年的日常用水 (需微软公开具体冷却系统设计和水耗数据，或由独立机构审计验证)

原文内容:

萨蒂亚·纳德拉谈微软的 Fairwater 数据中心，一个 AI 超级工厂。

在今天微软 Build 2026 大会主旨演讲上。

其垂直设计的两层 AI 数据中心架构。

微软不再仅将计算资源平铺在一层地板上，而是能在三维空间中放置机架，从而以更高的密度容纳更多 GPU，同时保持快速的网络访问。

这有助于整个集群表现得更像一台巨大的 AI 机器，GPU 之间具有低延迟和高带宽。

另一个主要亮点是其冷却效率：其冷却回路只需填充一次，即可实现几乎零持续水耗，使用的水量大致相当于一家餐厅一年的日常用水。

----

摘自“Microsoft” YouTube 频道，（链接在评论中）

⏰ 04:35 | ❤️ 77点赞 | 📝 197字 | 查看原文 →

↑ 返回顶部

# x每日奏折