【AI 英文奏折】05月30日

x每日奏折2个月前发布 tianming

208 0 0

【AI 英文奏折】2026年05月30日

共收录 9 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

Rohan Paul: AI进步需优化系统框架而不仅是扩大模型。
Rimsha Bhardwaj: 20秒真诚拥抱通过皮肤神经快速减压，比言语更有效。
Alex Prompter: AI代理成本高，The Grid推出实时竞价市场降低价格。
Rohan Paul: AI降低认知成本，释放非常规想法的探索潜力。
Rohan Paul: AI导师让个性化一对一辅导普及且经济实惠。
Rohan Paul: Kog AI通过优化GPU内存流实现推理速度提升30倍。
Google Gemini: Gemini Spark面向美国Ultra用户开放，可高效处理数字任务。
Pierrick Chevallier | IA: 蒙面武士暴雨中瞬斩群敌，闪电与剑光交织的震撼战斗。
Pierrick Chevallier | IA: AI技术正彻底改变动画制作流程，实现高效角色与动态场景生成。

📖 详细内容

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI进步需优化系统框架而不仅是扩大模型。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 更强大的代理不仅仅来自更大的模型，还来自围绕它们的更好系统（harness） (论文链接提供了理论支持（arXiv:2605.26112），但实际系统效果需依赖具体实现和实验数据，部分需实测验证。)
✓ 可验证: 长上下文并不等于可用上下文，记忆并不等于可信记忆，拥有许多工具并不等于知道何时使用它们 (可通过现有研究（如长上下文窗口的局限性、工具调用错误案例）和论文中的实验分析验证，但需结合具体代理系统测试。)
◐ 部分可验证: 一次性基准分数感觉越来越单薄，因相同答案可能通过高风险或偶然方式达成 (基准测试的局限性在AI领域已有讨论（如arXiv论文或会议研究），但”单薄”是主观评价，具体风险案例需进一步数据支撑。)

原文内容:

更强大的代理不仅仅来自更大的模型，还来自围绕它们的更好系统。

问题是，许多 AI 代理被评估得好像只有模型单独完成了工作，尽管真实行为还取决于记忆、工具、上下文、路由、检查和权限。

围绕代理的这种设置被称为 harness，即决定模型看到什么、可以使用什么工具、记住什么以及哪些动作需要检查的系统。

进步应该来自于扩展这个 harness，特别是 3 个部分：更好的上下文控制、更可信的记忆，以及更好的工具或辅助代理路由。

长上下文并不等于可用上下文，记忆并不等于可信记忆，拥有许多工具并不等于知道何时使用它们。

一个过时的笔记可能比没有笔记更危险，因为它恰好在代理应该重新检查世界时给了它信心。

一个专用的子代理也可能悄无声息地失败，如果它的输出听起来合理但后续层没有验证其真实性。

这就是为什么一次性基准分数感觉越来越单薄。

两个代理可以得出相同的最终答案，而其中一个消耗了更多 token，进行更冒险的工具调用、携带了损坏的记忆，或者仅靠偶然成功。

下一个前沿不仅仅是扩展机器内部的思维。

而是扩展围绕它的纪律。

----

链接 – arxiv.org/abs/2605.26112

标题："从模型扩展到系统扩展：代理式 AI 中的 Harness 扩展"

⏰ 16:08 | ❤️ 90点赞 | 📝 408字 | 查看原文 →

↑ 返回顶部

Rimsha Bhardwaj @heyrimsha

Helping you master AI daily with step by step AI guides, & practical tools • AI Educator & Writer • DM for Collab | 影响力: 23.09k万粉丝

💡 核心观点: 20秒真诚拥抱通过皮肤神经快速减压，比言语更有效。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

◐ 部分可验证: 20秒的拥抱比激励性谈话、呼吸技巧或刷手机更快降低压力激素 (可通过心理学或神经科学实验研究验证，但需具体实验数据支持（如皮质醇水平测量），且效果可能因人而异。)
✓ 可验证: 皮肤中存在C-触觉传入神经，专门对缓慢、温柔的接触（如拥抱）产生反应 (Francis McGlone的研究已被多篇神经科学论文引用（如《Nature Reviews Neuroscience》），C-触觉纤维的存在及其功能可通过学术数据库验证。)
◐ 部分可验证: 催产素释放需至少20秒的持续接触才能有效抑制压力反应 (部分研究支持催产素与触觉时长的关联（如《Psychoneuroendocrinology》期刊），但具体阈值（20秒）可能需更多实验复现。)

原文内容:

一个20秒的拥抱比任何激励性谈话、呼吸技巧或刷手机所能做到的更快降低你的压力激素，而且它之所以有效，是因为你皮肤里有一条隐藏的神经，只有当有人足够长时间地拥抱你——以示真诚——时，它才会苏醒。

大多数人根本不知道这条神经的存在。

这位毕生致力于证明它存在的人是一位名叫弗朗西斯·麦克格洛恩（Francis McGlone）的英国神经科学家，而他帮助揭示的系统彻底改变了我们对触觉的认知。

你的皮肤里其实同时运行着两种完全不同的触觉系统。

第一种是显而易见的。快速神经会告诉你某物在哪里以及它压得有多重。这就是你用来感受手机、拿起笔或抓住门把手的系统。快速、精确，而且完全没有情感成分。

第二种系统才是奇怪的那个。

埋藏在你全身皮肤里的是一组缓慢神经，麦克格洛恩称之为C-触觉传入神经。在你手臂的某些区域，近40%的触觉神经都是这些。而且这里是让人震惊的部分：它们几乎对猛戳毫无反应。它们不在乎压力大小。它们不在乎精确度。它们只对一件非常具体的事情反应最强烈。

缓慢、温柔的接触，大约以一个人安慰所爱之人时手部移动的速度。

动作快一点，神经就安静下来。动作慢一点，它也保持安静。只有一个狭窄的窗口——柔软、温暖、以人类节奏的触碰——这些神经只对这个调谐。

这个速度并非随意。它正好是母亲抚摸哭泣婴儿的节奏。也是你在别人崩溃时轻抚他们后背的节奏。你的皮肤里有神经，存在的唯一目的就是探测一件事：被关怀。

当这些神经被激活时，它们完全绕过了大脑处理普通触觉的部分。它们直奔情感中枢，触发催产素的释放。

催产素就是大家称之为“联结激素”的化学物质。但它在那一刻真正做的，是关闭你的压力反应。它对抗皮质醇——当你承受压力时，身体会大量释放这种激素。你的心率下降。血压下降。你的身体从“战或逃”状态中爬出来。

问题是时间。

研究表明，大约需要20秒的亲密接触，这个机制才会完全启动。一个快速的拍打几乎没什么效果。这些神经需要稳定、温暖、持续的拥抱，你的大脑才会承诺向系统中注入催产素。

这就是为什么真正的拥抱和握手感觉完全不同。也为什么它能比任何自我劝解更快地让你平静下来。

在一项研究中，情侣们在进行压力性的公开演讲任务前互相拥抱20秒，他们的身体比独自面对的人更平静。他们的神经系统在他们开口前就已经做好了准备。

你天生就有一个系统，只有当有人足够长时间地拥抱你——以示真诚——时，它才会开启。

大多数人只坚持3秒就松手了。

⏰ 19:12 | ❤️ 54点赞 | 📝 869字 | 查看原文 →

↑ 返回顶部

Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: AI代理成本高，The Grid推出实时竞价市场降低价格。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: AI 代理每天的 API 成本达到 300 美元 (需根据具体 AI 代理的规模、API 调用频率和定价模型验证，但缺乏推文中提到的具体代理或服务商信息，需实测或参考公开定价数据。)
✓ 可验证: The Grid 是一个实时市场，模型们为请求争夺最低合格价格 (可通过 The Grid 的官网或公开文档验证其商业模式和功能描述，若平台明确说明其实时竞价机制则可直接确认。)
◦ 观点: 提供商在价格上没有任何竞争动力（导致用户支付零售价） (属于对市场竞争状态的主观判断，缺乏具体数据或行业分析支持，无法客观验证。)

原文内容:

 AI 代理每天的 API 成本达到 300 美元。

那就是每年 10 万美元。每代理。

而你仍在支付零售价，因为你的提供商在价格上没有任何竞争动力。

The Grid 刚刚改变了这一点。它是一个实时市场，模型们为你的请求争夺最低合格价格。

这是它的工作原理（以及如何在 2 分钟内切换）

⏰ 23:47 | ❤️ 43点赞 | 📝 100字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI降低认知成本，释放非常规想法的探索潜力。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Terence Tao认为AI和其他技术可以将认知摩擦降到零 (Terence Tao是知名数学家，其观点可通过采访、演讲或公开文章部分验证，但“认知摩擦降到零”是主观表述，无法完全量化或客观验证。)
✓ 可验证: AI改变了数学研究中检查案例、追查参考资料等环节的成本 (AI在文献检索、计算辅助等领域的应用有公开案例（如GPT、Wolfram Alpha等），数学研究中的具体成本变化可通过学术工具使用数据间接验证。)
◦ 观点: AI让数学家尝试“更疯狂的事情”，因为非传统想法常被不便阻挡而非被证明否定 (这是对AI影响的推测性观点，尽管符合逻辑，但“疯狂想法”的可行性和阻碍减少缺乏具体数据支持，属于主观判断。)

原文内容:

Terence Tao：“直到最近，我们一直生活在一个充满认知摩擦的世界里，每个任务都需要我们动脑筋。

所以我们并没有真正去想它，我们只是认为这是进行智力活动所付出的代价。但现在我们有了AI和其他技术，可以将这些摩擦降到零。”

大部分研究时间并不是花在获得电影般的洞见上。

而是花在检查案例、追查参考资料、将直觉转化为计算、测试一条路径、发现它无效，并决定这次失败是否教会了你什么。

AI改变了这个循环的成本。

Terence Tao说，现在他可以尝试“更疯狂的事情”，这带来了巨大的不同。因为非传统的想法往往不是被证明所否定，而是被不便所阻挡。

一位数学家可能会避免一条奇怪的方向，不是因为它愚蠢，而是因为测试它所需的记账、编码或文献搜索对一个直觉来说成本太高。

这就是认知摩擦变成科学摩擦的地方。

降低它并不会让品味、判断或证明消失；它让更多的微弱信号变得足够廉价，可以在被放弃之前进行检查。

AI正在让犹豫变得不那么昂贵，而发现往往正从那里开始。

⏰ 04:47 | ❤️ 175点赞 | 📝 353字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI导师让个性化一对一辅导普及且经济实惠。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 实时 AI 导师可以提供个性化的、一对一指导 (可通过现有AI教育产品（如Khanmigo、ChatGPT教育版）部分验证其功能，但“个性化”程度取决于具体实现，需实测确认。)
✓ 可验证: 实时 AI 导师通过逐步指导而非直接给出答案来教学 (现有AI教育工具（如MathGPT）已公开演示类似功能，官网或演示视频可验证其交互逻辑。)
◐ 部分可验证: 实时 AI 导师能动态调整教学策略 (部分AI系统（如Duolingo Max）宣称具备适应性学习功能，但具体算法细节通常未公开，需实测验证调整效果。)

原文内容:

黄仁勋谈到了实时 AI 导师如何让个性化的、一对一指导变得广泛可及。

它不是直接给出答案，而是逐步指导，并实时调整。

曾经昂贵的私人辅导，现在正变得对任何学习者都可及。

---

（视频鸣谢 - WWT 炉边谈话，黄仁勋 & 吉姆·卡瓦诺）

⏰ 01:57 | ❤️ 43点赞 | 📝 87字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: Kog AI通过优化GPU内存流实现推理速度提升30倍。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

◐ 部分可验证: @Kog__AI 在 8× AMD MI300X GPU 上实现了 3,000 令牌/秒，在 8× NVIDIA H200 上实现了 2,100 令牌/秒（FP16，无推测解码） (需依赖Kog官方发布的基准测试报告或第三方复现数据，目前推文未提供具体测试条件或公开文档链接。)
◐ 部分可验证: Kog的技术实现了用户实际感受到的10倍到30倍速度提升（对比常规100-300令牌/秒） (需对比行业标准基准（如Hugging Face或MLPerf的推理性能数据），但推文未明确引用对比来源，且“用户实际感受”涉及主观因素。)
✓ 可验证: Kog通过将LLM解码视为内存流式传输问题（而非数学问题）和monokernel设计提升速度 (技术细节（如monokernel实现、内存访问优化）需官方公开代码或白皮书，目前仅停留在描述层面。)

原文内容:

我不得不自己测试一下才能相信这种不可思议的推理速度。

每用户 3,000 令牌/秒，使用标准的 Datacenter GPU。

他们利用了 GPU 生成令牌方式中的一个隐藏效率差距。

@Kog__AI 刚刚在 8× AMD MI300X GPU 上实现了 3,000 令牌/秒，在 8× NVIDIA H200 上实现了 2,100 令牌/秒（FP16，无推测解码）。他们的技术预览基于一个 2B 模型，他们展示了这些技术如何以类似速度扩展到大型前沿 MoE 模型。

这是一个巨大的数字，因为正常低批次 GPU 解码 2B 到 8B 模型的通常速度接近每请求 100 到 300 令牌/秒，所以 Kog 声称实现了用户实际感受到的 10 倍到 30 倍的速度提升。

他们的诀窍：他们通过将 LLM 解码视为内存流式传输问题，而不是主要视为数学问题，来获得这种速度。

对于批次大小为 1 的单个用户，GPU 不会像训练或大批量服务那样进行高效的大矩阵-矩阵运算；它会为每个新令牌反复从高带宽内存中拉取模型的活跃权重，因此速度取决于这些权重流动的顺畅程度。

正常的推理堆栈不断中断这种流动。
它们为模型的不同部分运行多个独立的 GPU 程序，通过内存移动中间结果，在同步点等待，与 CPU 交互进行调度或采样，然后逐令牌重复此过程。

Kog 的解决方案是共同设计通常单独调优的 3 个东西：运行时、低级 GPU 代码和模型架构。

最大的工程举措是 monokernel，整个解码过程作为一个持久的 GPU 驻留程序运行，包括采样，因此系统不会不断停止进行内核启动、CPU 调度和中间内存往返。

他们还重建了同步机制，因为他们自己的测量显示网格同步消耗了大约 35% 的令牌生成时间；不是让每个计算单元在宽泛的屏障处等待，每个单元只等待它确切需要的数据。

在 AMD MI300X 上，他们还围绕芯片布局映射内存访问，因为内存延迟取决于发出请求的哪个芯片。

然后他们的 Laneformer 模型使用了延迟张量并行主义，这允许跨 GPU 通信在后台发生，而不是阻塞每一层。

⏰ 01:14 | ❤️ 51点赞 | 📝 597字 | 查看原文 →

↑ 返回顶部

Google Gemini @geminiapp

The Gemini app turns research into reality, bringing frontier AI experiences like Veo 3.1, Deep Think, Nano Banana, and more to hundreds of millions of people. | 影响力: 488.10k万粉丝

💡 核心观点: Gemini Spark面向美国Ultra用户开放，可高效处理数字任务。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: Gemini Spark 现已向美国所有 Google AI Ultra 订阅者开放 (可通过访问 http://gemini.google 或官方应用查看订阅条款和功能开放范围，确认美国地区的 Ultra 订阅者是否具备访问权限。)
◐ 部分可验证: Gemini Spark 能够承担繁重的工作，并在数字生态系统中连接各个环节 (功能描述需实测验证（如具体工作负载支持、跨平台连接能力），但部分能力（如生态系统整合）可能依赖未公开的技术细节或用户主观体验。)
◦ 观点: Gemini Spark 在最关键的地方采取行动，且始终在用户指导之下运行 (表述为主观性描述（如“最关键的地方”“用户指导”），缺乏客观衡量标准，属于产品宣传用语。)

原文内容:

Gemini Spark 现已向美国所有 Google AI Ultra 订阅者开放。

它能够承担繁重的工作，并在您的数字生态系统中连接各个环节，在最关键的地方采取行动。无论您是观看它工作，还是让它在后台运行，Gemini Spark 始终在您的指导之下。

在 http://gemini.google 或应用中试用一下，并告诉我们您的想法。

⏰ 00:58 | ❤️ 934点赞 | 📝 95字 | 查看原文 →

↑ 返回顶部

Pierrick Chevallier | IA @charaspowerai

AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝

💡 核心观点: 蒙面武士暴雨中瞬斩群敌，闪电与剑光交织的震撼战斗。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

✓ 可验证: 蒙面武士身着黑色铠甲，雨水从他的刀刃上滴落，头盔下双眼微微发光，完美静止地站在一座被毁村庄的中央 (该描述为虚构场景的文学化表达，属于创作内容，无法通过客观事实或公开数据验证。)
✓ 可验证: 武士以不可思议的速度向前冲刺，穿越数十名敌人，每一记斩击都划出发光的能量轨迹，同时闪电在他周围击落 (涉及超现实动作和特效（如发光能量轨迹、闪电同步击落），属于艺术想象，无现实依据或技术实现公开说明。)
◐ 部分可验证: 封建日本村庄在夜晚的猛烈雷暴下，燃烧的房屋，雾气在木质建筑间飘荡 (环境设定（如封建日本村庄、木质建筑）可通过历史资料验证，但具体场景（燃烧、雷暴、雾气）为动态创作，依赖工具生成效果，无法直接核对。)

原文内容:

史诗般的动作提示，带有 #PixVerse C1。

提示
一位蒙面武士身着黑色铠甲，雨水从他的刀刃上滴落，头盔下双眼微微发光，完美静止地站在一座被毁村庄的中央
突然以不可思议的速度向前冲刺，穿越数十名敌人，每一记斩击都划出发光的能量轨迹，同时闪电在他周围击落
封建日本村庄在夜晚的猛烈雷暴下，燃烧的房屋，雾气在木质建筑间飘荡
以缓慢的电影式推进镜头穿过雨幕开始，围绕武士的细微环绕，突然加速进入战斗，快速平移镜头连接不可能的剑击，慢镜头中雨滴在撞击时凝固，蓝色闪电照亮战场，以武士静静站立结束，所有敌人同时在他身后倒下，暴风雨缓缓消退，镜头拉回至被毁的村庄

⏰ 14:30 | ❤️ 46点赞 | 📝 241字 | 查看原文 →

↑ 返回顶部

Pierrick Chevallier | IA @charaspowerai

AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝

💡 核心观点: AI技术正彻底改变动画制作流程，实现高效角色与动态场景生成。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 角色表生成 + Seedance 的组合开始产生疯狂的结果 (需实测或查看具体案例才能验证其效果，但缺乏公开数据或官方示例支持。)
◐ 部分可验证: 一致的角色、动态的动漫镜头、真实的动画能量 (需实际测试工作流程或查看生成的动画片段才能验证，但推文未提供直接证据或公开示例。)
✓ 可验证: 准备了完整的工作流程 + 提示，可创建30秒动漫序列 (若推文作者公开了工作流程或提示内容，可通过实际测试验证；否则需进一步确认。)

原文内容:

动画工作流程正在永远改变   
角色表生成 + Seedance 的组合开始产生疯狂的结果。

- 一致的角色。  
- 动态的动漫镜头。  
- 真实的动画能量。  

我准备了完整的工作流程 + 提示，来创建这个关于在极佳陪伴下幸存热浪的30秒动漫序列   
 在你丢掉它之前先收藏起来  
#Magnific

⏰ 00:45 | ❤️ 125点赞 | 📝 96字 | 查看原文 →

↑ 返回顶部

# x每日奏折