【AI 英文奏折】2026年05月30日
共收录 9 篇深度内容
📋 今日内容速览
快速浏览,点击感兴趣的推文查看详细分析
- Rohan Paul: AI进步需优化系统框架而不仅是扩大模型。
- Rimsha Bhardwaj: 20秒真诚拥抱通过皮肤神经快速减压,比言语更有效。
- Alex Prompter: AI代理成本高,The Grid推出实时竞价市场降低价格。
- Rohan Paul: AI降低认知成本,释放非常规想法的探索潜力。
- Rohan Paul: AI导师让个性化一对一辅导普及且经济实惠。
- Rohan Paul: Kog AI通过优化GPU内存流实现推理速度提升30倍。
- Google Gemini: Gemini Spark面向美国Ultra用户开放,可高效处理数字任务。
- Pierrick Chevallier | IA: 蒙面武士暴雨中瞬斩群敌,闪电与剑光交织的震撼战斗。
- Pierrick Chevallier | IA: AI技术正彻底改变动画制作流程,实现高效角色与动态场景生成。
📖 详细内容
Rohan Paul @rohanpaul_ai
Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝
💡 核心观点: AI进步需优化系统框架而不仅是扩大模型。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: 更强大的代理不仅仅来自更大的模型,还来自围绕它们的更好系统(harness) (论文链接提供了理论支持(arXiv:2605.26112),但实际系统效果需依赖具体实现和实验数据,部分需实测验证。)
- ✓ 可验证: 长上下文并不等于可用上下文,记忆并不等于可信记忆,拥有许多工具并不等于知道何时使用它们 (可通过现有研究(如长上下文窗口的局限性、工具调用错误案例)和论文中的实验分析验证,但需结合具体代理系统测试。)
- ◐ 部分可验证: 一次性基准分数感觉越来越单薄,因相同答案可能通过高风险或偶然方式达成 (基准测试的局限性在AI领域已有讨论(如arXiv论文或会议研究),但”单薄”是主观评价,具体风险案例需进一步数据支撑。)
原文内容:
更强大的代理不仅仅来自更大的模型,还来自围绕它们的更好系统。 问题是,许多 AI 代理被评估得好像只有模型单独完成了工作,尽管真实行为还取决于记忆、工具、上下文、路由、检查和权限。 围绕代理的这种设置被称为 harness,即决定模型看到什么、可以使用什么工具、记住什么以及哪些动作需要检查的系统。 进步应该来自于扩展这个 harness,特别是 3 个部分:更好的上下文控制、更可信的记忆,以及更好的工具或辅助代理路由。 长上下文并不等于可用上下文,记忆并不等于可信记忆,拥有许多工具并不等于知道何时使用它们。 一个过时的笔记可能比没有笔记更危险,因为它恰好在代理应该重新检查世界时给了它信心。 一个专用的子代理也可能悄无声息地失败,如果它的输出听起来合理但后续层没有验证其真实性。 这就是为什么一次性基准分数感觉越来越单薄。 两个代理可以得出相同的最终答案,而其中一个消耗了更多 token,进行更冒险的工具调用、携带了损坏的记忆,或者仅靠偶然成功。 下一个前沿不仅仅是扩展机器内部的思维。 而是扩展围绕它的纪律。 ---- 链接 – arxiv.org/abs/2605.26112 标题:"从模型扩展到系统扩展:代理式 AI 中的 Harness 扩展"
⏰ 16:08 | ❤️ 90点赞 | 📝 408字 | 查看原文 →
Rimsha Bhardwaj @heyrimsha
Helping you master AI daily with step by step AI guides, & practical tools • AI Educator & Writer • DM for Collab | 影响力: 23.09k万粉丝
💡 核心观点: 20秒真诚拥抱通过皮肤神经快速减压,比言语更有效。
可信度: 10/10 – 2项声明可直接验证;3项需进一步确认
事实核查:
- ◐ 部分可验证: 20秒的拥抱比激励性谈话、呼吸技巧或刷手机更快降低压力激素 (可通过心理学或神经科学实验研究验证,但需具体实验数据支持(如皮质醇水平测量),且效果可能因人而异。)
- ✓ 可验证: 皮肤中存在C-触觉传入神经,专门对缓慢、温柔的接触(如拥抱)产生反应 (Francis McGlone的研究已被多篇神经科学论文引用(如《Nature Reviews Neuroscience》),C-触觉纤维的存在及其功能可通过学术数据库验证。)
- ◐ 部分可验证: 催产素释放需至少20秒的持续接触才能有效抑制压力反应 (部分研究支持催产素与触觉时长的关联(如《Psychoneuroendocrinology》期刊),但具体阈值(20秒)可能需更多实验复现。)
原文内容:
一个20秒的拥抱比任何激励性谈话、呼吸技巧或刷手机所能做到的更快降低你的压力激素,而且它之所以有效,是因为你皮肤里有一条隐藏的神经,只有当有人足够长时间地拥抱你——以示真诚——时,它才会苏醒。 大多数人根本不知道这条神经的存在。 这位毕生致力于证明它存在的人是一位名叫弗朗西斯·麦克格洛恩(Francis McGlone)的英国神经科学家,而他帮助揭示的系统彻底改变了我们对触觉的认知。 你的皮肤里其实同时运行着两种完全不同的触觉系统。 第一种是显而易见的。快速神经会告诉你某物在哪里以及它压得有多重。这就是你用来感受手机、拿起笔或抓住门把手的系统。快速、精确,而且完全没有情感成分。 第二种系统才是奇怪的那个。 埋藏在你全身皮肤里的是一组缓慢神经,麦克格洛恩称之为C-触觉传入神经。在你手臂的某些区域,近40%的触觉神经都是这些。而且这里是让人震惊的部分:它们几乎对猛戳毫无反应。它们不在乎压力大小。它们不在乎精确度。它们只对一件非常具体的事情反应最强烈。 缓慢、温柔的接触,大约以一个人安慰所爱之人时手部移动的速度。 动作快一点,神经就安静下来。动作慢一点,它也保持安静。只有一个狭窄的窗口——柔软、温暖、以人类节奏的触碰——这些神经只对这个调谐。 这个速度并非随意。它正好是母亲抚摸哭泣婴儿的节奏。也是你在别人崩溃时轻抚他们后背的节奏。你的皮肤里有神经,存在的唯一目的就是探测一件事:被关怀。 当这些神经被激活时,它们完全绕过了大脑处理普通触觉的部分。它们直奔情感中枢,触发催产素的释放。 催产素就是大家称之为“联结激素”的化学物质。但它在那一刻真正做的,是关闭你的压力反应。它对抗皮质醇——当你承受压力时,身体会大量释放这种激素。你的心率下降。血压下降。你的身体从“战或逃”状态中爬出来。 问题是时间。 研究表明,大约需要20秒的亲密接触,这个机制才会完全启动。一个快速的拍打几乎没什么效果。这些神经需要稳定、温暖、持续的拥抱,你的大脑才会承诺向系统中注入催产素。 这就是为什么真正的拥抱和握手感觉完全不同。也为什么它能比任何自我劝解更快地让你平静下来。 在一项研究中,情侣们在进行压力性的公开演讲任务前互相拥抱20秒,他们的身体比独自面对的人更平静。他们的神经系统在他们开口前就已经做好了准备。 你天生就有一个系统,只有当有人足够长时间地拥抱你——以示真诚——时,它才会开启。 大多数人只坚持3秒就松手了。
⏰ 19:12 | ❤️ 54点赞 | 📝 869字 | 查看原文 →
Alex Prompter @alex_prompter
Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝
💡 核心观点: AI代理成本高,The Grid推出实时竞价市场降低价格。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: AI 代理每天的 API 成本达到 300 美元 (需根据具体 AI 代理的规模、API 调用频率和定价模型验证,但缺乏推文中提到的具体代理或服务商信息,需实测或参考公开定价数据。)
- ✓ 可验证: The Grid 是一个实时市场,模型们为请求争夺最低合格价格 (可通过 The Grid 的官网或公开文档验证其商业模式和功能描述,若平台明确说明其实时竞价机制则可直接确认。)
- ◦ 观点: 提供商在价格上没有任何竞争动力(导致用户支付零售价) (属于对市场竞争状态的主观判断,缺乏具体数据或行业分析支持,无法客观验证。)
原文内容:
AI 代理每天的 API 成本达到 300 美元。 那就是每年 10 万美元。每代理。 而你仍在支付零售价,因为你的提供商在价格上没有任何竞争动力。 The Grid 刚刚改变了这一点。它是一个实时市场,模型们为你的请求争夺最低合格价格。 这是它的工作原理(以及如何在 2 分钟内切换)
⏰ 23:47 | ❤️ 43点赞 | 📝 100字 | 查看原文 →
Rohan Paul @rohanpaul_ai
Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝
💡 核心观点: AI降低认知成本,释放非常规想法的探索潜力。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: Terence Tao认为AI和其他技术可以将认知摩擦降到零 (Terence Tao是知名数学家,其观点可通过采访、演讲或公开文章部分验证,但“认知摩擦降到零”是主观表述,无法完全量化或客观验证。)
- ✓ 可验证: AI改变了数学研究中检查案例、追查参考资料等环节的成本 (AI在文献检索、计算辅助等领域的应用有公开案例(如GPT、Wolfram Alpha等),数学研究中的具体成本变化可通过学术工具使用数据间接验证。)
- ◦ 观点: AI让数学家尝试“更疯狂的事情”,因为非传统想法常被不便阻挡而非被证明否定 (这是对AI影响的推测性观点,尽管符合逻辑,但“疯狂想法”的可行性和阻碍减少缺乏具体数据支持,属于主观判断。)
原文内容:
Terence Tao:“直到最近,我们一直生活在一个充满认知摩擦的世界里,每个任务都需要我们动脑筋。 所以我们并没有真正去想它,我们只是认为这是进行智力活动所付出的代价。但现在我们有了AI和其他技术,可以将这些摩擦降到零。” 大部分研究时间并不是花在获得电影般的洞见上。 而是花在检查案例、追查参考资料、将直觉转化为计算、测试一条路径、发现它无效,并决定这次失败是否教会了你什么。 AI改变了这个循环的成本。 Terence Tao说,现在他可以尝试“更疯狂的事情”,这带来了巨大的不同。因为非传统的想法往往不是被证明所否定,而是被不便所阻挡。 一位数学家可能会避免一条奇怪的方向,不是因为它愚蠢,而是因为测试它所需的记账、编码或文献搜索对一个直觉来说成本太高。 这就是认知摩擦变成科学摩擦的地方。 降低它并不会让品味、判断或证明消失;它让更多的微弱信号变得足够廉价,可以在被放弃之前进行检查。 AI正在让犹豫变得不那么昂贵,而发现往往正从那里开始。
⏰ 04:47 | ❤️ 175点赞 | 📝 353字 | 查看原文 →
Rohan Paul @rohanpaul_ai
Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝
💡 核心观点: AI导师让个性化一对一辅导普及且经济实惠。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: 实时 AI 导师可以提供个性化的、一对一指导 (可通过现有AI教育产品(如Khanmigo、ChatGPT教育版)部分验证其功能,但“个性化”程度取决于具体实现,需实测确认。)
- ✓ 可验证: 实时 AI 导师通过逐步指导而非直接给出答案来教学 (现有AI教育工具(如MathGPT)已公开演示类似功能,官网或演示视频可验证其交互逻辑。)
- ◐ 部分可验证: 实时 AI 导师能动态调整教学策略 (部分AI系统(如Duolingo Max)宣称具备适应性学习功能,但具体算法细节通常未公开,需实测验证调整效果。)
原文内容:
黄仁勋谈到了实时 AI 导师如何让个性化的、一对一指导变得广泛可及。 它不是直接给出答案,而是逐步指导,并实时调整。 曾经昂贵的私人辅导,现在正变得对任何学习者都可及。 --- (视频鸣谢 - WWT 炉边谈话,黄仁勋 & 吉姆·卡瓦诺)
⏰ 01:57 | ❤️ 43点赞 | 📝 87字 | 查看原文 →
Rohan Paul @rohanpaul_ai
Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝
💡 核心观点: Kog AI通过优化GPU内存流实现推理速度提升30倍。
可信度: 10/10 – 2项声明可直接验证;3项需进一步确认
事实核查:
- ◐ 部分可验证: @Kog__AI 在 8× AMD MI300X GPU 上实现了 3,000 令牌/秒,在 8× NVIDIA H200 上实现了 2,100 令牌/秒(FP16,无推测解码) (需依赖Kog官方发布的基准测试报告或第三方复现数据,目前推文未提供具体测试条件或公开文档链接。)
- ◐ 部分可验证: Kog的技术实现了用户实际感受到的10倍到30倍速度提升(对比常规100-300令牌/秒) (需对比行业标准基准(如Hugging Face或MLPerf的推理性能数据),但推文未明确引用对比来源,且“用户实际感受”涉及主观因素。)
- ✓ 可验证: Kog通过将LLM解码视为内存流式传输问题(而非数学问题)和monokernel设计提升速度 (技术细节(如monokernel实现、内存访问优化)需官方公开代码或白皮书,目前仅停留在描述层面。)
原文内容:
我不得不自己测试一下才能相信这种不可思议的推理速度。 每用户 3,000 令牌/秒,使用标准的 Datacenter GPU。 他们利用了 GPU 生成令牌方式中的一个隐藏效率差距。 @Kog__AI 刚刚在 8× AMD MI300X GPU 上实现了 3,000 令牌/秒,在 8× NVIDIA H200 上实现了 2,100 令牌/秒(FP16,无推测解码)。他们的技术预览基于一个 2B 模型,他们展示了这些技术如何以类似速度扩展到大型前沿 MoE 模型。 这是一个巨大的数字,因为正常低批次 GPU 解码 2B 到 8B 模型的通常速度接近每请求 100 到 300 令牌/秒,所以 Kog 声称实现了用户实际感受到的 10 倍到 30 倍的速度提升。 他们的诀窍:他们通过将 LLM 解码视为内存流式传输问题,而不是主要视为数学问题,来获得这种速度。 对于批次大小为 1 的单个用户,GPU 不会像训练或大批量服务那样进行高效的大矩阵-矩阵运算;它会为每个新令牌反复从高带宽内存中拉取模型的活跃权重,因此速度取决于这些权重流动的顺畅程度。 正常的推理堆栈不断中断这种流动。 它们为模型的不同部分运行多个独立的 GPU 程序,通过内存移动中间结果,在同步点等待,与 CPU 交互进行调度或采样,然后逐令牌重复此过程。 Kog 的解决方案是共同设计通常单独调优的 3 个东西:运行时、低级 GPU 代码和模型架构。 最大的工程举措是 monokernel,整个解码过程作为一个持久的 GPU 驻留程序运行,包括采样,因此系统不会不断停止进行内核启动、CPU 调度和中间内存往返。 他们还重建了同步机制,因为他们自己的测量显示网格同步消耗了大约 35% 的令牌生成时间;不是让每个计算单元在宽泛的屏障处等待,每个单元只等待它确切需要的数据。 在 AMD MI300X 上,他们还围绕芯片布局映射内存访问,因为内存延迟取决于发出请求的哪个芯片。 然后他们的 Laneformer 模型使用了延迟张量并行主义,这允许跨 GPU 通信在后台发生,而不是阻塞每一层。
⏰ 01:14 | ❤️ 51点赞 | 📝 597字 | 查看原文 →
Google Gemini @geminiapp
The Gemini app turns research into reality, bringing frontier AI experiences like Veo 3.1, Deep Think, Nano Banana, and more to hundreds of millions of people. | 影响力: 488.10k万粉丝
💡 核心观点: Gemini Spark面向美国Ultra用户开放,可高效处理数字任务。
可信度: 8/10 – 2项声明可直接验证;1项需进一步确认;1项为观点陈述
事实核查:
- ✓ 可验证: Gemini Spark 现已向美国所有 Google AI Ultra 订阅者开放 (可通过访问 http://gemini.google 或官方应用查看订阅条款和功能开放范围,确认美国地区的 Ultra 订阅者是否具备访问权限。)
- ◐ 部分可验证: Gemini Spark 能够承担繁重的工作,并在数字生态系统中连接各个环节 (功能描述需实测验证(如具体工作负载支持、跨平台连接能力),但部分能力(如生态系统整合)可能依赖未公开的技术细节或用户主观体验。)
- ◦ 观点: Gemini Spark 在最关键的地方采取行动,且始终在用户指导之下运行 (表述为主观性描述(如“最关键的地方”“用户指导”),缺乏客观衡量标准,属于产品宣传用语。)
原文内容:
Gemini Spark 现已向美国所有 Google AI Ultra 订阅者开放。 它能够承担繁重的工作,并在您的数字生态系统中连接各个环节,在最关键的地方采取行动。无论您是观看它工作,还是让它在后台运行,Gemini Spark 始终在您的指导之下。 在 http://gemini.google 或应用中试用一下,并告诉我们您的想法。
⏰ 00:58 | ❤️ 934点赞 | 📝 95字 | 查看原文 →
Pierrick Chevallier | IA @charaspowerai
AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝
💡 核心观点: 蒙面武士暴雨中瞬斩群敌,闪电与剑光交织的震撼战斗。
可信度: 10/10 – 3项声明可直接验证;2项需进一步确认
事实核查:
- ✓ 可验证: 蒙面武士身着黑色铠甲,雨水从他的刀刃上滴落,头盔下双眼微微发光,完美静止地站在一座被毁村庄的中央 (该描述为虚构场景的文学化表达,属于创作内容,无法通过客观事实或公开数据验证。)
- ✓ 可验证: 武士以不可思议的速度向前冲刺,穿越数十名敌人,每一记斩击都划出发光的能量轨迹,同时闪电在他周围击落 (涉及超现实动作和特效(如发光能量轨迹、闪电同步击落),属于艺术想象,无现实依据或技术实现公开说明。)
- ◐ 部分可验证: 封建日本村庄在夜晚的猛烈雷暴下,燃烧的房屋,雾气在木质建筑间飘荡 (环境设定(如封建日本村庄、木质建筑)可通过历史资料验证,但具体场景(燃烧、雷暴、雾气)为动态创作,依赖工具生成效果,无法直接核对。)
原文内容:
史诗般的动作提示,带有 #PixVerse C1。 提示 一位蒙面武士身着黑色铠甲,雨水从他的刀刃上滴落,头盔下双眼微微发光,完美静止地站在一座被毁村庄的中央 突然以不可思议的速度向前冲刺,穿越数十名敌人,每一记斩击都划出发光的能量轨迹,同时闪电在他周围击落 封建日本村庄在夜晚的猛烈雷暴下,燃烧的房屋,雾气在木质建筑间飘荡 以缓慢的电影式推进镜头穿过雨幕开始,围绕武士的细微环绕,突然加速进入战斗,快速平移镜头连接不可能的剑击,慢镜头中雨滴在撞击时凝固,蓝色闪电照亮战场,以武士静静站立结束,所有敌人同时在他身后倒下,暴风雨缓缓消退,镜头拉回至被毁的村庄
⏰ 14:30 | ❤️ 46点赞 | 📝 241字 | 查看原文 →
Pierrick Chevallier | IA @charaspowerai
AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝
💡 核心观点: AI技术正彻底改变动画制作流程,实现高效角色与动态场景生成。
可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: 角色表生成 + Seedance 的组合开始产生疯狂的结果 (需实测或查看具体案例才能验证其效果,但缺乏公开数据或官方示例支持。)
- ◐ 部分可验证: 一致的角色、动态的动漫镜头、真实的动画能量 (需实际测试工作流程或查看生成的动画片段才能验证,但推文未提供直接证据或公开示例。)
- ✓ 可验证: 准备了完整的工作流程 + 提示,可创建30秒动漫序列 (若推文作者公开了工作流程或提示内容,可通过实际测试验证;否则需进一步确认。)
原文内容:
动画工作流程正在永远改变 角色表生成 + Seedance 的组合开始产生疯狂的结果。 - 一致的角色。 - 动态的动漫镜头。 - 真实的动画能量。 我准备了完整的工作流程 + 提示,来创建这个关于在极佳陪伴下幸存热浪的30秒动漫序列 在你丢掉它之前先收藏起来 #Magnific
⏰ 00:45 | ❤️ 125点赞 | 📝 96字 | 查看原文 →
Rohan Paul
Rimsha Bhardwaj
Alex Prompter
Google Gemini
Pierrick Chevallier | IA