【AI 英文奏折】06月15日

x每日奏折1个月前发布 tianming

291 0 0

【AI 英文奏折】2026年06月15日

共收录 17 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

Rohan Paul: AI依赖源于虚假便利感，实际效率提升有限。
Rohan Paul: 字节跳动将推出低价版Seedance 2.0 mini，保持高质量但降低价格。
Rohan Paul: Khlosla认为应发展全自主AI而非副驾驶，人类会阻碍效率。
Pierrick Chevallier | IA: Seedance 2与Starlight Precise 2.5组合实现专业级HDR工作流程。
Rohan Paul: AI时代的基础设施决定每美元每瓦特的令牌效率。
Rohan Paul: AI竞争关键在于模型应用闭环与私有数据反馈体系
Hasan Toor: Headroom压缩AI代理输入内容，大幅减少token消耗且保持答案准确。
Pierrick Chevallier | IA: Q版提示词可定制任何角色，生成可爱动态的动漫风格渲染效果。
Alex Prompter: 达芬奇通过跨界研究创新，可效仿其方法解决难题。
Hasan Toor: 优化对话方式可有效解决Claude令牌限制问题。
TechHalla: Seedance 2.0展示电影级游戏动画特效与动态镜头设计。
Rohan Paul: 依赖AI解题速度快但知识掌握更差。
Hasan Toor: 五个代码指令可解锁Claude隐藏的强大功能。
Rohan Paul: AI代理长期使用后可靠性会无声下降。
Pierrick Chevallier | IA: 黑暗幻想女法师召唤僵尸大军掌控巴黎。
Hasan Toor: Floci是比LocalStack快250倍的免费开源AWS模拟器。
Rohan Paul: AI仅模仿历史记录而无法真正理解抽象规则。

📖 详细内容

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI依赖源于虚假便利感，实际效率提升有限。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

✓ 可验证: 人工智能可以让人们感觉自己更高效，即使实际效率提升微乎其微 (论文通过三项预注册研究（2,691名参与者）量化了主观感知与实际节省时间的差异（预期节省55.7秒 vs 实际7.5秒），数据可通过论文链接直接验证)
✓ 可验证: 人们更倾向于在简单任务上使用人工智能，即使独立完成更快 (论文统计了参与者在基本算术、拼写等简单任务中的人工智能使用频率，并对比独立完成速度，实验设计及结果详见论文)
◐ 部分可验证: 人工智能使用会形成反馈循环，训练用户对其产生依赖性 (论文提出“仅完成两项任务后用户倾向性增强”的结论，但长期依赖性需进一步研究验证)

原文内容:

麻省理工学院、斯坦福大学、纽约大学、普林斯顿大学的一篇论文指出，人工智能可以让人们感觉自己更高效，即使他们实际上并没有变得高效多少。

人们常常使用人工智能来处理简单任务，因为这感觉像是节省了时间和精力，但实际测量的益处往往微乎其微、缺失，甚至是负面的。

最大的要点是反馈循环：一旦人们使用人工智能，他们就会更有可能再次使用它，即使是在那些自己动手往往同样快或更快的简单任务上。

也就是说，人工智能依赖可能源于一种错误的便利感，而不仅仅是真正的生产力提升。

在三项预注册研究中，涉及 2,691 名参与者，人们使用人工智能进行基本算术、拼写、回忆和简短改写的频率高于他们的预期，尤其是在简单任务上。

他们还预计人工智能平均能节省 55.7 秒，而实际测量的节省只有 7.5 秒。

对于简单工作，隐藏的成本不是智能，而是界面摩擦：编写提示、等待、阅读、检查，以及决定答案是否可接受。

一旦这个循环开始，它就会让人感觉努力已经被外包，即使努力只是被重新安排。

这里是关键部分：研究表明，人工智能的使用可以训练自己的正当性。

在仅使用人工智能完成两项任务后，参与者更有可能再次使用它，即使独立完成更快。

危险不是戏剧性的依赖，而是悄无声息的重新校准。

今天向人工智能询问一个琐碎答案的人，明天可能不会变得能力更差，但他们可能会在判断自己的大脑已经是更快工具时变得不那么准确。

----

论文链接 – arxiv.org/abs/2605.22687

论文标题："效率提升错觉：人们低估了人工智能使用频率，并高估了其在简单任务上的益处"

⏰ 21:29 | ❤️ 159点赞 | 📝 547字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 字节跳动将推出低价版Seedance 2.0 mini，保持高质量但降低价格。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Dreamina（由字节跳动运营）正在准备一个更小的全新 Seedance 版本 (可通过字节跳动或 Dreamina 的官方公告或产品更新页面验证，但需等待官方发布具体信息或实测确认。)
◐ 部分可验证: Dreamina Seedance 2.0 mini 可能将于 6 月 15 日推出 (发布日期可通过官方渠道或后续公告验证，但目前仅为传言，需进一步确认。)
✓ 可验证: Seedance 2.0 mini 将带来接近 Seedance 2.0 的质量，但价格更低 (质量和价格对比需实测或官方发布具体参数与定价，目前仅为推测或营销表述。)

原文内容:

传言称 Dreamina（由字节跳动运营）正在准备一个更小的全新 Seedance 版本。

据说 Dreamina Seedance 2.0 mini 可能将于 6 月 15 日推出，带来接近 Seedance 2.0 的质量，却没有同样令人痛苦的价格标签。

对于那些热爱 Seedance 但讨厌账单的创作者来说，这可能非常受欢迎。

有一段时间，大家都专注于原始输出质量。现在更大的问题是：在过程变得太慢或太昂贵之前，你能进行多少次认真的尝试？

以更少的钱获得更好的 AI 视频总是件好事。

#dreamina #seedance #dreaminaseedance2mini

你可以在此处试用。

⏰ 22:22 | ❤️ 25点赞 | 📝 154字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: Khlosla认为应发展全自主AI而非副驾驶，人类会阻碍效率。

可信度: 6/10 – 1项声明可直接验证；1项需进一步确认；2项为观点陈述

事实核查:

◦ 观点: Khlosla认为“人类会妨碍副驾驶”，拖慢进程并阻碍变革 (这是Khlosla的主观观点，基于他对人类与AI协作效率的推测，无客观数据或公开事实支持。)
◐ 部分可验证: 会计师和程序员因担心工作被取代而抵制“AI副驾驶”工具 (可通过行业调查或员工访谈验证部分群体态度，但“普遍抵制”的结论需更多数据支持，且动机难以全面量化。)
✓ 可验证: Khlosla更倾向于构建完全自主的AI（如完整软件工程师），而非辅助人类的“副驾驶” (若Khlosla公开发表过相关言论（如采访、文章），可通过原始内容验证；否则需依赖该推文引用的YouTube视频（需确认来源）。)

原文内容:

Khlosla 谈及他为何不太喜欢“AI 副驾驶”。

因为他认为“人类会妨碍副驾驶”，这会拖慢一切进程并阻碍真正变革。

他说，像会计师和程序员这样的工作者实际上并不想要副驾驶，因为他们觉得自己的工作岌岌可危，然后就会抵制正确使用该工具。

所以，与其“帮助”他们，他更喜欢构建完全自主完成工作的 AI，就像一个完整的软件工程师。

他预计，到 2030 年，这些角色中的大多数将变成纯粹的 AI 工作者，而不是人类+副驾驶。

---

摘自 'Corgi Insurance' YouTube 频道（链接在评论中）

⏰ 16:21 | ❤️ 158点赞 | 📝 170字 | 查看原文 →

↑ 返回顶部

Pierrick Chevallier | IA @charaspowerai

AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝

💡 核心观点: Seedance 2与Starlight Precise 2.5组合实现专业级HDR工作流程。

可信度: 8/10 – 1项声明可直接验证；2项需进一步确认；2项为观点陈述

事实核查:

◦ 观点: Seedance 2 + Starlight Precise 2.5（HDR 导出）是目前最喜欢的组合 (这是个人偏好陈述，无客观标准验证其“最喜欢”的真实性。)
◐ 部分可验证: Seedance 2 + Starlight Precise 2.5 的组合是革命性的改变 (需实测或对比官方功能说明，但“革命性”属主观评价，技术改进程度需专业验证。)
◐ 部分可验证: HDR 导出的质量大幅提升 (需实测或查阅官方更新日志，但“大幅”为相对描述，缺乏具体量化标准。)

原文内容:

显然我目前最喜欢的组合是 Seedance 2 + Starlight Precise 2.5（HDR 导出）。这真是革命性的改变。#Topaz

我们已经从“看起来不错的 AI 素材”转向真正专业、可用的工作流程。
HDR 导出的质量大幅提升。你已经在测试这个组合了吗？
在评论中告诉我你的进度。

⏰ 19:00 | ❤️ 206点赞 | 📝 81字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI时代的基础设施决定每美元每瓦特的令牌效率。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 萨蒂亚·纳德拉提出“每美元每瓦特的令牌数”作为AI物理经济学的供给侧衡量标准 (需查看原始视频或官方文字记录确认具体表述，但“每美元每瓦特的令牌数”这一术语的行业通用性及计算方式需进一步技术验证)
✓ 可验证: 纳德拉强调“基础设施”是AI时代的关键要素，并重复三次以突出重要性 (可通过Microsoft India官方YouTube频道视频直接验证其发言内容)
◦ 观点: “AI时代适用于每个公司、行业或国家的全新方程式” (属于愿景或主观论断，无具体技术或数据支持，无法客观验证)

原文内容:

萨蒂亚·纳德拉谈 AI 物理经济学的供给侧

“每美元每瓦特的令牌数”

他的能量在这里体现得淋漓尽致。

AI 时代适用于每个公司、行业或国家的全新方程式。

“这意味着基础设施，基础设施和基础设施。”

---

来自“Microsoft India” YouTube 频道（链接在评论中）

⏰ 04:26 | ❤️ 64点赞 | 📝 87字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI竞争关键在于模型应用闭环与私有数据反馈体系

可信度: 4/10 – 2项需进一步确认；1项为观点陈述

事实核查:

◦ 观点: 真正的竞争不只是模型质量本身，而是围绕模型的循环：工作流程、反馈、判断、例外、失败 (该声明是Satya Nadella对AI竞争本质的主观观点，强调流程和反馈的重要性，但未提供具体案例或数据支持，属于战略愿景陈述。)
◐ 部分可验证: 教会系统理解企业内部重要事项需要私有测试 (私有测试在AI开发中的必要性可通过企业技术白皮书或案例研究间接验证（如微软AI实践），但“重要性”程度属于主观判断，且具体测试细节通常不公开。)
◐ 部分可验证: 这需要私有评估、私有强化循环，以及可查询的机构记忆 (“私有评估”等技术概念在行业中存在（如企业级AI工具链），但推文未说明具体实现方式或来源，需依赖企业技术文档进一步验证。)

原文内容:

Satya Nadella 关于 AI 组织经济学和“令牌资本”的精彩文章

真正的竞争不只是模型质量本身，而是围绕模型的循环：工作流程、反馈、判断、例外、失败，以及那些教会系统理解企业内部重要事项的私有测试。

这需要私有评估、私有强化循环，以及可查询的机构记忆

⏰ 04:18 | ❤️ 43点赞 | 📝 98字 | 查看原文 →

↑ 返回顶部

Hasan Toor @hasantoxr

AI & Tech Educator • Sharing insights on AI, Tech Tools, & practical ways to use AI & Tech Tools for you & your daily business • Founder & Writer @theprohumanai | 影响力: 0万粉丝

💡 核心观点: Headroom压缩AI代理输入内容，大幅减少token消耗且保持答案准确。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: GitHub仓库”Headroom”能防止AI代理无缘无故地消耗token (可通过查看GitHub仓库（若存在）验证其功能描述，但需实测才能确认实际效果是否与描述一致。)
✓ 可验证: Headroom由Netflix员工Tejas Chopra构建，可压缩AI代理读取的内容（如工具输出、日志、文件等） (可通过GitHub仓库作者信息及LinkedIn等公开渠道验证开发者身份，仓库文档可验证支持压缩的内容类型。)
◐ 部分可验证: 开发者声称使用Headroom可减少60-95%的token数量且答案保持不变 (需通过实际测试对比token消耗和输出结果，但缺乏公开的第三方基准测试报告。)

原文内容:

所以我发现了一个 GitHub 仓库，它能防止 AI 代理无缘无故地消耗 token。

它叫 Headroom。

它是由一位名叫 Tejas Chopra 的人构建的，他在 Netflix 工作。

基本上，它会在 AI 代理读取的内容到达 LLM 之前，对所有内容进行压缩。

例如：

- 工具输出
- 日志
- 文件
- RAG 块
- 代码搜索结果
- 对话历史

开发者声称，使用它可以减少 60–95% 的 token 数量，同时答案保持不变。

目前你可以用它来：

- Python/TypeScript 库
- 本地代理
- MCP 服务器
- Claude Code、Codex、Cursor、Aider 和 Copilot 的包装器

如果你的编码代理变得昂贵、缓慢，或者迷失在巨大的日志中，这个仓库值得一看。

感谢阅读。

⏰ 03:52 | ❤️ 95点赞 | 📝 169字 | 查看原文 →

↑ 返回顶部

Pierrick Chevallier | IA @charaspowerai

AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝

💡 核心观点: Q版提示词可定制任何角色，生成可爱动态的动漫风格渲染效果。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Q版提示词可以适配到任何角色，获得超级可爱、动态且充满活力的渲染效果 (需实测验证提示词对不同角色的适配性和渲染效果，效果可能因具体工具或模型而异，无法直接通过公开资料完全确认。)
◦ 观点: 使用该提示词的结果总是超级时尚 (“超级时尚”是主观审美判断，无客观标准，取决于个人或群体的偏好，无法客观验证。)
✓ 可验证: 提示词包含特定格式（如Q版风格、动态姿势、2D游戏艺术等） (推文直接提供了提示词的具体结构和关键词，可通过文本分析或AI工具测试其格式是否一致。)

原文内容:

这个Q版提示词超上瘾 
你可以将它适配到任何角色，获得超级可爱、动态且充满活力的渲染效果。

PROMPT
Q版风格，[角色 + 动作 + 对手/情境]，以……风格，可爱背景，2D游戏艺术，高分辨率，焦点清晰，[背景/环境]，动漫风格，动态姿势，史诗且动态
结果总是超级时尚。

你想看到哪个角色或组合以Q版风格呈现？
在评论里告诉我，我会为你适配这个提示词！

⏰ 02:45 | ❤️ 58点赞 | 📝 129字 | 查看原文 →

↑ 返回顶部

Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: 达芬奇通过跨界研究创新，可效仿其方法解决难题。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

✓ 可验证: 列奥纳多·达·芬奇研究流动的水以学习如何画出卷曲的头发 (达·芬奇的笔记本（如《大西洋手稿》）中有大量关于水流与头发运动相似性的研究草图和解说文字，可通过博物馆数字化档案或权威艺术史资料验证)
✓ 可验证: 列奥纳多·达·芬奇通过研究鸟类设计飞行器 (现存手稿（如《鸟类飞行手稿》）明确记录了其对鸟类飞行的力学分析及飞行器设计，相关文献和博物馆展品均可佐证)
◐ 部分可验证: 达·芬奇填满数千页笔记本并连接跨领域知识 (现存手稿约7000页，但“连接他人未涉及的领域”需主观判断，部分跨学科研究（如解剖学与工程学结合）有明确记录)

原文内容:

列奥纳多·达·芬奇研究流动的水，以学习如何画出卷曲的头发。他研究鸟类来设计飞行器。

他填满了数千页笔记本，连接了其他人从未想过要连接的领域。

我把这种习惯变成了一个 Claude 技能，它会针对我卡住的任何问题强制进行这些连接。

这是构建提示，你可以自己制作：

⏰ 01:57 | ❤️ 24点赞 | 📝 108字 | 查看原文 →

↑ 返回顶部

Hasan Toor @hasantoxr

AI & Tech Educator • Sharing insights on AI, Tech Tools, & practical ways to use AI & Tech Tools for you & your daily business • Founder & Writer @theprohumanai | 影响力: 0万粉丝

💡 核心观点: 优化对话方式可有效解决Claude令牌限制问题。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

◐ 部分可验证: Claude的令牌限制问题已经解决 (需通过官方公告或更新日志确认是否已解决令牌限制问题，但具体解决方式可能依赖用户实测体验。)
◐ 部分可验证: 每条新消息会从头重读整个对话，建议为每个新话题开启新聊天以减少令牌消耗 (可通过测试对话连续性验证消息处理机制，但令牌计算逻辑需依赖官方文档或技术说明。)
✓ 可验证: 编辑原始消息并重新生成可消除差评回复，避免令牌堆叠 (可通过实际操作验证编辑功能是否影响回复历史，但令牌消耗差异需工具监测或官方数据支持。)

原文内容:

Claude 的令牌限制问题已经解决了。

以下是您遇到它的确切原因，以及五个只需五分钟就能解决的修复方法。

1. 每条新消息都会从头重读您的整个对话。修复方法：为每个新话题开启一个新的聊天。

2. 收到差评回复？不要发送更正。点击您原始消息的编辑按钮并重新生成。差评回复会消失，而不是堆叠令牌。

3. 停止上传完整文档。一页 PDF 可能耗费多达 3,000 个令牌。一份 20 页的文件在 Claude 说一个字之前就烧掉 60,000 个令牌。只粘贴您实际需要的部分。

4. 使用项目。将您的品牌声音、背景信息和指令存储在项目中。Claude 会缓存它，这样每次新聊天都不会消耗新鲜令牌。

5. 批量处理您的问题。三条单独消息的成本是一条的三倍。将所有内容合并成一个单一提示。

五个改变。五分钟。您的限制将持续一整天。

享受吧！

⏰ 19:00 | ❤️ 116点赞 | 📝 270字 | 查看原文 →

↑ 返回顶部

TechHalla @techhalla

Senior Telecommunications Engineer & Developer but I’m here for the AI thing. | 影响力: 0万粉丝

💡 核心观点: Seedance 2.0展示电影级游戏动画特效与动态镜头设计。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 视频游戏过场动画包含史诗奇幻动作、戏剧性体视神光、重尘埃与碎屑等视觉效果 (可通过实际游戏或官方发布的视频片段验证部分视觉效果（如尘埃、碎屑），但“史诗奇幻动作”“戏剧性体视神光”等描述涉及主观审美判断，需依赖玩家或评测者反馈。)
✓ 可验证: 0-4s镜头为广角低角度跟踪，展现英雄在石廊中疾奔并遭遇崩塌 (可通过官方发布的游戏视频或实际游玩直接验证镜头角度、场景崩塌等具体设计，属于客观技术实现。)
◐ 部分可验证: 8-12s动态环绕镜头旋转180°，英雄荡过崩塌平台，镜头随碎屑倾斜引发眩晕 (镜头运动和场景崩塌可通过视频验证，但“引发眩晕”为个人体验（如玩家反馈），需依赖主观感受。)

原文内容:

Seedance 2.0 提示词就在这里 

视频游戏过场动画，史诗奇幻动作，戏剧性的体视神光，重尘埃与碎屑，照片级真实结合风格化游戏光影，强烈的物理效果。

0-4s：广角低角度跟踪镜头，跟随英雄在古老石廊中疾奔。身后突然发生大规模崩塌。镜头加速进入快速跟踪镜头，同时地面开裂并塌陷。

4-8s：英雄跃过不断扩大的裂隙时，对其面部进行极端推拉变焦（眩晕效果）——背景向镜头冲来同时拉近，制造强烈的迷失感。英雄在半空中扭身抓住一条摆动的铁链。

8-12s：动态环绕镜头围绕英雄旋转180°，同时他荡过正在崩塌的平台。镜头随着坠落碎屑剧烈倾斜，引发眩晕。英雄跑过一座正在碎裂的倾斜石桥。

12-15s：最终的绝望一跃，扑向阳光，同时整座神殿崩塌成一个巨大的天坑。镜头与他一同在自由落体中旋转并下坠，慢动作旋转，以他安全落地到外侧地面时戏剧性的拉远结束。快速元素带有强烈运动模糊，物理效果连贯，能量感十足。

超详细的石头纹理，电影级光影，完美的运动模糊，高动态范围，角色稳定，电影级稳定性。

⏰ 23:00 | ❤️ 33点赞 | 📝 355字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 依赖AI解题速度快但知识掌握更差。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 学生完成AI友好的数学问题更快，但他们似乎从中学习得更少。 (可通过研究论文（arXiv链接提供）验证实验设计和结论，但需核实数据收集和分析方法的严谨性，且结论可能受样本限制。)
✓ 可验证: ChatGPT推出后，高中和大学生在AI友好文字题上花费的时间大幅减少，而年轻学生变化较小或没有变化。 (论文中明确提及基于320万条ALEKS平台数据的对比分析，时间变化数据可直接通过研究结果验证。)
◐ 部分可验证: 在监考的知识保留题上，学生正确回答AI友好题目的可能性降低了约25%。 (论文提供了统计结果，但需确认监考条件、题目设计等细节是否排除其他干扰因素（如作弊可能性）。)

原文内容:

学生完成AI友好的数学问题更快，但他们似乎从中学习得更少。

研究人员分析了10年间320万条ALEKS数学学习记录，以观察ChatGPT可用后发生了什么变化。

完成得更快并不意味着学习效率更高，因为数学练习通过选择表示形式、测试步骤、犯错并纠正的过程来构建知识，这种“摩擦”至关重要。

当聊天机器人提供路径时，学生可能仍然提交答案，但他们的思维跳过了将接触转化为记忆的工作。

他们比较了文字题（学生可以轻松粘贴到AI聊天机器人中）和图形题（更难交给AI，因为需要在平台内进行视觉工作）。

ChatGPT推出后，高中和大学生在AI友好文字题上花费的时间大幅减少，而年轻学生则显示出较小或没有变化。

这种时间减少在监考测试中消失了，这表明更快的完成速度并非仅仅因为学生进步或平台变化。

学习成本后来显现出来：在监考的知识保留题上，学生正确回答AI友好题目的可能性降低了约25%，尽管在非监考题上（AI仍能帮忙）他们表现更好。

----

arxiv.org/abs/2605.21629

《更快完成，更少学习：生成式AI减少了数学问题上的学习时间及其构建的知识》

⏰ 00:32 | ❤️ 35点赞 | 📝 364字 | 查看原文 →

↑ 返回顶部

Hasan Toor @hasantoxr

AI & Tech Educator • Sharing insights on AI, Tech Tools, & practical ways to use AI & Tech Tools for you & your daily business • Founder & Writer @theprohumanai | 影响力: 0万粉丝

💡 核心观点: 五个代码指令可解锁Claude隐藏的强大功能。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 在提示前输入”GodMode”可以让Claude摆脱礼貌模式，切换到最激进、直接的响应 (该声明缺乏官方文档或可靠来源支持，且”GodMode”这类术语未在Claude公开功能中提及，属于非正式说法，需实测验证但结果可能因人而异。)
◐ 部分可验证: 在提示后添加”Artifacts”可使Claude实时构建可运行的应用程序、游戏或仪表板 (Claude确实支持生成代码片段（如通过工具调用），但”实时构建完整应用”的能力需实测验证，且未在官方功能描述中明确提及该关键词。)
✓ 可验证: 在提示前输入”OODA”会让Claude应用军事决策框架回答问题 (OODA循环是真实存在的军事理论，但无证据表明Claude内置该框架或响应特定关键词，可能为夸张表述或用户自定义提示技巧。)

原文内容:

5 个让 CLAUDE 强大 10 倍的秘密代码

自己试试看。

1. GodMode：

在你的提示前输入这个。让 Claude 摆脱礼貌模式，切换到最激进、直接的响应。

2. Artifacts：

在你的提示后添加这个。Claude 会实时在聊天中为你构建一个可运行的应用程序、游戏或仪表板。

3. OODA：

在你的提示前输入这个。Claude 会对你的问题应用军事决策框架，并精确告诉你该如何行动。

4. ghost：

在你的提示前放置这个。你会得到一个完全人性化的响应，能通过 AI 检测器。无破折号。无 AI 句子结构。

5. L99：

在你的提示前添加这个。Claude 会以最高专家水平进行响应。

保存这个。

⏰ 00:02 | ❤️ 81点赞 | 📝 180字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI代理长期使用后可靠性会无声下降。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 德克萨斯大学的论文显示，AI代理在部署后可能会逐渐变得不可靠，即使模型本身没有变化。 (可通过提供的arXiv链接（arxiv.org/abs/2605.26302）直接查阅论文标题和摘要，验证其研究结论。)
✓ 可验证: AgingBench是一个基准测试，用于检查代理在多个会话中的可靠性，而非仅测试初始状态。 (论文标题和摘要明确提到“Agent Lifespan Engineering”和“AgingBench”，可通过链接验证其存在性和研究目标。)
◐ 部分可验证: 代理老化的4种方式包括：总结丢失细节、记忆混淆、事实陈旧化、维护破坏记忆。 (论文中可能详细描述了这4种方式，但需阅读全文才能完全确认具体定义和实验数据。)

原文内容:

德克萨斯大学的一篇论文显示，AI代理在部署后可能会逐渐变得不可靠，即使模型本身没有变化。

问题是，代理通常在新鲜状态下被评估，但真实的代理会持续变化，因为它们会总结旧聊天记录、存储更多记忆、更新事实，并进行维护。

一个能在数周内记住你的代理，实际上就是一个围绕语言模型构建的小型操作系统：它会写笔记、压缩它们、检索它们、更新它们，并偶尔进行清理。

这些步骤中的每一个都可能悄无声息地腐烂。

一个药物剂量可能变成“日常药物”，两个相似的客户可能混淆成一个，一个已取消的订阅可能仍显示为活跃状态，一个日程安排可能在维护后消失。

令人不安的发现是，代理可能听起来仍然胜任，但实际上变得不那么精确。

所提出的AgingBench是一个基准测试，它检查代理是否能在多个会话中保持可靠，而不是只检查一个干净的起点。

它研究了代理老化的4种方式：总结可能会丢失关键细节，相似的记忆可能会混淆，更新的事实可能会保持陈旧，维护可能会突然破坏记忆。

更深刻的教训是，“给它更多记忆”往往是错误的修复方式。

如果事实从未被写入，检索就无法拯救它。

如果事实被写入但被挤出，更好的总结也无法修复它。

如果事实存在但未被使用，问题不是存储，而是代理决定信任或忽略检索到的内容的决策。

这篇论文将部署的代理重新框架为不像静态模型，而更像是老化的基础设施。

----

链接 – arxiv.org/abs/2605.26302

标题：“Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems”

⏰ 23:31 | ❤️ 81点赞 | 📝 494字 | 查看原文 →

↑ 返回顶部

Pierrick Chevallier | IA @charaspowerai

AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝

💡 核心观点: 黑暗幻想女法师召唤僵尸大军掌控巴黎。

可信度: 10/10 – 4项声明可直接验证；1项为观点陈述

事实核查:

◦ 观点: Seedance 2 处理僵尸召唤的方式很棒 (这是用户对游戏或作品的主观评价，没有客观事实依据，无法验证其真实性。)
✓ 可验证: 巴黎落入死灵法师的控制之下 (这是虚构的叙事场景，属于创作内容，现实中无法验证巴黎是否被死灵法师控制。)
✓ 可验证: Hailuo 制作了这条推文 (可通过查看推文来源或作者信息验证发布者是否为 Hailuo。)

原文内容:

我喜欢 Seedance 2 处理僵尸召唤的方式有多棒   
巴黎落入死灵法师的控制之下……这太沉重了。

看这个   
PROMPT  
一位神秘的黑暗幻想女法师，身着优雅的黑色战裙，苍白的脸庞平静而恐怖，长长的银发在不自然的微风中飘动，闪烁的紫罗兰色眼睛，手上覆盖着古老的死灵符文  
她站在被雨水浸湿的巴黎大道中央，缓缓举起双臂，裂开沥青路面，数百名不死士兵从地底抓挠着爬出，在汽车、咖啡馆和地铁入口之间升起，在她周围形成一支恐怖的僵尸大军  
黄昏时分的巴黎，靠近奥斯曼建筑，湿漉漉的鹅卵石路，闪烁的街灯，废弃的汽车，烟雾在远处的埃菲尔铁塔轮廓周围飘荡  
以缓慢的电影式推进镜头开始，穿过空荡荡的巴黎街道，微妙的 handheld 紧张感，突然从地面视角跟踪，手指从裂开的沥青中迸出，围绕女法师的环绕镜头，同时僵尸在她身后层层升起，戏剧性的吊臂上升揭示不死大军填满整条大道，冷蓝色的月光与温暖的巴黎街灯混合，体积雾气，逼真的雨水，泥土，尘埃和超自然的紫色能量，以女法师完美静止地站在数千僵尸中央结束，它们在她面前跪下，镜头从巴黎上方拉远，揭示城市落入她的掌控之下。

你喜欢这种黑暗幻想 / 僵尸风格，还是想让我制作更多像这样的召唤？  
在评论中告诉我！由 Hailuo 制作

⏰ 23:30 | ❤️ 52点赞 | 📝 439字 | 查看原文 →

↑ 返回顶部

Hasan Toor @hasantoxr

AI & Tech Educator • Sharing insights on AI, Tech Tools, & practical ways to use AI & Tech Tools for you & your daily business • Founder & Writer @theprohumanai | 影响力: 0万粉丝

💡 核心观点: Floci是比LocalStack快250倍的免费开源AWS模拟器。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

◐ 部分可验证: Floci 启动时间为 24ms，比典型模拟器快 250 倍（对比 LocalStack 的 ~6000ms） (启动时间可通过实测或官方基准测试验证，但需确认测试环境（硬件、配置等）是否一致，且“典型模拟器”范围不明确。)
◐ 部分可验证: Floci 空闲时仅占 13 MiB 内存，而竞争对手（如 LocalStack）占 ~250 MiB (内存占用可通过监控工具实测验证，但需明确“竞争对手”的具体版本和测试条件，且未提供公开的第三方对比数据。)
✓ 可验证: Floci 通过 1925/1925 个 AWS SDK 兼容性测试 (可通过官方发布的测试报告或开源代码库中的测试用例验证具体兼容性结果。)

原文内容:

LocalStack 刚刚有了免费替代品，它启动速度快 250 倍。

它叫 floci。

一个用 Quarkus Native 构建的即插即用 AWS 模拟器，启动只需 24ms，空闲时仅占 13 MiB，并通过了 1925/1925 个 AWS SDK 兼容性测试。

它让你在自己的机器上本地运行 AWS 风格的服务，用于开发、测试和 CI。

无需 AWS 账户。
无需认证令牌。
无需付费功能限制。
无需跟踪。
无需意外的云账单。

以下是它与 LocalStack 的不同之处：

→ 24ms 启动时间 vs 典型模拟器的 ~6,000ms
→ 13 MiB 空闲内存 vs 竞争对手的 ~250 MiB
→ 每秒 289 次 Lambda 调用，支持真实 Docker 执行
→ ~90 MB Docker 镜像大小，适用于最小的 CI 运行器
→ 按账户隔离：单个实例上运行 dev、staging 和 test

基本上，Floci 为开发者提供了一个快速、免费、开源的本地 AWS 云，专为真正交付产品的人构建。

AWS 测试现在变得便宜多了。

⏰ 22:57 | ❤️ 81点赞 | 📝 216字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI仅模仿历史记录而无法真正理解抽象规则。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: AI 实际上根本没有理解或应用高级抽象教训 (可通过论文实验设计（如替换提示为随机文本后 AI 的表现）部分验证，但“理解”和“抽象教训”的定义涉及主观判断，需结合具体实验数据进一步分析。)
✓ 可验证: 当逐步历史记录被搞乱时，AI 严重失败，证明它高度依赖于复制确切的过去行动 (论文中明确描述了破坏历史记录后的性能测试结果（arxiv.org/abs/2601.22436），可通过公开实验数据直接验证。)
✓ 可验证: 破坏浓缩的摘要规则后，AI 继续正常行动，没有显示任何性能下降 (论文中对比了两种记忆存储方式（历史记录 vs 摘要规则）的干扰实验结果，数据可公开查阅。)

原文内容:

研究人员发现，我们当前让 AI 随时间变聪明的做法存在一个巨大的盲点。

AI 实际上根本没有理解或应用高级抽象教训。

开发者花费大量时间构建系统，将过去的 AI 错误浓缩成整齐的小规则，用于未来。

这篇论文证明，AI 基本上把那些规则扔进垃圾桶，只看原始的历史日志。

现代 LLM 系统试图通过将过去任务存储为原始的逐步历史记录或浓缩的摘要规则来随时间变好。这项研究通过秘密地将正确提示替换为随机垃圾文本，测试这些代理是否真正使用它们的存储记忆。

- 当逐步历史记录被搞乱时，AI 严重失败，证明它高度依赖于复制确切的过去行动。

- 但当研究人员完全破坏浓缩的摘要规则时，AI 继续正常行动，没有显示任何性能下降。

如果 AI 无法将抽象教训应用到新情境中，它就不是真正推理或学习。

这引发了一个问题：整个 AI 行业是否需要重新思考记忆的运作方式，因为现在这些代理只是在模仿，而不是理解。

----

arxiv.org/abs/2601.22436

“LLM 代理并非总是忠实的自我进化者”

⏰ 22:30 | ❤️ 258点赞 | 📝 340字 | 查看原文 →

↑ 返回顶部

# x每日奏折