【AI 英文奏折】05月25日

x每日奏折15小时前发布 tianming
47 0 0

【AI 英文奏折】2026年05月25日

共收录 17 篇深度内容


📋 今日内容速览

快速浏览,点击感兴趣的推文查看详细分析

  1. Rohan Paul: AI计算中预填充依赖并行计算,解码受限于内存带宽。
  2. Bearly AI: 客户要求麦肯锡按成果而非工时收费,因AI能快速完成分析工作。
  3. Rohan Paul: DeepSeek通过创新架构将硬件限制转化为AI战略优势。
  4. Rohan Paul: Zoom拥有海量会议数据,可打造颠覆性企业AI产品。
  5. Rohan Paul: AI将数学证明转化为可扩展的搜索问题。
  6. Alex Prompter: AI投入高昂却降低效率,企业盲目跟风得不偿失。
  7. Amira Zairi: 用故障艺术风格融合数字与现实,打造霓虹色未来感画面。
  8. Alex Prompter: AI工具高效到企业无力承担自由使用成本。
  9. Rohan Paul: Claude Skills整合指令与工具实现特定任务自动化
  10. Rohan Paul: DeepSeek永久降价75%,转向华为芯片降低成本。
  11. Alex Prompter: Claude能通过特定提示帮助解决认知失调问题。
  12. Rohan Paul: 阿里与南大论文提出轻量适配使百万token预填充提速9.36倍。
  13. Rimsha Bhardwaj: AI专家Andrej Karpathy暂停教学加入OpenAI竞争对手。
  14. Rohan Paul: MoE模型可通过ZEDA减少半数专家计算且保持精度。
  15. Abhishek: AI快速生成动漫分镜并制作动画短片。
  16. Rohan Paul: 黄仁勋认为工程师应专注解决问题而非写代码。
  17. Amira Zairi: 将品牌logo转化为精确折纸雕塑的3D渲染,保留原比例与色调。

📖 详细内容

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI计算中预填充依赖并行计算,解码受限于内存带宽。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认

事实核查:

  • ◐ 部分可验证: Prefill阶段是计算密集型任务,大规模并行GPU占优,因此随着上下文增长Nvidia占据主导地位 (AI计算中Prefill阶段的并行计算需求可通过技术文档或基准测试间接验证,但”Nvidia主导”需结合市场份额数据(如公开报告),且”上下文增长”的具体影响需实测支持。)
  • ✓ 可验证: Decode阶段受内存带宽限制,因每个新token生成需扫描已生成内容 (解码阶段对内存带宽的依赖性和自回归生成(token-by-token)特性是公认的AI推理机制,可通过模型架构论文(如Transformer)或硬件性能分析(如GPU白皮书)直接验证。)
  • ◐ 部分可验证: Nvidia在Prefill阶段的优势源于其大规模并行GPU能力 (NVIDIA GPU的并行计算性能(如CUDA核心数量)可查证,但”优势”需对比其他厂商(如AMD)的实测数据,且未明确具体场景(如模型规模),故部分可验证。)

原文内容:

查马斯谈人工智能计算中所有重要的"预填充"和"解码"阶段:
预填充阶段受计算能力限制,随着上下文增长,需要大规模并行GPU处理,因此英伟达占据主导地位;
解码阶段则受内存带宽制约,因为每个后续token的生成都需要扫描已生成内容。

⏰ 07:19 | ❤️ 55点赞 | 📝 40词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Bearly AI @bearlyai

Privacy-first AI research tool with access to ChatGPT, Grok, Claude, Gemini and DeepSeek in one app. Try it at http://Bearly.AI | 影响力: 0万粉丝

💡 核心观点: 客户要求麦肯锡按成果而非工时收费,因AI能快速完成分析工作。

可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: McKinsey因AI面临客户压力,需将收费模式从按工时改为按成果(如降低成本、提高收入等)。 (麦肯锡是否因AI调整商业模式可通过其官方声明或客户公开报道部分验证,但“客户施压”的具体细节可能涉及内部决策,需进一步信源确认。)
  • ✓ 可验证: 劳斯莱斯自2018年起推行“按飞行小时付费”项目(固定费用涵盖维护、维修等)。 (劳斯莱斯官网及公开新闻(如BBC、路透社)均报道过其“Power-by-the-Hour”服务,属可验证事实。)
  • ◐ 部分可验证: Fin的AI聊天机器人按解决每个客户案例收费1美元。 (Fin公司若在官网或公开定价页面注明此收费模式则可验证,但需确认其当前有效性(如是否为试点或已普及)。)

原文内容:

麦肯锡正"面临客户压力"要求其改变商业模式,这源于人工智能的影响。  

客户不再希望将咨询费用与工时挂钩——因为AI能在几分钟内完成分析、诊断和报告——而是要求"将费用与实际成果绑定"(例如降低成本、提高收入、扩大市场份额)。  

咨询业的一个典型案例是劳斯莱斯:自2018年起,这家发动机制造商推行"按飞行小时计费"计划,对发动机每运行一小时收取*固定*费用(涵盖维护、维修和更换成本)。  

许多SaaS企业也已转向成果导向模式。Fin公司的AI聊天机器人按解决的客户案例数收费,每单1美元;iDenfy的身份证验证服务每次收费1英镑;Salesforce现在允许用户按任务付费。

⏰ 06:04 | ❤️ 362点赞 | 📝 115词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: DeepSeek通过创新架构将硬件限制转化为AI战略优势。

可信度: 8/10 – 5项需进一步确认

事实核查:

  • ◐ 部分可验证: DeepSeek的架构将硬件稀缺性转化为战略优势 (需通过官方技术文档或白皮书验证其架构设计是否明确针对硬件稀缺性优化,但当前推文未提供直接引用来源。)
  • ◐ 部分可验证: DeepSeek V4-Pro的CSA/HCA技术将单令牌推理FLOPs降低至27%、KV缓存减少至V3.2的10% (若DeepSeek官方发布V4-Pro技术规格或性能报告(如博客、论文),则可直接验证;否则需依赖第三方测试或部分公开数据。)
  • ◐ 部分可验证: Engram研究通过可扩展查找内存存储静态知识,减少密集计算需求 (需查阅DeepSeek关于Engram的公开研究论文或技术说明,但推文未提供具体文献链接,可能存在细节缺失。)

原文内容:

这篇关于深度求索(DeepSeek)的文章非常精彩。

他们的真正故事并非更便宜的聊天机器人,而是一种将硬件稀缺性转化为战略优势的架构设计。

深度求索并非在兜售编程席位,而是致力于让中国的存储器、加速器和系统在前沿AI领域发挥价值。该团队最近的每个动作都在攻克制约性瓶颈——这些瓶颈使得前沿模型必须依赖高带宽存储器(HBM)密集型的高端GPU堆栈:混合专家模型(MoE)仅激活部分模型参数,专用架构(DSA)降低长文本注意力计算成本,而V4-Pro官方资料显示,其压缩稀疏架构(CSA/HCA)将百万token的单token推理计算量降至V3.2的27%,键值缓存(KV cache)降至10%。

另一条独立研究线"记忆刻印"(Engram)从不同角度践行相同逻辑:让静态知识驻留在可扩展的检索存储器中,通过可预测的方式从主存获取,而非迫使每个事实都经过密集计算。

这些看似工程细节的突破,实则暗含商业格局的变革——当模型减少对HBM和暴力计算的依赖时,次优芯片、充裕的低功耗内存(LPDDR)、闪存(NAND)及定制化ASIC将不再"次优"。

路透社已报道深度求索V4-Pro永久降价75%,同时指出华为昇腾芯片供应受限和超级节点即将投产的消息,这正是他们期待形成的反馈循环。

深度求索不仅在为基准测试优化模型,更在为另一套产业基础重构AI。

真正的奖赏不在应用层。

而在于让稀缺变得可编程。

⏰ 13:39 | ❤️ 549点赞 | 📝 224词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: Zoom拥有海量会议数据,可打造颠覆性企业AI产品。

可信度: 10/10 – 2项声明可直接验证;1项需进一步确认;2项为观点陈述

事实核查:

  • ◐ 部分可验证: Zoom拥有最大的会议视频和文字记录数据集 (Zoom的公开财报或用户规模数据可间接支持其数据量庞大的说法,但“最大”需与竞争对手(如Microsoft Teams、Google Meet)的具体数据对比,此类细节通常未完全公开。)
  • ◦ 观点: Zoom若能用AI自动提取决策、背景和行动项并写入系统,可取代多个独立SAAS工具 (这是基于技术潜力的推测,取决于Zoom未来产品开发效果,目前无实际功能或案例验证其可行性。)
  • ✓ 可验证: 企业软件的痛点是数据输入和协调 (大量企业软件行业报告(如Gartner、Forrester)提及此问题,可通过公开调研数据验证。)

原文内容:

Databricks联合创始人兼首席执行官Ali Ghodsi认为,Zoom拥有打造AI优先产品的巨大机遇,可能彻底颠覆传统企业级SAAS市场。

因为它坐拥规模最庞大的会议视频及文字记录数据集。

企业软件的痛点在于数据录入与协同。Zoom已掌握原始输入数据:每一次客户通话、内部会议,以及对应的视频、音频和文字记录。

如果Zoom能可靠地提炼决策要点、上下文背景和待办事项,并作为AI优先的工作流层自动回写至正确的记录系统,它将成为工作流程的入口门户。这将取代目前主要用于收集笔记和更新的大量独立SAAS工具。

(视频来源:YouTube频道'Bg2 Pod',链接见评论区)

⏰ 05:20 | ❤️ 46点赞 | 📝 129词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI将数学证明转化为可扩展的搜索问题。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: Terry Tao stated ‘I do see more and more mass-produced mathematics at scale.’ (该声明是Terry Tao的直接引用,可通过公开演讲、采访记录或他的个人博客等官方渠道验证。)
  • ◐ 部分可验证: AI makes mathematical proof-writing scalable by turning it into a search problem. (AI在数学证明中的应用已有研究(如DeepMind的AlphaGeometry),但具体如何“规模化”以及是否完全转化为搜索问题需依赖具体技术文档或实验验证。)
  • ◐ 部分可验证: AI generates thousands of mini-lemmas from a goal, and cheap checkers filter out most, keeping the few that work. (自动生成引理和验证的技术在形式化验证领域(如Coq、Lean)有部分实践,但具体规模(如“1000s”)和效率需实测或论文支持。)

原文内容:

“我确实看到越来越多大规模批量生产的数学成果。”  
~ 陶哲轩  

人工智能使这种规模化成为可能。它将证明写作转化为搜索问题:从一个目标生成数千个小引理,随后廉价的验证器会淘汰大部分无效项,仅保留少数有效结果。

⏰ 05:20 | ❤️ 61点赞 | 📝 43词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: AI投入高昂却降低效率,企业盲目跟风得不偿失。

可信度: 8/10 – 5项需进一步确认

事实核查:

  • ◐ 部分可验证: Marc Andreessen在Joe Rogan的播客中承认AI正在降低人们的工作效率 (可通过查找Joe Rogan播客的公开录像或文字记录验证Marc Andreessen是否确实发表过此言论,但需确认具体上下文和措辞。)
  • ◐ 部分可验证: 微软因财务问题取消了100,000个Claude Code许可证 (需查找微软或Anthropic(Claude开发方)的官方声明或可靠媒体报道,但目前无直接公开证据支持这一具体数字和原因。)
  • ◐ 部分可验证: Uber通过内部排行榜“游戏化”AI使用,导致AI预算超支34亿美元 (Uber的AI预算和内部政策可能通过财报或员工爆料部分验证,但“游戏化”细节和具体金额需内部文件或高管证实。)

原文内容:

马克·安德森在乔·罗根播客中承认AI正在降低人们的工作效率。

这位投资了半个AI产业的大佬。在播客里。就这么轻描淡写地说了出来。

同一周:英伟达副总裁称算力成本已超过员工薪资。

微软取消了10万个Claude Code许可证,因为财务部门无法承受账单。

优步到四月份就烧掉了34亿美元的AI预算。

而所有人都忽略了这个关键细节:

优步不只是采用了AI。他们把AI变成了竞赛。内部排行榜根据使用量给团队排名。

他们把消耗代币变成了比赛。一项运动。

效果立竿见影。使用率从32%飙升到84%。工程师们乐此不疲。事无巨细都用AI。

他们不再考虑某项工作是否需要AI。反正所有事情都用。永远都用。

然后预算就崩溃了。

这个工具太好用了,以至于人们不再筛选使用场景。

而当你不再筛选时,成本就会呈指数级增长。

因为基于代币的定价模式意味着每个不经思考的查询都在烧钱。

这才是没人敢点破的真相:

AI不存在成本问题。它本质就是成瘾性设计。

固定费率软件培养了整整一代人不计成本使用工具的习惯。

现在AI变成了按次计费。但"凡事都用AI"的旧习惯却没跟上计费模式的转变。

优步搞了个鼓励最大程度消耗产品的排行榜,而这个产品恰恰按消耗量计费。

然后看到账单时又假装惊讶。

微软工程师一致希望保留Claude Code。财务部门扼杀了它。工具使用者说这是工作流程的革命性突破。

支付账单的人却说:我们负担不起用户对它的热爱。

我们创造了如此好用的工具,唯一能维持它的方式竟是限制自由使用。

这个矛盾不是商业模式的漏洞。它本身就是商业模式。

所有AI公司都这么赚钱:打造令人上瘾的产品,按消耗量计费,然后静待账单爆炸。

⏰ 05:03 | ❤️ 84点赞 | 📝 343词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Amira Zairi @azed_ai

AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝

💡 核心观点: 用故障艺术风格融合数字与现实,打造霓虹色未来感画面。

可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: 推文提供了一个Glitch art风格的AI生成提示词(prompt) (推文明确提供了完整的prompt文本内容,任何用户均可直接复制使用或通过AI工具测试生成效果。)
  • ◐ 部分可验证: 该prompt能生成具有“像素位移、扫描线干扰、视觉错乱”等效果的图像 (实际生成效果需依赖具体AI工具(如MidJourney等)的算法实现,不同工具或版本可能输出差异结果,需实测验证。)
  • ◐ 部分可验证: 生成的图像会呈现“霓虹[color1]和[color2]的脉冲效果” (颜色表现取决于用户输入的[color1]和[color2]具体值以及AI工具的色彩渲染能力,需用户指定颜色后验证。)

原文内容:

提示词分享:故障艺术  

提示词:  
一件受故障艺术启发的[主体],被碎片化的数字叠加层、像素位移、扫描线干扰和意外的视觉破损所扭曲。霓虹[颜色1]与[颜色2]在画面中脉动,营造出一种可控的混乱感,模糊了数字世界与物理现实之间的界限。未来主义氛围、强烈对比、层次化扭曲、超现实能量、高细节、纯白背景。  

尝试并分享你的作品吧!

⏰ 19:00 | ❤️ 260点赞 | 📝 65词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: AI工具高效到企业无力承担自由使用成本。

可信度: 10/10 – 2项声明可直接验证;1项需进一步确认;2项为观点陈述

事实核查:

  • ✓ 可验证: Microsoft canceled Claude Code because it was too good, with 84-95% of engineers using it monthly, costing $500-$2,000 per person. (推文未提供具体来源或官方数据支持关于使用率、成本及取消原因的说法,且无公开报道或微软声明佐证。)
  • ✓ 可验证: Uber’s entire $3.4B AI预算在4个月内耗尽(因Claude Code的高成本)。 (Uber的AI预算细节及支出原因未公开,且未提及与Claude Code的直接关联,缺乏可信来源。)
  • ◦ 观点: AI工具的生产力过高,导致企业因成本限制员工自由使用。 (这是基于推文作者对现象的推测,无具体企业案例或数据支撑,属于主观结论。)

原文内容:

微软停用Claude Code并非因为它表现不佳。

而是因为它过于出色。

工程师们对其爱不释手,月均使用率高达84-95%。人均成本飙升至500-2000美元。优步34亿美元的全年AI预算短短四个月便消耗殆尽。

财务部门扼杀了工程团队一致推崇的工具。

请再仔细品味这个故事。

如今AI工具的效率高到企业根本无力承担员工自由使用的代价。

这是我见过对个体创业者最强烈的利好信号。

大公司将通过限流、限制和配额来控制AI使用成本。他们的工程师将被困在功能阉割的内部工具里。

而你只需支付奈飞订阅级别的费用,就能在家中畅享全球所有尖端模型。

竞争环境并非趋于公平——而是在彻底逆转。

⏰ 03:45 | ❤️ 183点赞 | 📝 138词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: Claude Skills整合指令与工具实现特定任务自动化

可信度: 10/10 – 2项声明可直接验证;3项需进一步确认

事实核查:

  • ◐ 部分可验证: Claude Skills teach Claude how to complete specific tasks in a repeatable way (需通过官方文档或实际测试确认Claude Skills的具体功能设计,但推文未提供直接链接或具体案例。)
  • ◐ 部分可验证: Skills are folders of instructions, scripts, and resources that Claude loads dynamically (技术实现细节需依赖官方公开的架构说明或开发者文档,目前仅能从推文描述推断,缺乏直接证据。)
  • ✓ 可验证: Skills can package prompts + tools (APIs, files, etc.) into reusable workflows (类似功能(如AI代理工作流)在其他平台(如LangChain)已有公开案例,若Claude官方提供类似文档即可验证。)

原文内容:

以下是符合要求的翻译:

一些有趣的使用Claude技能的方式

---

Claude技能教会Claude如何以可重复的方式完成特定任务

技能本质上是动态加载的指令集、脚本和资源文件夹,用于提升Claude在专项任务中的表现。

每个技能能将提示词+工具(API接口、文件、模型上下文协议服务器等)打包成可复用工作流,并配有名称/描述(通常包含YAML配置文件)。使用时只需在聊天中调用:"对这份草稿运行文档套件"或"在/login页面使用网页应用测试"。

---

reddit. com/r/ClaudeAI/comments/1ojuqhm/10_claude_skills_that_actually_changed_how_i_work/

⏰ 04:25 | ❤️ 64点赞 | 📝 91词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: DeepSeek永久降价75%,转向华为芯片降低成本。

可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: DeepSeek将其V4-Pro模型的API价格永久下调至原价的25% (可通过Reuters的报道链接(reuters.com)直接验证,且价格变动通常由企业官方公告或API文档公开确认)
  • ◐ 部分可验证: DeepSeek未确认更好的Ascend 950芯片供应导致此次永久降价 (需核实DeepSeek官方是否发布相关声明,但Reuters的报道中明确提及“未确认”,部分依赖媒体信源)
  • ◦ 观点: 降价时机表明成本曲线下降与中国AI技术栈从受限的Nvidia芯片转向华为硬件有关 (该声明为推测性分析(“timing points to”),无直接证据证明因果关系,属于行业观察或主观推断)

原文内容:

路透社:深度求索(DeepSeek)刚刚将其V4-Pro模型的降价调整为永久性措施,将API调用价格降至原价的25%。  

虽然深度求索未证实此次永久降价源于昇腾(Ascend)950芯片供应改善,但这一时机恰逢中国AI基础设施从受限的英伟达芯片转向华为硬件,预示着成本曲线正持续下探。  

---
reuters.com/world/china/chinas-deepseek-make-permanent-75-price-cut-flagship-v4pro-ai-model-2026-05-23/

⏰ 04:07 | ❤️ 65点赞 | 📝 67词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: Claude能通过特定提示帮助解决认知失调问题。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: Claude现在可以解决认知失调问题 (需实测验证Claude是否具备”认知失调解决”功能,官方未明确提及该模式,可能依赖特定提示词(prompt)效果。)
  • ◦ 观点: 大多数人同时持有两种矛盾信念且未察觉其负面影响 (属于心理学现象的概括性陈述,无具体数据支持”大多数”的量化主张,且”破坏决策”是主观推论。)
  • ◐ 部分可验证: 存在7种提示词可触发Claude的认知失调解决模式 (若推文作者提供具体提示词可部分验证效果,但”模式”是否为官方功能存疑,需测试实际响应是否符合描述。)

原文内容:

新闻快讯:您现在可以通过Claude解决认知失调问题。

大多数人同时持有两种相互矛盾的信念,却未意识到这正在破坏他们的决策质量。

只要提示得当,Claude就能为您厘清这种矛盾。

以下是7个可启动"认知失调解决模式"的提示模板:

⏰ 18:02 | ❤️ 33点赞 | 📝 50词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 阿里与南大论文提出轻量适配使百万token预填充提速9.36倍。

可信度: 10/10 – 2项声明可直接验证;3项需进一步确认

事实核查:

  • ◐ 部分可验证: Alibaba与南京大学论文称百万token预填充速度可提升9.36倍(对比FlashAttention-2) (需查阅论文原文或官方发布的数据验证速度提升比例及实验设置,但未提供直接链接或实验复现细节。)
  • ✓ 可验证: 标准LLM通过选择性稀疏注意力可更快处理长上下文 (论文中若包含具体算法描述和基准测试结果(如长上下文任务指标),可通过学术平台(arXiv等)验证其方法论和结论。)
  • ◐ 部分可验证: RTPurbo利用预训练模型的隐藏稀疏结构,无需从头训练 (需检查论文是否公开了稀疏结构的检测方法及实验对比(如消融研究),但技术细节可能依赖专业实现。)

原文内容:

阿里巴巴与南京大学联合发表的新论文宣称,仅需轻量级适配即可将百万token的预填充速度提升9.36倍(相较于FlashAttention-2)

研究表明,通过使注意力机制选择性稀疏化,标准大语言模型能更快处理超长上下文。

核心问题在于:当输入增长至数十万或百万token时,全注意力机制的计算成本会急剧上升,因为模型需要持续比对过多token之间的关联。

该论文提出,经过训练的全注意力模型已隐含稀疏结构,因此无需重建模型或从头训练。

RTPurbo通过识别真正需要远距离token的少量注意力头来利用该结构,同时让其他注意力头主要聚焦邻近文本。对于这些检索型注意力头,系统采用16维token定位器预测关键历史token,随后仅对筛选出的集合执行真实注意力计算。

研究团队在长上下文基准测试和推理任务中验证了该方法。RTPurbo在保持接近全注意力精度的同时,百万token预填充速度最高提升9.36倍,解码速度提升约2倍。

RTPurbo的工程准则:仅在关键位置保留高成本的长上下文访问,其余则通过更小的搜索空间路由。

其精妙之处在于16维索引器设计。它并非替代模型的真实注意力计算,而是充当低成本侦察兵——在完整表征作用于选定集合前,预先定位潜在有效token。

RTPurbo并非证明所有模型都适用此类稀疏化方案,但它有力揭示了长上下文推理中的资源浪费具有比表象更清晰的结构化特征。

----

论文链接:arxiv.org/abs/2605.16928v1  
论文标题:《全注意力机制强势回归:百步训练内将全注意力转化为稀疏注意力》

⏰ 03:53 | ❤️ 40点赞 | 📝 289词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rimsha Bhardwaj @heyrimsha

Helping you master AI daily with step by step AI guides, & practical tools • AI Educator & Writer • DM for Collab | 影响力: 23.09k万粉丝

💡 核心观点: AI专家Andrej Karpathy暂停教学加入OpenAI竞争对手。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: Andrej Karpathy是39岁的斯洛伐克-加拿大研究员,曾暂停自己的AI学校加入与OpenAI竞争的公司 (Karpathy的国籍、年龄(需推算出生年份)及职业经历可通过其LinkedIn或公开采访验证,但“暂停AI学校”需具体来源(如本人声明或公司公告),且“与OpenAI竞争”为相对表述,需明确具体公司名称及竞争关系。)
  • ✓ 可验证: Karpathy在斯坦福大学攻读博士期间设计并教授了首门深度学习课程CS231n,课程视频在YouTube免费公开并成为AI工程师的标准参考 (斯坦福大学官网课程目录、YouTube上CS231n的官方频道(如Stanford Online)及播放量可验证课程存在与影响力;TIME报道内容可通过存档检索确认。)
  • ◐ 部分可验证: Karpathy在多伦多大学就读期间旁听了Geoffrey Hinton的课程,早于Hinton成名 (Hinton的成名时间线(如2018年图灵奖)及Karpathy的求学经历可查,但“旁听课程”细节需依赖本人回忆或校友证言,无直接公开记录。)

原文内容:

一位39岁的斯洛伐克-加拿大籍研究者刚刚暂停了他的AI教学项目,加入这家与OpenAI竞逐智能未来的公司。

他叫安德烈·卡帕西。他的职业生涯堪称现代AI领域最奇特的轨迹之一。

1986年卡帕西出生于当时尚属捷克斯洛伐克的布拉迪斯拉发,15岁时随家人移居多伦多。他在多伦多大学攻读计算机与物理双学位期间,长期旁听杰弗里·辛顿的课程与读书会——那时辛顿还未声名鹊起。硕士就读于UBC后,他前往斯坦福大学师从ImageNet创始人李飞飞攻读博士。

2015年,尚未完成博士学业的他设计并主讲斯坦福首个深度学习课程CS231n。开课时仅有150名学生,两年后增至750人。课程视频免费发布在YouTube上,成为整整一代AI工程师的启蒙教材。《时代》周刊报道称,仅这些斯坦福课程视频的播放量就超过80万次。

同年,萨姆·奥尔特曼、埃隆·马斯克与伊利亚·苏茨克沃创建OpenAI实验室,卡帕西成为创始成员之一。

他在OpenAI工作两年后,2017年6月被马斯克招至特斯拉自动驾驶部门,担任AI高级总监五年期间,领导着全球每辆特斯拉背后的计算机视觉团队。

2023年2月他重返OpenAI,2024年2月再度离职。

随后他做出了同行从未有过的创举——将个人YouTube频道变为教学平台。

《神经网络:从零到英雄》系列用纯代码、数学和英语手把手演示GPT模型的构建过程。旗舰视频《让我们用代码从零构建GPT》全长近两小时,播放量数百万次。各大AI实验室的研究者坦言,正是这个视频让他们真正理解了Transformer架构。

2024年7月他创立尤里卡实验室,提出"AI原生学校"理念:人类教师与AI助教配合,让优秀教师能同时教授百万学生。首个课程LLM101n本科项目,指导零基础学员训练自己的ChatGPT。

2025年2月,他随手发布的"氛围编程"一词被《柯林斯词典》评为年度词汇,如今拥有专属维基词条。

上周,2026年5月19日,他宣布加入Anthropic。

尤里卡实验室暂时搁置。他表示未来几年是大语言模型发展的关键成型期,希望回归研究一线。在Anthropic他将领导预训练小组,专注于利用Claude自我迭代加速。

这位先后离开全球两大顶级AI实验室、却免费向世界传道授业的奇才,如今重归竞技场。

所有教学视频依然在线。全部免费。永久开放。

他仍会在评论区答疑解惑。

⏰ 21:34 | ❤️ 205点赞 | 📝 509词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: MoE模型可通过ZEDA减少半数专家计算且保持精度。

可信度: 8/10 – 1项声明可直接验证;3项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: 50% of expert computation removed, with almost no loss in accuracy (需查阅论文原文或实验数据验证计算量减少比例和精度损失情况,但推文未提供直接链接或具体实验细节。)
  • ◐ 部分可验证: ZEDA框架可将静态MoE模型转换为高效动态模型 (需验证框架技术细节(如路由机制、零专家设计)是否在论文或代码库中公开,但推文未提供直接来源。)
  • ✓ 可验证: MoE模型在简单token上浪费专家计算资源 (可通过分析公开的MoE模型(如Qwen3、GLM)路由策略或推理日志验证此现象,但需具体数据支持。)

原文内容:

大型混合专家模型(MoE)可能将半数专家计算资源浪费在几乎不需要专家处理的词元上。

本论文移除了50%的专家计算量,几乎未造成精度损失。

这使得已训练完成的MoE模型(如Qwen3和GLM)在遇到过于简单、无需专家处理的词元时,能停止调用半数专家模块。

零专家自蒸馏适配(ZEDA)是一种低成本框架,可将训练后的静态MoE模型转化为高效动态模型。

研究表明,许多MoE词元并不需要真正的专家处理,只需获得跳过权限即可。

这看似是个简单的路由技巧,却彻底改变了语言模型部署的经济性。

标准MoE模型虽已避免使用全部参数,但仍为每个词元分配等量专家预算。

ZEDA为路由器添加了奇特的新选项:输出完全为零的专家模块。

当模型将词元路由至这些"零专家"时,并非降低模型智能,而是承认该词元无需昂贵的额外转换。

精妙之处不在于虚拟专家,而在于适配方法。

无需从头训练模型,原始MoE作为冻结教师模型,新版动态模型则学会何时可安全跳过计算。

在Qwen3-30B-A3B和GLM-4.7-Flash上的实验表明:专家计算量减少约半数,平均精度损失微乎其微,实际推理速度提升约20%。

更深层发现:计算资源消耗与任务难度并非简单线性相关。

模型在不确定性或师生分歧较高处分配更多专家预算,而结构化代码和数学片段往往需求更少。

这使得ZEDA不像剪枝技术,更像是对计算不确定性的注意力机制。

论文链接:arxiv.org/abs/2605.18643  
论文标题:《后训练MoE模型通过自蒸馏实现半数专家跳过》

⏰ 02:43 | ❤️ 124点赞 | 📝 297词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Abhishek @heyabhishek

ai cartography at Google DeepMind | 影响力: 0万粉丝

💡 核心观点: AI快速生成动漫分镜并制作动画短片。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◦ 观点: AI anime storytelling is crazy now (该声明是主观评价,无客观事实依据,无法验证其准确性。)
  • ◐ 部分可验证: I used ChatGPT Image 2.0 to create an entire anime short film storyboard. (可通过实测或查看ChatGPT Image 2.0的功能文档验证其是否支持生成故事板,但需用户实际操作确认具体效果。)
  • ◐ 部分可验证: Seedance 2.0 turned it into a cinematic animated scene in minutes. (可通过Seedance 2.0的官方功能说明或实测验证其是否支持快速生成动画场景,但具体效果需进一步测试。)

原文内容:

AI动漫叙事如今已疯狂到这种程度

我用ChatGPT Image 2.0生成了完整动漫短片分镜脚本

随后Seedance 2.0在几分钟内将其转化为电影级动画场景

附分步教程及提示词:

⏰ 23:39 | ❤️ 666点赞 | 📝 35词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 黄仁勋认为工程师应专注解决问题而非写代码。

可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: Jensen Huang表示,没有什么比他的工程师完全不编码更让他高兴了。 (可通过NVIDIA官方发布的演讲视频、采访记录或公司声明直接验证,属于公开的企业家言论。)
  • ◐ 部分可验证: Jensen Huang认为工程师应专注于解决未发现的问题,而非编码。 (需结合其完整演讲或采访上下文确认具体表述,可能涉及主观解释,但核心观点可通过公开资料部分验证。)
  • ◦ 观点: Jensen Huang提出’Purpose vs Task’框架,认为编码仅是应最小化(理想归零)的任务。 (属于个人管理理念或愿景陈述,无客观标准验证其合理性,但可通过其公开演讲确认是否提出过该框架。)

原文内容:

黄仁勋表示,如果他的工程师们完全不用写代码,而是专注于解决尚未被发现的问题,那将是他最大的喜悦。

他的核心理念是"目标与任务"的区分——写代码只是任务环节,应当尽可能减少(理想状态下归零)。

⏰ 22:32 | ❤️ 138点赞 | 📝 43词 | 查看原文 →

↑ 返回顶部

【AI 英文奏折】05月25日Amira Zairi @azed_ai

AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝

💡 核心观点: 将品牌logo转化为精确折纸雕塑的3D渲染,保留原比例与色调。

可信度: 10/10 – 3项声明可直接验证;1项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: 使用[品牌]官方认证的品牌调色板 (可通过品牌官网、官方品牌指南或公开的品牌视觉识别手册直接验证调色板的准确性和授权使用情况。)
  • ◐ 部分可验证: 保留[logo]的精确形状和比例 (需对比原始logo设计文件与3D渲染成品的尺寸数据,但若未公开原始设计文件或渲染工程文件,则只能通过视觉对比部分验证。)
  • ✓ 可验证: 8K分辨率、无水印、无额外文本 (可通过检查渲染输出文件的元数据(分辨率)、视觉审查(水印/文本)直接验证,属于客观技术参数。)

原文内容:

创作一幅超精细超写实的3D渲染图,将[logo]转化为优雅的折纸雕塑,呈现清晰建筑几何结构、精炼的层叠平面、精准的折叠边缘、细腻的纸张纤维纹理、真实的材质厚度、微妙的折痕、柔和的结构阴影、手工雕刻的精致感,在保持标志原始形状与比例的前提下,采用[brand]官方品牌标准色板,所有折纸表面均使用精确匹配的品牌色调,构图平衡,具有高端商业摄影美学质感,纯白无缝背景隔离,采用突出造型与立体感的柔光棚拍布光,自然接触阴影,微距细节呈现,极致锐利对焦,照片级真实感,8K分辨率,1:1比例,无水印无附加文字。

⏰ 22:02 | ❤️ 20点赞 | 📝 106词 | 查看原文 →

↑ 返回顶部

© 版权声明

相关文章

暂无评论

暂无评论...