【AI 英文奏折】06月30日

x每日奏折3周前发布 tianming

66 0 0

【AI 英文奏折】2026年06月30日

共收录 20 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

AshutoshShrivastava: 作者开源IRIS项目并欢迎反馈与改进。
Rohan Paul: 出口管制促使中国开源AI加速发展，基建优势将增强竞争力。
Ethan Mollick: 大语言模型通用性强，能力全面且相互促进。
SemiAnalysis: CXMT跻身全球DRAM四强，扩产施压巨头但仍存挑战。
SemiAnalysis: 内存短缺持续支撑市场，长鑫存储难改供应紧张格局。
Machina: LinkedIn招聘效率低，新工具通过全网搜索精准匹配人才。
Aakash Gupta: Barstool媒体价值与博彩监管冲突致PENN巨亏9亿。
Rohan Paul: AI将动画成本降90%，冲击好莱坞就业。
Rohan Paul: AI发展迅猛但投资过热，修正风险影响广泛。
Rohan Paul: AI代理可加速科学论文验证，缓解研究产出与审查速度失衡问题。
Aakash Gupta: 产品经理工作正分化为人类判断与自动化处理两部分。
Aakash Gupta: AI代理将取代IDE，编程转向清晰描述需求即可执行。
Chubby♨️: Meta非侵入式脑机接口实现61%单词准确率，推动开放研究。
Aakash Gupta: Meta研发非侵入式脑解码器，可实时重建语义句子但硬件受限。
Amira Zairi: 炭笔素描提示强调粗砺纹理、大胆线条和情感深度。
Alex Prompter: Linux VPS性价比远超高价Mac，适合运行AI代理。
Ethan Mollick: 领导层缺乏AI使用决策导致令牌成本问题。
levelsio: 超市设计诱惑消费且多超加工食品，应只买外围新鲜食材或线上订购。
Aakash Gupta: 克劳德代码团队通过快速迭代和通用模型培养多角色技术成员。
Aakash Gupta: AI原生公司的核心挑战是让非技术人员高效调用自动化技能。

📖 详细内容

AshutoshShrivastava @ai_for_success

| 影响力: 0万粉丝

💡 核心观点: 作者开源IRIS项目并欢迎反馈与改进。

可信度: 10/10 – 4项声明可直接验证；1项需进一步确认

事实核查:

✓ 可验证: 作者已将IRIS（Gemini Live + Hermes Agent）项目的代码和GitHub仓库公开 (可通过检查推文评论区或访问GitHub搜索项目名称直接验证仓库是否存在及是否公开。)
✓ 可验证: 后端和架构的大部分内容是用GPT-5.5构建的 (GPT-5.5并非公开模型（当前主流模型为GPT-4及以下），且开发工具链的细节通常无法通过代码仓库直接验证，需依赖作者单方面声明。)
✓ 可验证: Claude Opus 4.8帮助润色了前端和UI (Claude Opus 4.8版本未公开（Anthropic最新模型为Claude 3系列），且AI辅助开发的贡献程度无法通过代码或文档客观验证。)

原文内容:

谢谢大家。我很高兴这么多人都喜欢我的新 vibe-coding 项目 IRIS（Gemini Live + Hermes Agent）。

很多人询问了代码和 GitHub 仓库，所以我已经将项目公开。仓库链接在下面的评论中。

我很期待你们的反馈、建议和改进想法。如果你们基于它进行构建，或者找到改进它的方法，欢迎随时提交 PR。我会很乐意合并有用的改进，让大家都能受益。

希望你们喜欢用它进行实验。

后端和架构的大部分内容都是用 GPT-5.5 构建的，而 Claude Opus 4.8 则帮助润色了前端和 UI。

⏰ 18:23 | ❤️ 202点赞 | 📝 153字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 出口管制促使中国开源AI加速发展，基建优势将增强竞争力。

可信度: 6/10 – 2项需进一步确认；3项为观点陈述

事实核查:

◦ 观点: 中国的开源 AI 可能会变得比以往任何时候都更强大 (这是基于Aravind Srinivas的主观推断，缺乏具体数据或公开报告直接支持这一未来趋势的预测。)
◐ 部分可验证: Anthropic 极力游说实施出口管制 (Anthropic的游说行为可能通过美国公开政治献金数据库或游说记录部分验证，但需具体查询其针对“AI出口管制”的直接证据。)
◦ 观点: 开源模型与前沿模型存在12个月差距的唯一原因是出口管制 (技术差距的归因涉及复杂因素（如研发投入、算法创新等），将差距单一归咎于出口管制是主观判断，无直接数据支持。)

原文内容:

Aravind Srinivas 刚刚解释了为什么中国的开源 AI 可能会变得比以往任何时候都更强大。

以及为什么 Anthropic 极力游说实施出口管制。

“开源模型与前沿模型之间甚至存在 12 个月差距的唯一原因是出口管制。

但因此，他们现在有机会在物理层上真正变得出色。

他们（中国）的一个优势是，他们实际上可以更快地建造数据中心。电力不成问题。许可不成问题。人力不成问题。劳动力不成问题。专业知识不成问题。

因此，通过迫使他们出去建造这一切，你实际上是在将他们转化为一个远更强大的竞争者。”

---

摘自“YouTube 频道‘20VC with Harry Stebbings’”（@HarryStebbings ），链接见评论

⏰ 10:19 | ❤️ 28点赞 | 📝 199字 | 查看原文 →

↑ 返回顶部

Ethan Mollick @emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech. Author of Co-Intelligence | 影响力: unknown万粉丝

💡 核心观点: 大语言模型通用性强，能力全面且相互促进。

可信度: 8/10 – 1项声明可直接验证；3项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 更大的、在编码方面更强的语言模型，也会更好地进行创意构思 (可通过对比不同规模模型的创意构思能力（如生成故事、诗歌等任务）进行部分验证，但“更好”缺乏统一量化标准，需依赖主观评估。)
◐ 部分可验证: 更大的、在编码方面更强的语言模型，也会更好地提供伦理建议 (可通过测试模型对伦理困境的回答与人类专家共识的匹配度验证，但伦理问题无绝对答案，验证需结合具体场景和主观判断。)
✓ 可验证: 更大的、在编码方面更强的语言模型，也会更好地处理医学和数学任务 (可通过公开基准测试（如MMLU、MATH等）直接验证模型在医学和数学领域的表现，数据可量化且可复现。)

原文内容:

大语言模型最重要、最诡异的一点是它们如此通用。一个更大的、在编码方面更强的语言模型，也会更好地进行创意构思、伦理建议、医学和数学。这并非对所有事物都适用，参差性再次显现（参见小说写作！），但它确实惊人地真实。

⏰ 09:41 | ❤️ 243点赞 | 📝 91字 | 查看原文 →

↑ 返回顶部

SemiAnalysis @semianalysis_

In-depth research on semiconductors, AI infra & hardware | 影响力: unknown万粉丝

💡 核心观点: CXMT跻身全球DRAM四强，扩产施压巨头但仍存挑战。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: CXMT 现已明确成为全球第四大 DRAM 厂商 (需通过第三方市场调研报告（如TrendForce、IDC）或行业排名数据验证，但可能存在统计口径差异或滞后性)
◦ 观点: CXMT 旨在对领先的存储供应商（如 SK 海力士、三星和美光）施加越来越大的压力 (“施加压力”属于主观商业竞争描述，无具体量化指标，需结合市场份额变化或企业战略声明间接推测)
◐ 部分可验证: CXMT 一直在扩大产能，未来几个月可能通过现金流积累支持进一步产能增加 (产能扩张可通过公司公告或行业媒体报道验证，但“现金流积累”需依赖财务报告（如未公开则无法直接验证）)

原文内容:

CXMT 现已明确成为全球第四大 DRAM 厂商，并旨在对领先的存储供应商（如 SK 海力士、三星和美光）施加越来越大的压力。虽然该公司一直在扩大产能，未来几个月内可能通过大量现金流积累来支持进一步的产能增加，但 CXMT 仍面临几个关键挑战：(1/6)

⏰ 09:27 | ❤️ 193点赞 | 📝 93字 | 查看原文 →

↑ 返回顶部

SemiAnalysis @semianalysis_

In-depth research on semiconductors, AI infra & hardware | 影响力: unknown万粉丝

💡 核心观点: 内存短缺持续支撑市场，长鑫存储难改供应紧张格局。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 长鑫存储（CXMT）的内存并不一定是“廉价”的，中国内存价格也已大幅上涨，大体跟踪了全球DRAM市场的强劲走势。 (内存价格数据可通过市场调研机构（如TrendForce、DRAMeXchange）的报告部分验证，但需确认具体时间范围和价格变动细节。长鑫存储的定价策略可能涉及非公开商业信息。)
◐ 部分可验证: 长鑫存储的增量产量难以实质性松动DRAM市场，因当前供应不足的规模极大。 (DRAM供需数据可通过行业分析报告（如Gartner、IDC）验证，但长鑫存储的实际产能和市场份额需依赖其官方披露或第三方估算，可能存在信息滞后。)
✓ 可验证: DRAM超级周期由受限供应、内存含量上升、HBM晶圆吸收及AI驱动需求定义。 (行业趋势（如HBM需求、AI增长）可通过半导体巨头（三星、SK海力士）的财报或技术白皮书验证，但“超级周期”的定性属于市场解读范畴。)

原文内容:

这对内存超级周期意味着什么？

一些投资者可能将我们最近关于长鑫存储（CXMT）的研误读为内存市场的纯粹负面信号。我们认为，这种解读忽略了本轮周期的核心要点：显著的短缺。

即使长鑫存储随着时间推移继续增加晶圆和位供应，我们相信极度受限的DRAM环境仍将对所有内存供应商保持支撑。事实上，长鑫存储本身可能难以完全满足国内中国需求，更不用说像一些人担心的那样“以廉价内存充斥市场”了。

同样值得强调的是，长鑫存储的内存并不一定是“廉价”的。中国内存价格也已大幅上涨，大体跟踪了全球DRAM市场的强劲走势。换言之，长鑫存储正受益于与现有巨头相同的短缺驱动定价环境，而不是充当对抗它的通缩力量。这在以前可能成立，但这次并非如此。

因此，长鑫存储的崛起不应被视为周期终结者或对领先内存玩家的迫在眉睫威胁，而更应被视为一种长期结构性竞争力量。在短期内，DRAM供应不足的规模之大，使得长鑫存储的增量产量难以实质性松动市场。这个超级周期仍由受限供应、内存含量上升、HBM晶圆吸收以及加速的AI驱动需求所定义。（5/6）

⏰ 09:27 | ❤️ 36点赞 | 📝 387字 | 查看原文 →

↑ 返回顶部

Machina @exm7777

running ai-powered agencies | weeklyaiops.com | 影响力: unknown万粉丝

💡 核心观点: LinkedIn招聘效率低，新工具通过全网搜索精准匹配人才。

可信度: 8/10 – 1项声明可直接验证；2项需进一步确认；2项为观点陈述

事实核查:

◐ 部分可验证: LinkedIn 的一半用户都在“open to work” (LinkedIn 官方可能公布过用户状态数据（如“开放求职”比例），但需具体报告或API数据支持；若为第三方统计，需核实数据来源和方法。)
✓ 可验证: 招聘人员通过职位和经验筛选时，总是找到同一批已被其他公司联系过的人 (属于个人观察或行业经验总结，缺乏公开数据或大规模统计支持，无法直接验证普遍性。)
◦ 观点: “真正想要的人才”不会优化个人资料（无关键词、筛选标签等） (主观推断，基于对理想候选人行为的假设，无客观标准或数据证明这类人群普遍存在。)

原文内容:

LinkedIn 的一半用户都在“open to work”，而招聘人员仍然找不到人……

那里没人能被雇用，也没人能被找到——它就是一个给假装在工作的人用的社交应用

你按职位和经验筛选，每次都得到同一群上周已经被其他公司联系过的人

你真正想要的那个人根本不会优化个人资料……没有关键词，没有筛选，没有“我很高兴地宣布”

所以这些人开发了一个工具，你描述一下那个人，它就会去找到他们，它会搜索整个实时网络上的 10 亿个资料，评估匹配度，返回经过验证的电子邮件

⏰ 02:05 | ❤️ 21点赞 | 📝 180字 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝

💡 核心观点: Barstool媒体价值与博彩监管冲突致PENN巨亏9亿。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: PENN 在 Barstool 上亏损了 9.23 亿美元，并以 1 美元的价格将其卖回给 Dave (PENN Entertainment 的财务报告或官方新闻稿可能披露收购和出售 Barstool 的具体金额及交易条款，但需核实“9.23 亿美元亏损”是否包含隐性成本（如运营损失）。1 美元的交易细节可能通过公司公告验证，但需确认是否存在附加条款（如未来收益分成）。)
✓ 可验证: Barstool Sportsbook 的美国市场份额最高仅 2.2%，远低于 DraftKings 和 FanDuel (第三方市场研究机构（如 Eilers & Krejcik Gaming）或州博彩监管机构会公开各平台的市场份额数据，可通过行业报告直接验证这一数值及竞争对手占比。)
✓ 可验证: PENN 与 ESPN 的 10 年合作协议价值 15 亿美元现金加 5 亿美元认股权证 (PENN 或 ESPN 的官方新闻稿、SEC 备案文件会披露合作细节及具体金额，例如 PENN 的 8-K 文件或财报中的“重大交易”部分。)

原文内容:

PENN 并没有在 Barstool 上亏损 5.51 亿美元。他们亏损了 9.23 亿美元，把公司以一美元的价格卖回给 Dave 反而是其中最便宜的部分。

事情的真相是这样的。PENN 收购 Barstool 是为了将其作为自家体育博彩业务的客户渠道：利用内置的年轻男性受众进行低成本注册。这些受众确实出现了。但赌徒们没有。Barstool Sportsbook 的美国市场份额最高也就停留在 2.2% 左右，而 DraftKings 和 FanDuel 则瓜分了大部分市场。

然后真正的问题浮出水面。博彩牌照是按州颁发的，每个监管机构都有发言权。马萨诸塞州在该平台上线前就已经开始盘问 PENN 关于 Dave 过去的言论。正是让 Barstool 在媒体领域价值 5 亿美元的锋芒，在这种一个州的一个委员就能冻结你牌照的行业里，却成了放射性毒药。

于是 PENN 花钱来拆解整个局面。他们以 1 美元的价格把 Barstool 还了回去，保留了未来任何出售交易的 50% 收益，并转向与 ESPN 的 10 年合作协议，价值 15 亿美元现金外加 5 亿美元认股权证。他们甩掉了一个花了 5.51 亿美元的争议品牌，换成了一个安全但成本高出三倍的新品牌。

真正该让你停下来思考的部分是：这个新尝试也失败了。ESPN Bet 从未达到预期目标，现在 PENN 正在关闭它，并付钱给 ESPN 让其脱身。在 Barstool 之前，他们已经在 theScore 上砸了 20 亿美元。一样的剧本，一样的结果。

三个媒体品牌。超过 40 亿美元的投入。没有一个能把受众转化为能抢占市场份额的体育博彩平台。

Dave 以 1 美元买回的交易确实是一笔绝妙的买卖。更宏大的故事是另一边的公司，三次进行同样的实验，却次次惨败。

⏰ 20:27 | ❤️ 915点赞 | 📝 490字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI将动画成本降90%，冲击好莱坞就业。

可信度: 9/10 – 2项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: 人工智能正在推动动画行业走向成本崩溃 (需通过行业报告、财务数据或制片方公开声明验证AI对成本的具体影响，但“成本崩溃”属于趋势性描述，缺乏具体数据支持。)
◐ 部分可验证: 故事片制作成本可能下降90% (需核实彭博社原文中是否引用具体案例或制片人言论，但“可能”表明是预测性声明，实际降幅需长期数据验证。)
✓ 可验证: 好莱坞就业受到罢工、生产减少、合并及AI重组压力 (罢工（如2023年编剧工会罢工）、裁员新闻及企业合并（如华纳探索合并）可通过公开报道验证，但AI的具体影响需结合行业分析。)

原文内容:

彭博社报道：人工智能正将动画产业推向成本断崖式下降。好莱坞电影人表示，随着制片厂、从业人员和工会为即将缩减的人力岗位做准备，故事片制作成本可能骤降90%。

当前好莱坞就业市场已因罢工潮、产量缩减、企业并购及人工智能驱动的行业重组而承压。

⏰ 15:05 | ❤️ 232点赞 | 📝 97字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI发展迅猛但投资过热，修正风险影响广泛。

可信度: 6/10 – 1项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 人工智能的发展速度比正常的科技繁荣模式快得多。 (可通过对比历史科技发展数据（如互联网、移动互联网等）与AI领域当前的投资、专利或应用增长数据间接验证，但“正常科技繁荣模式”缺乏明确定义，需进一步分析标准。)
◦ 观点: 人工智能可能成为数十年来最重要的平台变革。 (这是主观预测性陈述，无具体量化指标或客观事实支撑，属于行业观点或愿景。)
✓ 可验证: 国际清算银行报告指出，AI相关股市修正可能比以往影响更广泛，因家庭持有股票比例更高。 (可通过国际清算银行（BIS）官网或公开报告（如2024年6月报告）直接验证其结论，家庭持股比例也可通过央行或统计局数据交叉验证。)

原文内容:

FT 的图表：人工智能并未遵循正常的科技繁荣模式。它的发展速度要快得多。

人工智能可能成为数十年来最重要的平台变革。但投资周期现在如此激进，以至于对真正商业回报的标准正在非常快地变得非常高。

国际清算银行昨天的最新报告指出，与人工智能相关的股市大幅修正今天可能产生比以往更广泛的影响，因为家庭现在持有的股票相对于他们的财富和收入来说更多。

---

ft .com/content/e81ce414-e4bd-4e8c-bac7-94f7bf17def4

⏰ 16:18 | ❤️ 99点赞 | 📝 155字 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI代理可加速科学论文验证，缓解研究产出与审查速度失衡问题。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 谷歌发布了一篇关于科学外部代理验证的新论文，并提出了“验证债务”的概念 (可通过提供的arXiv链接（arxiv.org/abs/2606.28277）直接查看论文标题和内容，确认其存在及核心框架)
◐ 部分可验证: 谷歌的Paper Assistant Tool能通过拆分论文、检查错误和实验空白等方式辅助科学审查 (论文中可能描述工具功能，但需实测或官方文档进一步验证其具体实现和效果)
◐ 部分可验证: Paper Assistant Tool在STOC和ICML的试点中帮助作者发现证明错误并修复理论空白 (论文可能提及试点结果，但需独立数据或第三方报告验证具体案例和作者反馈)

原文内容:

谷歌针对科学外部代理验证发布重大新论文。

科学现在需要 AI 审查代理，因为 AI 正在以比人类检查速度更快的速度生成论文。

问题是 AI 可以帮助产生更多研究，但缓慢的部分仍然是检查工作是否真正正确。

该论文将此框架为验证债务，其中每个更快的研发流程都会产生更多声明、证明、实验和比较，这些仍需有人检查。

其主要提议是代理验证，其中 AI 代理通过将论文拆分成部分、深入检查困难章节，并将发现整合成审查来帮助审稿。

谷歌的 Paper Assistant Tool 是示例系统，它专注于客观检查，如证明错误、实验空白、缺失比较和不清晰声明，而不是最终接受或拒绝决定。

作者在已知数学和计算机科学论文错误上测试了它，并在 STOC 和 ICML 的面向作者试点中测试，在那里作者在提交前使用了它。

惊人结果是 Paper Assistant Tool 发现了远超单次模型调用的已知证明错误，许多作者表示它促使他们修复严重的理论空白或运行新实验。

关键在于，科学审查可能需要自己的 AI 技术栈，包括审查代理、明确角色和人类监督，因为论文生成也在部分自动化。

----

链接 – arxiv.org/abs/2606.28277

标题："利用谷歌的 Paper Assistant Tool 实现科学审查自动化"

⏰ 07:19 | ❤️ 28点赞 | 📝 382字 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝

💡 核心观点: 产品经理工作正分化为人类判断与自动化处理两部分。

可信度: 10/10 – 3项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 如今产品经理今天所做的工作中有一半已经是代理的工作了 (该声明需通过具体行业调研或工作流程审计数据验证，但“一半”比例缺乏公开权威统计支持，可能依赖局部样本或主观估算。)
✓ 可验证: 信息处理类工作（如用户反馈综合、PRD初稿等）可由代理以低成本（每月约30美元）自动化完成 (可通过现有AI工具（如Notion AI、ChatGPT等）的功能和定价直接验证其成本与能力，但实际替代效率可能因具体场景而异。)
◦ 观点: 产品经理角色正分裂为人类判断（战略等）和代理处理（信息类任务）两部分，后者自动化将重塑岗位竞争逻辑 (属于对行业趋势的预测性观点，虽部分工具能力可验证，但整体角色重构尚无广泛实证数据支持。)

原文内容:

如今产品经理今天所做的工作中有一半已经是代理的工作了。大多数人只是还没有进行审计。

拿任何产品经理的工作流程，将其分解成原子步骤。将每个步骤分类到两个桶中。人类判断：品味、战略、人际关系、只有人才能负责的决策。信息处理：遵循模式、移动数据、应用规则、产生确定性输出。处理桶总是比人们预想的要大，而且这正是代理几乎无摩擦地运行的东西。

所以角色分裂了。判断部分保持人类，并变得更有价值。处理部分成为你可以本周以几杯咖啡的价格交给别人的东西：用户反馈综合、竞争对手监控、周度指标汇总、PRD 初稿、发布说明、会议准备、访谈综合。它们都不需要一个冲刺。只需一个触发器、合适的工具层级，以及在任何东西到达客户之前的一步人类审查。

这种分裂是旧运营模式的死亡证明。判断集中在更少、更宝贵的手中。处理移交给代理。仍然手动做处理部分的 PM 现在正在与自动化了它并将回收的小时花在战略和市场推广上的 PM 竞争。

上车的机会几乎侮辱性地便宜。开始免费，运行真正的东西每月约 30 美元。剩下的唯一障碍是注意到工作已经转移了。

产品经理、工程师和设计师角色如何被重建的完整拆解：

⏰ 06:09 | ❤️ 78点赞 | 📝 417字 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝

💡 核心观点: AI代理将取代IDE，编程转向清晰描述需求即可执行。

可信度: 8/10 – 1项声明可直接验证；2项需进一步确认；2项为观点陈述

事实核查:

◦ 观点: IDE 是软件开发中 40 年里最重要的工具 (这是主观评价，缺乏客观标准衡量“最重要”的工具，且未提供具体数据或广泛认可的行业结论支持。)
◐ 部分可验证: 两名工程师使用 Codex 完成了一个大型企业原本规划需要 10 名工程师和 12 个月的现代化项目，只用了三天 (若案例来自 OpenAI 或可信第三方报告（如企业公开声明），可部分验证，但需确认具体项目细节和效率对比方法；若匿名或无来源，则无法验证。)
◦ 观点: ADE（代理式开发环境）将取代 IDE，因其允许非工程师通过清晰描述任务来生成代码 (这是对未来技术趋势的预测，目前 ADE 尚未成为行业标准，且“取代”属于主观论断，无实际普及证据支持。)

原文内容:

IDE 是软件开发中 40 年里最重要的工具。它正在被取代，而它被取代的原因解释了整个 AI 转变。

IDE 的每一个功能都存在是为了让一个人更快地输入代码。语法高亮、自动补全、代码检查器、逐步调试器。所有这些都假设同一个瓶颈：一个人逐个字符地编写代码，而那个人是你的最稀缺资源。

这个假设刚刚被打破。一项原本需要工程师 10 小时的任务，现在在 Codex 或 Claude Code 中只需 10 分钟。两名工程师使用 Codex 完成了一个大型企业原本规划需要 10 名工程师和 12 个月的现代化项目。他们只用了三天。

当人类停止打字时，为打字而构建的工具就失去了存在的理由。取而代之的是一个不同的软件类别：ADE，即代理式开发环境。你向代理简要说明任务，让它们并行运行，将它们连接到 Slack、Linear、Notion、你的代码库，然后审阅返回的结果并决定什么上线。

这里是应该重塑每位非工程师如何看待自己工作的部分。IDE 要求你成为一名工程师。ADE 要求你足够清晰地描述你想要什么，以便代理能够去执行它。那项技能是委托清晰度，一名 PM、一名设计师、一名财务分析师，或一名活动策划者，可以像任何编写代码的人一样快速掌握它。

构建软件的界面刚刚停止检查你是否会编码。

Rohan Varma 是 Cursor 的首位 PM，现在在 OpenAI 构建 Codex。他和 Aakash 绘制了背后的完整运营模型：

⏰ 06:02 | ❤️ 21点赞 | 📝 430字 | 查看原文 →

↑ 返回顶部

Chubby♨️ @kimmonismus

Dream realized! Turned my love for AI into a career – sharing daily. Get my newsletter | 影响力: 225k+万粉丝

💡 核心观点: Meta非侵入式脑机接口实现61%单词准确率，推动开放研究。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: Meta 表示，Brain2Qwerty v2 能够从非侵入式脑电记录中实时解码自然句子，达到 61% 的单词准确率。 (可通过 Meta 的官方发布（如论文、技术博客或开源代码）验证技术声明，但需实际测试或第三方复现确认具体性能数据。)
✓ 可验证: 该系统使用来自 9 名志愿者的约 22,000 个句子进行训练，每人通过 MEG 在打字时记录 10 小时的数据。 (数据规模和实验设计可通过 Meta 或合作机构（如 BCBL）发布的公开数据集或研究论文直接验证。)
◐ 部分可验证: Meta 将其与之前非侵入式方法的 8% 单词准确率进行比较。其最佳参与者达到了 78%，超过一半的句子解码误差仅一个单词或更少。 (对比数据需查阅历史研究文献，而最佳参与者表现需依赖 Meta 提供的原始数据或独立实验复现。)

原文内容:

Meta 表示，Brain2Qwerty v2 能够从非侵入式脑电记录中实时解码自然句子，达到 61% 的单词准确率。

该系统使用来自 9 名志愿者的约 22,000 个句子进行训练，每人通过 MEG 在打字时记录 10 小时的数据。

Meta 将其与之前非侵入式方法的 8% 单词准确率进行比较。其最佳参与者达到了 78%，超过一半的句子解码误差仅一个单词或更少。

这仍然是受控的实验室研究：参与者数量少、使用 MEG 硬件、主动打字数据，以及公司报告的结果。尚未成为临床通信设备。

Meta 正在发布训练代码，而 BCBL 正在发布 v1 数据集，推动脑机文本研究进一步融入开放神经科学基础设施。

我对未来超级兴奋。

⏰ 05:49 | ❤️ 293点赞 | 📝 208字 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝

💡 核心观点: Meta研发非侵入式脑解码器，可实时重建语义句子但硬件受限。

可信度: 9/10 – 2项声明可直接验证；3项为观点陈述

事实核查:

✓ 可验证: Meta在《自然》杂志发表了一种非侵入式大脑解码器Brain2Qwerty v2，基于9名志愿者22,000个打字句子的MEG数据训练 (可通过查询《自然》杂志官网或Meta官方研究发布渠道确认论文发表及实验设计细节（如参与者数量、数据规模）。)
◦ 观点: Brain2Qwerty v2字符准确率从61%提升至69%，最佳参与者单词准确率从48%提升至78%
◦ 观点: MEG设备重数百磅、需磁屏蔽、成本超200万美元，限制临床应用

原文内容:

Meta 刚刚在《自然》杂志上发表了一种非侵入式大脑解码器。以下是这些数字的真正含义。

Brain2Qwerty v2 在 9 名志愿者输入的 22,000 个打字句子中训练，每人佩戴 MEG 头盔 10 小时。该系统逐毫秒读取神经元放电产生的磁场，并通过微调的大型语言模型实时重建预期的句子。

从 v1 到 v2 的飞跃：字符准确率从 61% 提高到 69%。最佳参与者的单词准确率从 48% 提高到 78%。这个 30 个百分点的单词准确率提升是没人正确解读的头条。

字符准确率和单词准确率不是同一个指标。正确识别单个字母是个低门槛。从原始 MEG 信号中实时、按序正确识别完整单词，需要模型更接近语义预测而非简单转录。在 78% 的准确率下，该系统是在重建含义，而非仅是击键。

限制在于 MEG 设备。它不是你上班戴的头盔。它重达数百磅，需要磁屏蔽，成本超过 200 万美元。研究是有效的。硬件是为什么你明年不会在医院看到它的原因。

重要的是架构证明了什么。不经手术、不用植入物，对原始脑信号进行端到端深度学习，现在可以以接近正常认知的速度恢复语义连贯的句子。仅靠训练数据（从 2,000 个句子到 22,000 个句子驱动了这个差距）的扩展曲线表明，该系统对数据的需求是可以解决的。

医疗目标是闭锁综合征、ALS 或严重中风患者。对他们来说，MEG 的重量和成本无关紧要。你把机器推到床边即可。

⏰ 05:29 | ❤️ 35点赞 | 📝 440字 | 查看原文 →

↑ 返回顶部

Amira Zairi @azed_ai

AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝

💡 核心观点: 炭笔素描提示强调粗砺纹理、大胆线条和情感深度。

可信度: 8/10 – 2项声明可直接验证；1项为观点陈述

事实核查:

✓ 可验证: 该推文描述的是一幅炭笔素描的创作提示，包含原始纹理、表现力阴影、大胆线条等具体特征 (推文内容本身是公开的，其描述的创作提示（如炭笔素描的纹理、阴影、线条等）可直接通过阅读推文验证，属于明确的文字陈述)
◦ 观点: 该提示能营造出“粗砺的未经雕琢的优雅、戏剧性对比、情感深度”等艺术效果 (“优雅”“戏剧性对比”“情感深度”是主观审美评价，无客观标准，取决于个人感受或艺术解读，无法通过事实验证)
✓ 可验证: 用户需尝试该提示并分享作品 (推文明确包含行动呼吁（“试试看并分享你的作品”），属于可验证的指令性陈述)

原文内容:

提示分享：粗砺炭笔

提示：一幅 [主体] 的炭笔素描，原始而富有纹理，带有富有表现力的阴影、大胆的线条工作，以及可见的手绘痕迹。背景充满了晕染的渐变、粗糙的速写本纹理，以及柔和的炭笔粉尘，营造出粗砺的未经雕琢的优雅、戏剧性的对比、情感深度，以及精致艺术研究的审美。

试试看并分享你的作品

⏰ 19:04 | ❤️ 173点赞 | 📝 123字 | 查看原文 →

↑ 返回顶部

Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: Linux VPS性价比远超高价Mac，适合运行AI代理。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 一个每月30美元的Linux VPS（12 vCPU/24GB内存）可替代3000美元的Mac运行AI代理 (VPS性能和价格可通过云服务商（如AWS、DigitalOcean）官网验证，但“替代Mac”需实测对比AI任务效率、延迟等，依赖具体工作负载。)
✓ 可验证: Mac在运行Codex和Claude Code时会出现热节流问题 (Mac散热限制导致的性能降频问题有大量第三方测试报告（如NotebookCheck等），但具体到Codex/Claude场景需结合用户配置验证。)
✓ 可验证: Linux VPS方案允许合上Mac盖子后任务持续运行 (远程服务器任务不受本地设备状态影响是基础特性，但需确认VPS稳定性（如网络中断风险）。)

原文内容:

别再花 3000 美元买 Mac 来运行 AI 代理了。一个每月 30 美元的 Linux VPS 做得更好。

我一直看到同样的循环。有人同时运行 Codex 和 Claude Code，他们的 Mac 热节流了，他们的第一反应就是花 3000 美元买一台更大的机器。

真正的解决方案每月只需 30 美元。一个配备 12 个 vCPU 和 24GB 内存的 Linux VPS 可以轻松运行每个代理、每个构建和每个开发服务器。你的 Mac 只负责显示，而真正的工作在 VPS 上进行。当你合上盖子时，一切都继续运行。

这个家伙详细讲解了确切的设置过程。大约需要 20 分钟。

⏰ 05:00 | ❤️ 67点赞 | 📝 164字 | 查看原文 →

↑ 返回顶部

Ethan Mollick @emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech. Author of Co-Intelligence | 影响力: unknown万粉丝

💡 核心观点: 领导层缺乏AI使用决策导致令牌成本问题。

可信度: 4/10 – 2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 令牌成本在组织中成为问题的很大原因在于领导层没有就如何使用AI做出决策 (可通过企业内部调研或行业报告间接验证领导层决策与令牌成本问题的关联性，但具体因果关系需结合组织内部数据，公开信息通常无法直接证实。)
◦ 观点: 通过配给智能解决令牌成本问题是一种相当粗糙的策略 (这是对策略效果的主观评价，缺乏客观标准或公开数据支持“粗糙”的结论，可能因具体实施方式而异。)
◐ 部分可验证: 组织未决定因AI使用需要改变哪些流程或如何思考多人使用问题 (部分企业可能公开其AI流程调整案例（如白皮书），但大多数组织的内部决策细节未公开，需依赖有限案例或员工透露的信息。)

原文内容:

令牌成本在组织中成为问题的很大原因在于，领导层没有就如何使用 AI 做出决策，也没有决定因此需要改变哪些流程，以及如何思考多人使用的问题。

首先通过配给智能来解决这个问题是一种相当粗糙的策略。

⏰ 04:40 | ❤️ 262点赞 | 📝 86字 | 查看原文 →

↑ 返回顶部

levelsio @levelsio

Nomad List & Remote OK. Building in public. Solo maker. | 影响力: 320.0k万粉丝

💡 核心观点: 超市设计诱惑消费且多超加工食品，应只买外围新鲜食材或线上订购。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 超市售卖的食物有>75%是超加工食品 (需通过超市商品分类统计或食品行业报告验证，但不同超市、地区可能存在差异，且“超加工食品”定义需明确标准（如NOVA分类）。)
✓ 可验证: 收银台附近的通道高达97.5%是超加工食品 (缺乏具体超市名称、样本量或研究来源，数据过于精确但未提供依据，可能为个人观察或推测。)
✓ 可验证: 超市外围区域（如乳制品、肉类、蔬菜区）提供新鲜食品，中心区域多为加工食品 (可通过实地考察或超市布局图验证，多数超市确实将生鲜类商品布置在外围，属常见商业策略。)

原文内容:

在我看来，你永远不该去超市，始终要避免，它们设计出来是为了赚钱，而不是让你保持健康，而且那里售卖的食物有>75%是超加工食品

在收银台附近的通道甚至高达97.5%是超加工食品！

这一切都用极具吸引力的包装来营销，让你忍不住买下，这就是为什么我尽量不去超市，因为我也很容易上当

这里有人提到的一招，如果你非要去超市的话，就是只沿着外围走，那里才有新鲜的东西，比如乳制品、肉类、蔬菜

永远不要走进中心 :D

我总是尽量在线上订购，避免那些垃圾

⏰ 04:27 | ❤️ 318点赞 | 📝 186字 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝

💡 核心观点: 克劳德代码团队通过快速迭代和通用模型培养多角色技术成员。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 在Anthropic，产品经理、设计师和财务人员都会写代码，且头衔均为“技术人员成员” (可通过Anthropic官网或员工公开资料（如LinkedIn）部分验证头衔和跨职能角色，但“所有人均写代码”需内部实践佐证，可能涉及未公开的运营细节。)
✓ 可验证: 克劳德代码团队通过模型审查每个拉取请求（PR），模型能捕捉大多数错误 (模型审查PR的具体流程和错误捕捉率属于内部技术细节，未公开数据或第三方报告支持，仅能依赖团队单方面描述。)
✓ 可验证: 团队在发布代理团队前尝试了数百个版本，80%迭代未发布 (迭代数量和淘汰比例属于内部开发数据，缺乏公开记录或第三方验证，无法独立核实。)

原文内容:

鲍里斯·切尔尼刚刚绘制了克劳德代码团队中正在形成的5个角色。

这些都不是职位头衔。

在Anthropic，产品经理会写代码，设计师会写代码，甚至财务人员也会写代码。每个人都拥有相同的头衔：技术人员成员。

他们通过一种独特的结构实现了这一切：

◆ 他们不写PRD
他们先构建。当他们推出代理团队时，在一个版本最终发布之前，他们尝试了数百个版本。

◆ 他们预期大多数原型会夭折
你在克劳德代码工作时看到的那个小旋转器花了50到100次迭代才完善，而其中大约80%从未发布。

◆ 他们以比声音还快的速度发布
Cowork，一个专为非工程师设计的完整产品，在大约十天内就完成了。

◆ 克劳德代码在人类审查之前审查每个拉取请求
模型在第一遍就捕捉到大多数错误，然后工程师进行最终审查。

◆ 他们押注通用模型
团队坐的地方墙上挂着一幅裱起来的《苦涩教训》复印件。通用模型每次都击败专用模型。

这导致了五种子类型，这是鲍里斯识别出的：

1. 原型设计师，他们知道大多数想法会夭折，却仍会启动数十个想法
2. 构建者，他们将幸存者转化为生产代码
3. 清扫者，他们简化系统并取消不产生价值的那些
4. 成长者，他们拿一个已发布的作品并推动它向合适的方向发展
5. 维护者，他们让一个成熟系统在扩展时保持快速和可靠

这些不是固定的角色。一个人会根据产品那周的需求在它们之间切换。

因此，产品经理的前进之路很清晰。当你的工程师每个都能同时运行多个代理时，速度就不再是瓶颈。瓶颈变成了房间里是否有人能区分出哪个原型会变成产品，哪个会烧掉一个季度。如果那个人是你，你的价值将大幅提升。

以下是该技能的完整分解：https://news.aakashg.com/p/taste-at-speed…

要深入了解，这里是你需要的东西：

1. AI原生运营模型，按角色划分：https://news.aakashg.com/p/ai-product-operating-model…
2. 我用来这样工作的克劳德代码设置：https://news.aakashg.com/p/pm-os
3. 非技术产品经理如何这样工作：https://youtube.com/watch?v=bYiXxeinhbg…
4. 为什么评估正成为新的PRD，与Braintrust CEO Ankur Goyal：https://open.spotify.com/episode/3G8GQNjgPiqEUZhuAEJtFG…

你不需要新头衔或任何人的许可就能开始。本周构建五个版本的东西，并保留那个赢得一席之地的版本。那种判断可能是产品经理现在能做的最有价值的尝试。

⏰ 04:27 | ❤️ 22点赞 | 📝 705字 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝

💡 核心观点: AI原生公司的核心挑战是让非技术人员高效调用自动化技能。

可信度: 6/10 – 1项声明可直接验证；1项需进一步确认；2项为观点陈述

事实核查:

◦ 观点: 创建 AI 原生公司的核心难题是让非 AI 原生员工在正确时间运行正确技能，而非技能构建本身 (该声明是对管理难点的主观判断，未提供具体案例或数据支持，属于经验性观点。)
◐ 部分可验证: 客户成功经理的上午任务通过 Slack 自动排序推送，包含 5 个按优先级执行的 AI 技能（如生成移交文档、会议简报等） (若推文附带的截图或产品演示公开可见，可部分验证功能存在性，但实际效果需实测或用户反馈确认。)
✓ 可验证: Laurel 系统将管理决策编码为优先级队列，替代人工判断，实现团队任务自动分配 (未提供 Laurel 系统的公开技术文档、案例或第三方证据，无法独立验证其运作机制和效果。)

原文内容:

创建一家 AI 原生公司最困难的问题，从来都不是构建技能本身。问题是让那些非 AI 原生的人在正确的时间运行正确的技能。这个截图是我第一次看到这个问题真正被解决。

你看到的是客户成功经理的整个上午，被推送到 Slack 中作为一个按紧急程度排序的行动队列。

上午 9 点前，两个技能为 Meridian 移交触发。其中一个获取原始实施笔记，并构建一个 7 节的移交文档，在任何人进入房间前标记缺失的合规配置。另一个生成会议简报，包括必须说的要点和必须避免的失败模式。

10:30 前，一个管理员健康检查拉取下一个客户的数据，并生成一个 30 分钟的议程加上采用快照。

中午前，一个针对第一周律师事务所群体的入职简报，然后是一个信号分发器，扫描停滞用户并在通话前起草外联。

五个技能，按序排列。CSM 不需要选择它们。他们不需要知道技能库的存在。他们打开 Slack，然后按编号列表逐一完成。

这是大多数公司卡住的 1% 与 99% 的问题。团队中的 1% 可以在一个下午写出这些技能。障碍是其他 99%，他们不知道哪些技能存在，哪个适合眼前的任务，或者该按什么顺序做任何事。

Laurel 将那个判断本身编码在内。队列决定今天什么重要，按优先级排序，并为每一步移交确切的工具。

一个伟大的经理每天早上都这样做：巡视现场，告诉每个人该关注什么以及按什么顺序，然后指向正确的工具。他们将那个经理压缩成一条消息，一次发送给整个团队。

技能库只是容易的一半。那个引导你到正确技能的晨间队列才是真正的产品。

⏰ 03:56 | ❤️ 127点赞 | 📝 520字 | 查看原文 →

↑ 返回顶部

# x每日奏折