【AI 英文奏折】2026年07月02日
共收录 20 篇深度内容
📋 今日内容速览
快速浏览,点击感兴趣的推文查看详细分析
- Santiago Valdarrama: AG-UI简化了构建具有状态交互功能的智能代理应用。
- Machina: 用户不满Anthropic新版模型性能下降且消耗配额多。
- Niels Rogge: 作者用AI工具自动完成HuggingFace工作并分享经验。
- Rohan Paul: AI使用转向高价值用户,单个超级用户算力消耗堪比团队。
- SemiAnalysis: 美国出口管制解禁后首个下线的前沿AI模型Mythos重新上线。
- Amira Zairi: Runway的Seed Audio 1.0能用文本生成2分钟语音音乐音效。
- Rohan Paul: MCP服务器需清晰设计以避免LLM混淆工具。
- Sakana AI: Fugu登陆OpenCode,倡导开放协作的智能编程生态。
- AshutoshShrivastava: Fable 5物理测试最优但成本最高,Opus性价比最高。
- Google Gemma: 代理内核优化提升设备端推理速度至255 tok/s
- clem 🤗: 开源AI更安全,因更多人可监督改进。
- Riley Brown: Fable 5用高成本生成高质量AI游戏。
- Santiago Valdarrama: 开发者对AI的负面情绪因裁员担忧加剧。
- Peter Steinberger: 寻求旧金山半私密编程空间供团队短期开发使用。
- Ti Morse: Valar首创核反应堆为NVIDIA供电,面临制造与规模化挑战。
- Aakash Gupta: 科学家用血液培育人类卵细胞,实现不限年龄生育。
- Aakash Gupta: ESPN驱逐创始人的合作失败,对方反成赢家。
- SemiAnalysis: DeepSeek V4架构优化与多加速器性能分析。
- Rohan Paul: Fable 5性能最佳但成本远高于其他模型。
- Venture Twins: AI视频虚假宣传生发产品在Instagram上大获关注。
📖 详细内容
Santiago Valdarrama @svpino
| 影响力: unknown万粉丝
💡 核心观点: AG-UI简化了构建具有状态交互功能的智能代理应用。
可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: AG-UI makes building agentic applications dramatically easier. (需实测或对比传统开发流程才能验证其“dramatically easier”的量化效果,目前缺乏公开的基准测试或案例数据。)
- ✓ 可验证: The Agent-User Interaction Protocol (AG-UI) treats the LLM response as a stream of events rather than a text endpoint. (可通过查阅AG-UI的官方文档或开源代码(若公开)确认其协议设计是否基于事件流模型。)
- ◐ 部分可验证: AG-UI provides lifecycle events, tool calls, and state updates to synchronize UI with agent actions. (功能列表(如生命周期事件、工具调用)可通过技术文档验证,但实际同步效果需依赖具体实现案例。)
原文内容:
AG-UI让构建智能体应用变得极其简单。 以下是它的工作原理。 这是一个简单聊天机器人的模型: 用户 → 大语言模型 → 响应 但需要渲染界面、暂停等待批准并向用户索要输入的交互式智能体,则需要更复杂的模型。 构建这类智能体时,大语言模型的响应会包含智能体运行过程中的一系列状态变更: • 智能体启动任务 • 智能体调用工具 • 智能体更新自身状态 • 智能体流式输出文本 • 智能体等待人工介入 • 智能体继续执行任务 Agent-User Interaction Protocol(AG-UI)将大语言模型的响应视为事件流而非文本终点。 实际运行中,您会获得以下内容: 1. 生命周期事件,让界面实时感知智能体状态 2. 流式传输的文本消息 3. 工具调用指令,界面可自动填充表单参数 4. 状态更新,保持界面与智能体同步 5. 特殊事件(人工审批、富媒体、自定义需求) 所有事件都通过标准传输协议(SSE、WebSocket或普通HTTP)以JSON格式传递。 因此,您无需自定义开发流程,就能构建与智能体进度实时同步的前端界面。 例如,构建人机协作工作流时,您可以直接集成现成组件,无需从零开发。 AG-UI由@CopilotKit团队创建,几乎适用于所有前端开发场景: • React • Angular • Vue • React Native • Slack • Teams • Discord • WhatsApp • Telegram 项目链接:https://github.com/CopilotKit/CopilotKit… 特别感谢CopilotKit团队对本篇内容的合作支持。
⏰ 23:03 | ❤️ 77点赞 | 📝 294词 | 查看原文 →
Machina @exm7777
running ai-powered agencies | weeklyaiops.com | 影响力: unknown万粉丝
💡 核心观点: 用户不满Anthropic新版模型性能下降且消耗配额多。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ✓ 可验证: Fable 5 instantly routed the task to Opus 4.8 (该声明涉及未公开的模型内部工作流程(如路由逻辑),除非官方提供技术文档或日志,否则无法验证。)
- ◐ 部分可验证: Sonnet 5 sub agents burned 30% of weekly limit (用户配额消耗比例可能通过账户后台数据验证,但“子代理”具体行为需依赖官方解释,部分信息不透明。)
- ◐ 部分可验证: Fable 5 previously built full open worlds and refactored codebases in one shot (若存在历史案例或官方演示,可部分验证,但“one shot”等描述缺乏量化标准,需具体上下文。)
原文内容:
刚刚向Fable 5发送了首个指令 > 系统瞬间将任务路由至Opus 4.8 > 随即生成五个Sonnet子代理 > 直接消耗了我30%的周额度 > 却只交回一堆垃圾 这玩意儿以前能一次性构建完整开放词库并重构整个代码库 ANTHROPIC你们到底干了什么
⏰ 07:00 | ❤️ 1061点赞 | 📝 49词 | 查看原文 →
Niels Rogge @nielsrogge
ML Engineer @HuggingFace. Building paperswithco.de | 影响力: 42.0k万粉丝
💡 核心观点: 作者用AI工具自动完成HuggingFace工作并分享经验。
可信度: 8/10 – 2项声明可直接验证;1项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: 在@aiDotEngineer活动中发表演讲,主题为利用代理自动化在@huggingface的工作 (可通过查看@aiDotEngineer或@huggingface的官方活动记录或社交媒体动态验证演讲事件,但具体演讲内容需依赖视频发布(如YouTube)或现场参与者证词。)
- ✓ 可验证: 演讲涉及Claude Agents SDK、GLM-5.2、@langfuse和@modal的技术方案 (Claude Agents SDK(Anthropic)、GLM-5.2(智谱AI)、Langfuse和Modal均为公开技术工具,其功能可通过官网文档验证,但实际集成效果需实测确认。)
- ✓ 可验证: 演讲内容将在@YouTube发布 (可通过检查演讲者或@aiDotEngineer的YouTube频道验证是否上传,但需等待未来时间点确认。)
原文内容:
很荣幸在@aiDotEngineer进行演讲! 分享了如何利用智能体技术自动化我在@huggingface的工作流程,涉及: > Claude智能体开发套件 > 通过推理供应商调用的GLM-5.2模型 > 采用@langfuse实现链路追踪 > 使用@modal完成部署 完整演讲视频稍后将在@YouTube平台发布
⏰ 04:28 | ❤️ 30点赞 | 📝 36词 | 查看原文 →
Rohan Paul @rohanpaul_ai
Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝
💡 核心观点: AI使用转向高价值用户,单个超级用户算力消耗堪比团队。
可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: A single power user can now consume as much compute as an entire small team. (需通过企业内部数据或云服务商的计算资源分配记录验证,但此类数据通常不公开。部分可验证需依赖公司内部披露或第三方调研。)
- ✓ 可验证: There are real engineers at Meta and other companies spending around $10 million a year per engineer on these coding tools. (涉及具体企业的内部成本分配,未提供公开数据来源或第三方报告支持,无法独立验证。)
- ◐ 部分可验证: There are users in Perplexity Computer who spend upwards of $10,000 a month. (若Perplexity公开高消费用户案例或订阅定价模型,可部分验证,但具体用户数据通常保密。)
原文内容:
Perplexity公司首席执行官阿拉文德·斯里尼瓦斯指出人工智能应用正悄然发生转变:高价值用户已不再是普通使用者。 如今,单个高级用户消耗的计算资源可抵整个小型团队。 "Meta等公司的资深工程师每年在编码工具上的人均投入高达1000万美元。我们的Perplexity Computer平台上有用户月均消费超1万美元——他们通过部署在计算框架内的智能体循环系统来维持业务运转。" "即便在公司内部,也有员工搭建了类似自主软件架构的多智能体层级系统。我常邀请他们向全员分享经验:'你们究竟如何运用这些工具?其使用强度显然远超我们对普通员工的预期'。" 传统软件思维追求十亿级用户的微量操作。 而智能体化AI改写了这套逻辑——一位熟练操作者即可创造全天候运行的自动化工作流。 注:内容源自Harry Stebbings的"20VC"YouTube频道(@HarryStebbings),链接见评论
⏰ 15:26 | ❤️ 185点赞 | 📝 196词 | 查看原文 →
SemiAnalysis @semianalysis_
In-depth research on semiconductors, AI infra & hardware | 影响力: unknown万粉丝
💡 核心观点: 美国出口管制解禁后首个下线的前沿AI模型Mythos重新上线。
可信度: 6/10 – 1项声明可直接验证;2项需进一步确认
事实核查:
- ◐ 部分可验证: Fable 5回归 (需通过官方公告或游戏开发商确认具体回归时间及版本细节,目前仅推文提及,无直接公开链接。)
- ✓ 可验证: Mythos因美国出口管制指令自6月12日起下线,今日重新上线 (可通过Mythos官网或官方社交媒体查看服务状态变更记录,出口管制指令可能需查阅政府公开文件。)
- ◐ 部分可验证: 这是首个因政策下架后又恢复的前沿模型,且不会是最后一个 (需核实是否有其他类似案例及政策干预记录,部分依赖行业动态或内部信息,公开数据可能有限。)
原文内容:
《神鬼寓言5》回归。 自6月12日因美国出口管制指令而离线的"被阉割版Mythos"系统,已于今日重新上线。 这是首例因政策原因下架后又恢复的前沿模型,但绝不会是最后一个。
⏰ 10:30 | ❤️ 63点赞 | 📝 37词 | 查看原文 →
Amira Zairi @azed_ai
AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝
💡 核心观点: Runway的Seed Audio 1.0能用文本生成2分钟语音音乐音效。
可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述
事实核查:
- ◦ 观点: Text-to-audio技术正在变得非常好 (“非常好”是主观评价,缺乏客观标准,无法直接验证)
- ✓ 可验证: 可通过Seed Audio 1.0在Runway中直接从文本提示生成语音、音乐和音效 (可通过Runway官网或官方文档确认Seed Audio 1.0的功能是否支持文本生成音频)
- ◐ 部分可验证: 生成的音频时长可达2分钟 (需实测或查看官方说明以确认具体时长限制,可能存在条件限制(如订阅计划等))
原文内容:
文本转音频技术正变得异常强大 现在,您可以直接在Runway平台使用Seed Audio 1.0,通过单一文本指令生成长达2分钟的语音、音乐和音效。
⏰ 00:03 | ❤️ 28点赞 | 📝 31词 | 查看原文 →
Rohan Paul @rohanpaul_ai
Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝
💡 核心观点: MCP服务器需清晰设计以避免LLM混淆工具。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: MCP服务器需要清晰的设计模式,因为当展示过多或模糊的工具时,LLM会感到困惑 (该声明基于论文观点,但需通过实际测试或查看论文实验数据(如工具数量与LLM准确性的相关性)来验证,目前缺乏公开的直接证据。)
- ✓ 可验证: 论文将真实MCP服务器分为5种实用模式(如暴露数据、运行工作流等) (可通过查阅论文原文或官方发布的分类框架直接验证其具体模式和定义。)
- ✓ 可验证: 作者提出4种常见错误(如万能工具、模糊描述等) (论文中列出的错误类型应可直接从原文或公开摘要中确认,属于可验证的事实陈述。)
原文内容:
非常及时的论文。 MCP服务器需要清晰的设计模式,因为当展示过多工具或模糊工具时,大语言模型(LLM)会陷入混乱。 本文阐述了如何构建MCP服务器架构,以确保LLM工具保持实用性、安全性和可管理性。 MCP服务器设计并非普通API设计,因为其客户端是通过阅读自然语言描述来选择工具的LLM。 研究将实际MCP服务器归纳为五种实用模式:数据暴露型、工作流执行型、会话状态保持型、多服务器整合型以及混乱领域API转译型。 作者还警示了四种常见错误:全能型巨型工具、模糊的工具描述、不安全的外部内容,以及本应返回任务ID却响应缓慢的工具。 研究团队在54个额外服务器上测试了模式标签,测量了传输延迟,并探究了工具数量增加对准确率的影响。 关键结论是:可见工具过多会损害准确率,当工具数量达到10至15个时,较弱模型的准确率会跌破90%。 优秀的MCP设计核心在于:确保工具列表精简、明确、安全且稳定,使LLM能准确选择正确操作。 ---- 链接 – arxiv.org/abs/2606.30317 标题:《面向LLM集成应用的MCP服务器架构模式》
⏰ 09:56 | ❤️ 21点赞 | 📝 195词 | 查看原文 →
Sakana AI @sakanaailabs
Building Frontier AI in Japan | Try Sakana Chat, Marlin, Fugu → sakana.ai | 影响力: unknown万粉丝
💡 核心观点: Fugu登陆OpenCode,倡导开放协作的智能编程生态。
可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述
事实核查:
- ✓ 可验证: Fugu is now available on OpenCode (可通过访问OpenCode官网或平台直接搜索Fugu是否存在来验证。)
- ◐ 部分可验证: OpenCode was our tool of choice to verify Fugu’s multi-agent orchestration models (需通过开发团队公开的技术文档或OpenCode的协作记录验证是否实际使用该工具,但若未公开细节则无法完全确认。)
- ◦ 观点: We share a core philosophy with the OpenCode team: the future of coding agents should be an open, collective ecosystem (此为团队主观理念或愿景陈述,无具体事实依据,无法客观验证。)
原文内容:
Fugu现已登陆OpenCode平台! 在开发Fugu多智能体编排系统时,我们的团队选择OpenCode作为验证模型的核心工具。 我们与OpenCode团队秉持相同的核心理念:编程智能体的未来应当是一个开放、协作的生态系统。
⏰ 09:37 | ❤️ 200点赞 | 📝 46词 | 查看原文 →
AshutoshShrivastava @ai_for_success
| 影响力: 0万粉丝
💡 核心观点: Fable 5物理测试最优但成本最高,Opus性价比最高。
可信度: 10/10 – 3项声明可直接验证;2项需进一步确认
事实核查:
- ◐ 部分可验证: Fable 5在atomic[.]chat的最新物理测试中表现最佳,但成本是Opus 4.8的6倍 (需通过atomic[.]chat的官方测试报告或独立复现实验验证具体得分和成本数据,但平台和测试方法公开,可部分验证。)
- ◐ 部分可验证: Fable 5、GPT 5.5、Opus 4.8、GLM 5.2在HTML5 canvas物理场景测试中的token消耗及费用对比 (具体token数和费用可能因模型版本、API定价或本地运行环境差异而变化,需实测或查看atomic[.]chat的原始数据。)
- ✓ 可验证: GPT 5.5在怪物卡车演示中表现略优于Fable 5 (未提供测试细节(如评分标准、场景参数),且“略优”为相对主观描述,缺乏公开基准支持。)
原文内容:
Fable 5在atomic[.]chat最新物理测试中表现最优,但其消耗成本是Opus 4.8的6倍。 测试要求四个模型构建三个具有真实物理效果的HTML5画布场景: Fable 5:62,158 tokens(3.12美元) GPT 5.5:37,753 tokens(1.14美元) Opus 4.8:22,280 tokens(0.56美元) GLM 5.2:36,246 tokens(0.08美元) Fable 5在所有三个场景中都取得了最佳综合效果。GPT 5.5表现最为接近,甚至在怪物卡车演示中略胜一筹。GLM 5.2虽未在任何场景中胜出,但它是本次测试中成本最低的模型。 该基准测试通过atomic[.]chat运行,这是一款在本地运行大型语言模型的桌面应用程序。
⏰ 09:14 | ❤️ 41点赞 | 📝 86词 | 查看原文 →
Google Gemma @googlegemma
The official home of Google’s Gemma. Lightweight, state-of-the-art open models by Google DeepMind | 影响力: unknown万粉丝
💡 核心观点: 代理内核优化提升设备端推理速度至255 tok/s
可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述
事实核查:
- ◦ 观点: Agentic kernel optimization is the future of on-device inference (该声明是对技术趋势的主观判断,无具体数据或公开标准支持,属于愿景性表述。)
- ◐ 部分可验证: @xenovacom used Fable 5 to write kernels that pushed Gemma 4 to 255 tok/s on WebGPU with M4 (若用户公开了demo或代码(如GitHub仓库),可通过复现测试部分验证性能;但需确认硬件环境(M4)、测试条件等是否一致,且”Fable 5″是否为公开工具未知。)
- ✓ 可验证: He shared the demo, so you can try in your browser
原文内容:
"代理内核优化将成为设备端推理的未来" @xenovacom 运用Fable 5编写内核,使Gemma 4在M4芯片的WebGPU环境下实现了惊人的255 tok/s速度。他分享了演示版本,你现在就可以在浏览器中亲自体验!!
⏰ 04:26 | ❤️ 1449点赞 | 📝 38词 | 查看原文 →
clem 🤗 @clementdelangue
Co-founder & CEO @HuggingFace 🤗, the open and collaborative platform for AI builders | 影响力: 405.4k万粉丝
💡 核心观点: 开源AI更安全,因更多人可监督改进。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: AI systems that are accessible or open-source are safer because more people can inspect, test, and report flaws. (开源与安全性的正相关性可通过历史案例(如Linux)或研究论文部分验证,但“更安全”是相对结论,需具体数据支撑(如漏洞修复效率对比),且“最佳消毒剂”为比喻性表述。)
- ✓ 可验证: FLARE项目由MIT、斯坦福等高校的安全与网络安全研究人员联合主导。 (可通过提供的Wired文章链接(https://wired.com/story/flare-website-ai-flaw-reporting-safety/)核实合作院校名单及项目细节,且高校参与信息通常公开透明。)
- ✓ 可验证: FLARE首次发布的功能是“标准化AI缺陷报告机制”,可让单一报告直达开发者、安全组织及注册机构。 (项目官网或Wired报道中应包含该机制的具体描述(如流程、参与方),技术文档或案例可验证其运作方式。)
原文内容:
可公开获取甚至开源的AI系统更为安全,原因很简单:更多人能够审查、测试、施压这些系统,并报告其故障或危害,从而确保开发者的责任担当。"阳光是最好的消毒剂"! 正因如此,我们自豪地携手麻省理工、斯坦福、普林斯顿、哈佛、东北大学、卡内基梅隆等院校的安全与网络安全研究者联盟,共同推动FLARE项目。 首个发布成果是面向全生态系统的AI缺陷标准化上报机制。通过单一报告即可触达相关开发者、安全机构及注册中心,确保每处发现的缺陷都能在责任明晰的前提下获得快速全域修复:https://wired.com/story/flare-website-ai-flaw-reporting-safety/…
⏰ 03:28 | ❤️ 57点赞 | 📝 119词 | 查看原文 →
Riley Brown @rileybrown
YouTuber, Builder, Educator | Weekly show @agentnative_ | Building autonomous agents | 影响力: 214.0k万粉丝
💡 核心观点: Fable 5用高成本生成高质量AI游戏。
可信度: 7/10 – 1项声明可直接验证;3项需进一步确认
事实核查:
- ◐ 部分可验证: Fable 5已回归且表现优秀 (需通过官方渠道(如Fable 5官网或更新日志)确认其是否“回归”,但“表现优秀”是主观评价,需实测或用户反馈佐证。)
- ◐ 部分可验证: 用户花费4次提示和173美元代币让Fable 5生成游戏《The race for Super Intelligence》 (代币消耗金额和提示次数可能通过平台账单或使用记录验证,但游戏生成过程需实际测试或官方功能说明确认。)
- ✓ 可验证: Fable 5具备根据用户提示生成游戏的能力 (可通过Fable 5的官方文档或公开演示验证其是否支持此类功能,但生成效果可能因提示而异(部分主观)。)
原文内容:
天啊...《寓言5》回归了,而且简直太棒了 我让《寓言5》创作一款名为《超级智能竞速》的游戏... 经过4轮提示和消耗价值173美元的代币后,《寓言5》最终生成了这款游戏。(下方附提示词)
⏰ 08:43 | ❤️ 516点赞 | 📝 34词 | 查看原文 →
Santiago Valdarrama @svpino
| 影响力: unknown万粉丝
💡 核心观点: 开发者对AI的负面情绪因裁员担忧加剧。
可信度: 8/10 – 1项声明可直接验证;2项需进一步确认;2项为观点陈述
事实核查:
- ◐ 部分可验证: People have really soured on AI over the last few weeks. Overall sentiment: very negative. (可通过社交媒体情绪分析工具(如Brandwatch、Hootsuite Insights)或近期舆情报告部分验证,但“last few weeks”的时间范围和“very negative”的定性结论需具体数据支持,且样本范围(如“developers”)可能受限。)
- ✓ 可验证: The non-tech people I know have always been either meh or thumbs down toward AI. (基于个人社交圈的观察,缺乏公开数据或代表性样本支持,无法验证普遍性。)
- ◦ 观点: Every company owner is looking at a spreadsheet right now, trying to figure out how to halve their headcount (with AI). (夸张表述(“every”“right now”)和动机推测(“trying to figure out”)属于主观推断,无具体企业决策数据佐证。)
原文内容:
过去几周,人们对人工智能的态度明显恶化。 整体情绪:极度负面。 这种感受主要来自与我交流的开发者群体。而我认识的非技术人士对AI的态度始终介于冷淡到抵触之间。 我认为企业用AI取代人力的种种讨论终于引发了大众的警觉。 推特上或许还在宣扬AI旨在帮助人类之类的陈词滥调,但现实如何大家心知肚明——此刻每位企业主都在盯着财务报表,盘算如何裁撤半数员工。 虽然局势尚不明朗,但人们(尤其是年轻一代)的态度恐怕很难扭转。
⏰ 20:30 | ❤️ 108点赞 | 📝 118词 | 查看原文 →
Peter Steinberger @steipete
Polyagentmorous ClawFather | Building at OpenAI | 影响力: unknown万粉丝
💡 核心观点: 寻求旧金山半私密编程空间供团队短期开发使用。
可信度: 9/10 – 2项声明可直接验证;2项需进一步确认
事实核查:
- ◐ 部分可验证: 推文作者正在寻找旧金山的半私人黑客空间 (可通过联系推文作者或查看其后续动态部分验证需求真实性,但具体空间是否存在或符合要求需实地考察或第三方确认。)
- ◐ 部分可验证: 该空间需供OpenClaw维护者团队短期使用 (OpenClaw是否为公开组织及其维护者身份可通过开源平台(如GitHub)部分验证,但团队具体成员及行程安排属未公开信息。)
- ✓ 可验证: 需求目的是“需要烹饪”(可能指开发或实际烹饪) (措辞含糊(“cook”可能为隐喻或字面意思),无具体背景说明,无法直接验证真实意图。)
原文内容:
我在旧金山寻找一处半私密的黑客空间,供我和几位OpenClaw维护者使用几天。我们需要大干一场。有线索请私信我。
⏰ 08:22 | ❤️ 334点赞 | 📝 31词 | 查看原文 →
Ti Morse @ti_morse
Interviewing the greats @Relentless | Forward Deployed Podcaster | 影响力: 1.1万粉丝
💡 核心观点: Valar首创核反应堆为NVIDIA供电,面临制造与规模化挑战。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: Valar成为历史上第一家使用核反应堆为NVIDIA Blackwell供电的初创公司 (需通过Valar或NVIDIA的官方公告、技术白皮书或第三方权威报道验证合作细节及技术可行性,目前缺乏直接公开的实证链接。)
- ◦ 观点: 核反应堆制造是类似SpaceX风格的难题(需解决复杂工程迭代问题) (该描述为创始人主观类比,强调工程挑战的复杂性,无客观标准界定“SpaceX风格问题”,属于个人观点。)
- ◐ 部分可验证: 核安全性与迭代速度直接相关 (核安全与开发速度的关联性需依据行业研究或监管机构报告验证,但具体到Valar的实践细节未公开,部分依赖内部数据。)
原文内容:
我与@ValarAtomics创始人@Isaiah_p_Taylor的第三次访谈。 Valar刚刚成为史上首家使用核反应堆为英伟达Blackwell芯片供电的初创企业。 0:32 制造核反应堆是个SpaceX级别的难题 2:58 从1个反应堆扩展到10个 4:31 为何人们总沉迷纸上设计而非实际建造 7:37 与现实接轨——模块化屏蔽技术 10:09 钢材比软件工程师便宜 11:09 核能领域为何充斥低效现象 16:02 转型为核能公司的心路历程 18:57 切忌自我欺骗的重要性 21:55 对关键路径的极致专注 24:54 核反应堆其实结构简单 30:35 安全系数取决于迭代速度 30:55 Valar为何必须垂直整合 35:01 丰田凯美瑞与法拉利的设计哲学 38:07 穿越单向决策之门 41:13 帽子戏法般的创新突破 46:13 战时状态工作模式 48:49 敢于做"不合理"之事 51:20 埃隆·马斯克如何灌输紧迫感 56:56 执着追求能源成本降低90%的目标 58:32 过去三年的行业变革 1:00:51 安全核反应堆的设计之道 1:13:05 向SpaceX学习——规模化优化 1:18:07 保持"不怕出丑"的勇气 1:19:50 帕尔默·勒基应对负面报道的策略 1:20:55 必然时刻的来临 1:25:26 预判未知瓶颈 1:28:08 规模化扩张 1:29:45 7月4日将成为美国核能重生之日
⏰ 05:45 | ❤️ 282点赞 | 📝 191词 | 查看原文 →
Aakash Gupta @aakashgupta
✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝
💡 核心观点: 科学家用血液培育人类卵细胞,实现不限年龄生育。
可信度: 10/10 – 3项声明可直接验证;2项需进一步确认
事实核查:
- ◐ 部分可验证: 科学家成功从一小瓶血液中培育出最早阶段的人类卵细胞 (该声明可能基于真实研究(如引用2016年小鼠实验的Hayashi和Saitou团队),但需核实最新论文或官方机构(如Conception公司)发布的实验数据。目前人类卵细胞体外成熟技术尚未广泛公开验证,且推文未提供直接文献链接。)
- ✓ 可验证: 该技术可实现“任何年龄生育遗传学子女,无需捐赠者或卵子采集” (这是对技术前景的推测,目前无公开案例支持人类血液直接转化为功能性卵细胞并成功生育。涉及生殖伦理和法规限制,实际应用远未成熟。)
- ◐ 部分可验证: Conception公司从头构建了卵泡支持系统(无需胎儿卵巢组织) (若该公司已发布技术白皮书或专利(如搜索Conception Bioscience的公开资料),可部分验证;但具体方法细节和实验数据通常未完全公开,需依赖企业披露。)
原文内容:
你的血液可能孕育你的孩子。年龄不再成为障碍。 科学家们从一小瓶血液中培育出了最早阶段的人类卵细胞。这项技术带来的可能性是:几乎在任何年龄都能拥有基因意义上的亲生孩子,无需捐赠者,也无需取卵手术。 最令人惊叹的是实现过程的技术突破。人类卵细胞无法独立发育,它只能在卵泡内成熟——周围的支持细胞会精确指示它何时进入减数分裂、何时暂停发育数年、何时完成最终成熟。一旦将卵细胞移出这个精密结构,发育便会停滞。卵细胞的存活完全依赖于其所在的器官系统。 正是这种依赖性使得研究耗时十年。2016年,林克彦与斋藤通纪曾用小鼠皮肤细胞培育出有受精能力的卵子并诞生健康幼崽,但当时必须将这些卵细胞置于真实小鼠胎儿卵巢组织中才能完成最终发育。用实验室制造的卵细胞需要真实卵巢环境,这在人类身上无法实现——既没有胎儿卵巢组织来源,也不存在符合伦理的获取途径。 Conception公司选择从零构建整个系统:一次抽血获得的细胞经重编程转化为干细胞,再定向分化为卵母前体细胞及其周围的支持细胞,最终组装成能发出与真实卵巢相同信号的微型卵巢结构。其中每个细胞都源自干细胞,实现了卵细胞与所需器官的同步培育。 现阶段成果定位:这些属于初级卵母细胞,处于发育最早期阶段。人类卵母细胞需要数月才能达到成熟可用的窦卵泡阶段。更深层的挑战在于:将成体细胞逆转为卵细胞意味着个体一生中积累的基因突变可能遗传给下一代,因此安全性标准极其严苛。 小鼠实验已实现全流程验证并产出健康存活后代。这是首次证明人类可以仅凭一次抽血就培育出包含卵细胞及其支持器官的完整结构。接下来的所有工作都将围绕临床应用的安全性验证展开。
⏰ 08:03 | ❤️ 25点赞 | 📝 338词 | 查看原文 →
Aakash Gupta @aakashgupta
✍️ product-growth.com 💼 https://t.co/STzr4nqxnm 🤝 https://t.co/SqC3jTyP03 🎙️ https://t.co/fmB6Zf5UZv | 影响力: 278.7k万粉丝
💡 核心观点: ESPN驱逐创始人的合作失败,对方反成赢家。
可信度: 10/10 – 2项声明可直接验证;3项需进一步确认
事实核查:
- ◐ 部分可验证: ESPN要求Dave Portnoy离开作为20亿美元合作的条件 (该声明基于Dave Portnoy的个人说法(“per Portnoy”),但缺乏ESPN或Penn Entertainment的官方确认。部分媒体报道可能间接佐证,但需交叉验证。)
- ✓ 可验证: Penn Entertainment以5.51亿美元分两次收购Barstool(2020年1.63亿收购36%,2023年3.88亿收购剩余部分) (收购金额和股权比例可通过Penn Entertainment的公开财报、SEC文件或权威财经媒体(如CNBC、Bloomberg)报道直接验证。)
- ◐ 部分可验证: Dave Portnoy以1美元回购Barstool,并签署非竞争协议,Penn保留未来出售Barstool的50%收益 (交易细节(如1美元回购、非竞争条款)可能源于Portnoy或Penn的公开声明,但需查阅官方新闻稿或法律文件确认具体条款。Penn的8.5亿美元减记可通过财报部分验证。)
原文内容:
ESPN曾以20亿美元合作计划为条件要求解雇戴夫·波特诺伊。两年后,ESPN Bet宣告失败,而他们当年想踢出局的人如今掌控全局。 事件脉络如下: 佩恩娱乐分两步收购Barstool:2020年以1.63亿美元购入36%股份,2023年初再斥3.88亿美元收购剩余部分,总价5.51亿美元。其战略是将Barstool受众转化为体育博彩用户。 完成收购仅六个月,佩恩突然转向与ESPN合作。波特诺伊透露关键条件:ESPN拒绝与他有任何关联。他声称ESPN本会裁撤公司90%业务。佩恩CEO杰伊·斯诺登转而提出回购方案。 波特诺伊完成了一场世纪交易。他以1美元夺回公司全部所有权,签署竞业协议的同时,允许佩恩保留Barstool未来出售收益的50%。 随后他用两个词化解了回购条款:永不出售。对永不发生的交易主张50%权益,其价值恰好归零。佩恩最终计提了高达8.5亿美元的资产减记。 这一切受保密协议约束。直到ESPN合作破裂后,波特诺伊才得以披露内情。2025年11月,随着ESPN Bet市场份额停滞在3%左右,而佩恩每年需支付1.5亿美元品牌授权费,合作正式终止。 ESPN的新合作方是DraftKings。而Barstool的新体育博彩合作伙伴——每年支付近千万美元费用的——同样是DraftKings。 当年ESPN极力想从交易中抹去的公司,如今正从ESPN自家博彩合作伙伴处获得收益。波特诺伊不仅重掌公司、保留受众,更笑到了最后。全部代价:1美元。
⏰ 07:45 | ❤️ 26点赞 | 📝 257词 | 查看原文 →
SemiAnalysis @semianalysis_
In-depth research on semiconductors, AI infra & hardware | 影响力: unknown万粉丝
💡 核心观点: DeepSeek V4架构优化与多加速器性能分析。
可信度: 9/10 – 2项声明可直接验证;2项需进一步确认
事实核查:
- ◐ 部分可验证: InferenceX团队讨论了如何将DeepSeek V4部署到InferenceX平台 (可通过InferenceX或DeepSeek的官方公告或技术博客部分验证,但具体部署细节(如技术难点或合作流程)可能未完全公开。)
- ◐ 部分可验证: DeepSeek V4的模型架构发生了变化 (若官方发布了架构变更的白皮书或版本说明,则可部分验证;但若未公开具体变更细节(如层结构或参数调整),则无法完全验证。)
- ✓ 可验证: MegaKernel的概念被提及 (若MegaKernel是公开的技术术语(如论文或文档中有定义),则可验证;若为内部术语或未说明具体含义,则无法验证。)
原文内容:
本周,InferenceX团队深入探讨了将DeepSeek V4部署至InferenceX平台的技术实现、模型架构的革新、MegaKernel的核心理念,以及在华为昇腾NPU等多种加速器上的初期性能表现。
⏰ 07:30 | ❤️ 40点赞 | 📝 33词 | 查看原文 →
Rohan Paul @rohanpaul_ai
Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝
💡 核心观点: Fable 5性能最佳但成本远高于其他模型。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: Fable 5在HTML5物理竞赛中表现最佳,但成本分别是Opus 4.8的6倍和GLM 5.2的39倍 (需验证测试平台atomic[.]chat是否公开测试方法和原始数据,以及模型定价是否与官方一致。若平台未公开细节或模型版本价格变动,则无法完全验证。)
- ✓ 可验证: 测试在atomic[.]chat上进行,该应用为本地运行LLM的桌面程序 (可通过访问atomic[.]chat官网或应用描述确认其功能是否为本地运行LLM,此为公开信息。)
- ◐ 部分可验证: 测试要求4个模型生成包含重力、碰撞等物理效果的canvas演示 (若测试平台公开任务说明或示例代码可部分验证,但具体实现细节(如物理参数)可能未公开。)
原文内容:
Fable 5在HTML5物理竞赛中表现绝对碾压,但该测试中其成本是Opus 4.8的6倍、GLM 5.2的39倍。 测试在atomic[.]chat上进行,这是一个本地运行大语言模型的桌面应用程序。 测试要求4个模型生成具有可信运动与碰撞效果的自包含画布演示。 这些场景并非简单动画,因为每次碰撞都需要处理重力、作用力、时间计算和接触判定。 输出结果: - Fable 5:62,158 tokens,3.12美元 - GPT 5.5:37,753 tokens,1.14美元 - Opus 4.8:22,280 tokens,0.56美元 - GLM 5.2:36,246 tokens,0.08美元
⏰ 07:08 | ❤️ 134点赞 | 📝 71词 | 查看原文 →
Venture Twins @venturetwins
| 影响力: unknown万粉丝
💡 核心观点: AI视频虚假宣传生发产品在Instagram上大获关注。
可信度: 10/10 – 3项声明可直接验证;1项需进一步确认
事实核查:
- ◐ 部分可验证: Instagram上的男性用户正在被AI生成的生发产品视频“一击即中”(广泛影响) (需通过分析Instagram平台相关视频的受众性别比例、AI生成内容标记(如”AI-generated”标签)或用户调研数据验证,但平台未公开具体算法或用户互动细节,需依赖第三方工具或抽样调查。)
- ✓ 可验证: 这些AI视频获得数千万浏览量 (可通过视频公开的浏览数据直接验证,但需确认是否为同一类生发产品视频的累计数据,或单个视频的独立数据。)
- ✓ 可验证: 数千条评论要求产品链接 (可通过查看视频评论区直接验证评论数量和内容倾向,但需抽样确认评论真实性(是否含机器人或水军)。)
原文内容:
Instagram上的男性用户正被生发产品的AI视频"一击即中"。 这些视频获得数千万次观看,评论区充斥着成千上万条索要产品链接的留言。
⏰ 06:59 | ❤️ 75点赞 | 📝 36词 | 查看原文 →
Machina
Niels Rogge
Rohan Paul
SemiAnalysis
Amira Zairi
Sakana AI
AshutoshShrivastava
Google Gemma
clem 🤗
Riley Brown
Peter Steinberger
Ti Morse
Aakash Gupta