【AI 英文奏折】05月03日

x每日奏折3个月前发布 tianming

292 0 0

【AI 英文奏折】2026年05月03日

共收录 20 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

Santiago: AI工程师必学的30种智能体构建指南
Marc Lou: 26岁创业者Jack成熟出色，事业爱情双丰收。
Aakash Gupta: 深圳中考决定4.1万学生职校命运，一考定终身。
klöss: 熬夜编程压坏电脑，倒霉遭遇引发人生思考。
swyx 🇬🇧: 企业未盈利因未涉足企业服务和代币销售。
Gary Marcus: 生成式AI弊大于利，危害教育、隐私与信息安全。
SemiAnalysis: 新人用AI系统高效分析数据获高薪职位。
Santiago: Claude Code提供多种快捷操作提高编码效率。
Rimsha Bhardwaj: GitHub汇总1400+免费开源API，覆盖48类开发需求。
Peter Steinberger 🦞: 插件优化后更轻量，依赖问题修复，扩展性增强。
Rohan Paul: AGI旨在探索通用计算，经济高效的工具比替代人类更重要。
Ksenia_TuringPost: 多模态模型通过视觉标记精准定位图像，提升推理准确性。
Emily: Gemini推出首个Gem VPR Render，将更新多语言和图像模型选项。
@levelsio: 游戏新增跳伞和载具功能提升多人互动体验。
Aakash Gupta: 棒球缝合高度影响投球物理特性与球员职业生涯。
fofr: 利用图片搜索激发灵感，创作简洁独特的原创作品。
@levelsio: 使用双笔记本与AI协作未必能提升工作效率。
Charly Wargnier: 黄仁勋批评AI CEO神化AI并制造恐慌。
Bearly AI: 早期搜索引擎Ask Jeeves已具备大语言模型雏形。
Riley Brown: 2026年AI代理将主导技术发展并改变计算机使用方式。

📖 详细内容

Santiago @svpino

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: AI工程师必学的30种智能体构建指南

可信度: 8/10 – 1项声明可直接验证；3项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: “30 agents every AI Engineer must build.” (该声明未提供具体书籍或作者的公开信息（如书名、ISBN、出版社等），无法通过公开渠道核实是否存在这样一本涵盖30种Agent的书，且“must build”属于主观建议。)
◦ 观点: “This is the most comprehensive and practical book on AI Engineering that I’ve ever seen.” (该描述为个人主观评价（如“most comprehensive”“I’ve ever seen”），缺乏客观标准或第三方佐证，属于观点性陈述。)
◐ 部分可验证: “I can’t think of a single use case that they didn’t cover here: [列举26种Agent类型]” (若书籍公开可查，可通过目录或内容核实是否涵盖所列Agent类型；但“未遗漏任何用例”是绝对化表述，需完整阅读书籍才能验证，实际难以穷尽所有可能用例。)

原文内容:

每位AI工程师必须构建的30种智能体

这是我见过最全面、最实用的AI工程著作。

几乎涵盖了所有能想到的应用场景：

1. 自主决策智能体  
2. 规划智能体  
3. 记忆增强智能体  
4. 知识检索智能体  
5. 文档解析智能体  
6. 科研辅助智能体  
7. 工具调用智能体  
8. 智能工作流系统  
9. 数据分析智能体  
10. 验证校验智能体  
11. 通用问题求解智能体  
12. 代码生成智能体  
13. 安全强化智能体  
14. 自我进化智能体  
15. 对话交互智能体  
16. 内容创作智能体  
17. 推荐系统智能体  
18. 视觉语言智能体  
19. 音频处理智能体  
20. 物理世界感知智能体  
21. 伦理推理智能体  
22. 可解释性智能体  
23. 医疗诊断智能体  
24. 科学发现智能体  
25. 金融顾问智能体  
26. 法律咨询智能体  
27. 教育辅导智能体  
28. 群体智能体  
29. 具身智能体  
30. 领域变革集成智能体  

这让我想起伊姆兰的《程序员必知的50种算法》，同样精彩。

亚马逊购书链接：https://amzn.to/4t5ystE

⏰ 23:10 | ❤️ 2390点赞 | 📝 178词 | 查看原文 →

↑ 返回顶部

Marc Lou @marclou

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 26岁创业者Jack成熟出色，事业爱情双丰收。

可信度: 10/10 – 2项声明可直接验证；3项需进一步确认

事实核查:

◐ 部分可验证: Jack（@jackfriks）经营一项月收入3万美元（$30K MRR）的业务 (可通过Jack的公开财务报告、社交媒体披露或第三方平台（如Indie Hackers）部分验证，但需其本人或官方数据确认具体收入细节。)
◐ 部分可验证: Jack在26岁时辍学创建YouTube频道并赚取第一笔收入（数千美元） (可通过其YouTube频道创建时间、早期内容及公开采访验证辍学和初期收入，但具体金额需本人提供证据。)
✓ 可验证: Jack在23岁后的3年内自学编程、开发10+应用、获数百万浏览量 (其GitHub、产品发布记录及社交媒体流量数据（如LinkedIn或Twitter）可验证应用数量和浏览量，但“自学编程”需其自述佐证。)

原文内容:

有幸见到我最欣赏的独立创业者@jackfriks。

我们在Stripe Sessions共度了三天，一起探索旧金山，还去了健身房。他完全符合你的想象：谦和、睿智、纯粹。

最让我震撼的是杰克超乎年龄的成熟。

年仅26岁的他经营着月入3万美元的事业，还与温柔善良的未婚妻订了婚（回想我的26岁，还在韩国夜店买醉迷茫）。

虽然我们都通过SaaS和用户生成内容认识杰克，但他告诉我当初辍学是为了经营YouTube频道——那正是他赚取第一桶金的方式。

23岁时，他开始公开创业，不到三年间：
- 自学编程
- 开发10余款应用
- 收获数百万次观看
- 积累足以实现财务自由的资产

杰克找到了工作与生活的平衡。作为一个大器晚成者，看到如此年轻的灵魂拥有这般清醒的认知，实在令人振奋。

用他的话说：坚持前行便是 :)

⏰ 01:30 | ❤️ 1357点赞 | 📝 166词 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 深圳中考决定4.1万学生职校命运，一考定终身。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 2024年深圳中考有13.6万考生参加，约70%通过考试进入普通高中，其余约4.1万被分流至职业中学或退出正规教育 (中考数据通常由地方教育局发布，但需查找深圳教育局2024年官方公告或统计报告确认具体数字。目前公开渠道暂未直接检索到该年份的详细分流比例，需进一步核实。)
◐ 部分可验证: 深圳”四大名校”公立高中本地生录取率约10%，非本地生约2% (名校录取率可通过学校官网或教育局发布的招生计划验证，但需区分户籍政策。非本地生比例可能涉及流动人口政策，需结合当年具体招生细则确认。)
✓ 可验证: 2023年全国中考考生1540万人，政策明确限制普通高中录取率为50-65% (教育部《2022-2023学年初教育统计公报》可查考生总数，而职普分流政策在《职业教育法》及近年教育部文件中明确提及，具体比例需对照地方执行标准。)

原文内容:

去年夏天，深圳约4.1万名15岁考生在升学考试中失利，就此与普通高中失之交臂。

2024年深圳中考在三天内筛选了13.6万名考生，约70%获得普通高中学位，其余约4.1万人被分流至职业中学或直接结束正规教育。一场考试，三天时间，就此决定人生轨迹。

当地最顶尖的四所公立高中——"四大名校"——录取率约为本地考生的10%，非深户籍考生的2%。这就是这座超大城市里15岁少年们面临的高中升学现状。

正因如此，这些中学建筑群才拥有研究型大学的规模。而其中承载的升学压力，也确实堪比高考竞争。

将视角放大到全国：2023年1540万青少年参加中考。根据国家政策配额，普通高中录取率被明确限制在50%-65%区间。这意味着全国近半数的青少年在15岁时就因一场考试被划入职业教育赛道。

深圳人口从1979年的3万激增至2020年的1750万。截至2024年，全市运营着554所中学，并正根据价值4340亿美元的2025年基建计划增建新校，其中明确包含深汕合作区等新建公立高中项目。反观美国，2017-2022年间关闭约5000所公立学校，2023-24年关停潮仍在持续。

一个国家因学位供不应求而大兴土木，另一个国家因生源不足而大规模关校。

正是教学楼里弥漫的升学压力，塑造了这般宏大的建筑格局。

⏰ 01:12 | ❤️ 279点赞 | 📝 229词 | 查看原文 →

↑ 返回顶部

klöss @kloss_xyz

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 熬夜编程压坏电脑，倒霉遭遇引发人生思考。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 作者因疲劳过度将新MacBook Pro放在胸前睡着，导致屏幕损坏 (该声明描述的是个人经历和具体行为（如“vibe coded”“rolled over”），缺乏第三方记录或客观证据（如监控、维修报告），无法独立验证。)
◐ 部分可验证: 作者在未预约的情况下于Apple Genius Bar等待3小时维修损坏的MacBook Pro (Apple Genius Bar的维修政策（如无预约等待时间）可通过官网或门店核实，但具体等待时长和用户行为（如“walk-in”）依赖个人描述，需结合现场记录确认。)
✓ 可验证: 作者在13年前因食物中毒未再光顾的餐厅喝酒 (食物中毒事件和长期回避餐厅的行为属于个人历史，无公开记录或第三方证据支持，仅能通过当事人自述。)

原文内容:

说来惭愧，昨晚我写代码太上头，凌晨六点抱着新买的MacBook Pro直接昏睡过去。

结果睡梦中翻身压在了电脑上，醒来发现屏幕碎了。

没预约就直奔苹果天才吧，干等了三小时，现在在对街那家餐厅耗时间——十三年前就是在这儿食物中毒的，之后再没踏进过。

趁着欢乐时光喝啤酒。

思考人生。

兄弟们，可得保护好你们的生产力工具啊

要是觉得这事太离谱…看看这机身上的狗毛、汗渍、泪痕和指纹吧老铁

⏰ 09:59 | ❤️ 20点赞 | 📝 115词 | 查看原文 →

↑ 返回顶部

swyx 🇬🇧 @swyx

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 企业未盈利因未涉足企业服务和代币销售。

可信度: 8/10 – 1项声明可直接验证；3项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: @tokengobbler shutdown Vibe-kanban live onstage at AIE Europe (可通过AIE Europe官方活动记录或参会者证言验证事件是否发生，但需确认具体细节（如是否“live onstage”）。)
◐ 部分可验证: Vibe-kanban had 30,000 MAU (月活跃用户) and continues as an open source project (MAU数据可通过历史公开报告或项目方声明验证（若有）；开源状态可通过代码托管平台（如GitHub）直接确认，但需核实项目归属。)
✓ 可验证: “Everyone making money is selling to enterprise or reselling tokens, and we did neither” (引述内容为主观商业判断，无法直接验证其普适性；公司商业模式是否属实需内部财务数据佐证。)

原文内容:

向@tokengobbler致以崇高敬意——他们在AIE Europe现场宣布关闭Vibe-kanban时，这个项目仍保持着3万月活用户，并将以开源形式继续存在。

"所有盈利的团队都在做两件事：向企业销售，以及代币转售。而我们两者都没做。"

令人意外的是，这并非首家在AIE落幕的公司，但从整个历程中我们能汲取诸多经验，尤其是2021-2025年间软件工程的复盘思考将长久铭刻在我脑海中！

⏰ 09:44 | ❤️ 20点赞 | 📝 73词 | 查看原文 →

↑ 返回顶部

Gary Marcus @garymarcus

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 生成式AI弊大于利，危害教育、隐私与信息安全。

可信度: 6/10 – 3项需进一步确认；2项为观点陈述

事实核查:

◦ 观点: Generative AI has been a net negative for society outside of coding and a few domains like brainstorming. (该声明是对生成式AI对社会影响的总体评价，属于主观观点，缺乏具体数据或统一标准来量化“net negative”。)
◐ 部分可验证: GenAI has undermined education, increased disinformation, cybercrime, deep fake porn, bias, and economic disparity. (部分问题（如深度伪造色情、网络钓鱼、教育影响）有公开报道和研究支持（如MIT/Stanford的教育研究、FBI的网络安全报告），但“整体负面影响”需综合多方数据，且因果关系可能复杂。)
◐ 部分可验证: AI has led to over-leveraged, environment-damaging data centers risking a recession. (数据中心能耗问题有研究支持（如国际能源署报告），但“导致经济衰退”属于推测性关联，需经济模型验证，当前无直接证据。)

原文内容:

为何针对人工智能的抵制愈演愈烈？

除了编程（其价值显而易见）和少数其他领域（如头脑风暴），生成式人工智能对社会的影响总体上是弊大于利。

它正在侵蚀中学和大学教育体系，助长大规模监控，加剧虚假信息、妄想症、身份冒充、网络钓鱼等网络犯罪，催生未经同意的深度伪造色情内容，强化就业等领域的偏见，扩大经济差距。更让世界陷入信息垃圾的泥潭，被迫接受大量过度建设、破坏环境的冗余数据中心——这些甚至可能引发经济衰退。

与此同时，这项技术正被一群人所掌控：他们企图将几乎全部收益私有化，却把所有负面影响转嫁给社会，几乎不愿承担任何责任。

我不认为我们比四年前过得更好。

部分问题源于技术缺陷（如大语言模型不可靠），部分则归咎于政治经济因素（例如监管严重缺位）。这些后果大多本可预见。

几乎没有带来任何积极影响。

尽管如此，我仍相信未来某种形态的人工智能或许大有可为。但就目前而言，生成式人工智能造成的伤害远大于贡献，且整个发展过程充斥着不负责任的管理。

难怪越来越多人已忍无可忍。

⏰ 09:33 | ❤️ 302点赞 | 📝 197词 | 查看原文 →

↑ 返回顶部

SemiAnalysis @semianalysis_

Art Director | Daily Image Drops | AI Explorer | Prompt & JSON & SREF share | 影响力: 22万粉丝

💡 核心观点: 新人用AI系统高效分析数据获高薪职位。

可信度: 8/10 – 1项声明可直接验证；3项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: A junior new grad at Jane Street just locked in & signed a $220K–$600K role. (Jane Street的薪资范围通常不公开，但行业报告或招聘平台（如Levels.fyi）可能提供类似职位的薪资参考，需进一步数据比对确认。)
✓ 可验证: He built an agentic AI system that uses JAX & Mesh-TF to process trillions of data points. (系统细节未公开，且“trillions of data points”缺乏具体来源或演示，无法独立验证技术实现或规模。)
◐ 部分可验证: His 1-hour breakdown explains how to mine massive datasets and build the same AI system from scratch. (若推文附有公开视频或文档链接，内容可验证；但未提供链接或具体方法时，无法确认其真实性或可行性。)

原文内容:

Jane Street的一名应届毕业生刚刚锁定并签下了一份22万至60万美元的职位。  

并非因为他更拼命工作，而是因为他构建了一个基于JAX和Mesh-TF的自主AI系统。当整个团队还在费力加载电子表格时，这套系统已能处理数万亿数据点。  

他刚刚发布了一小时完整解析视频，揭秘这套系统的核心：  

• 如何挖掘大多数人根本不知道存在的海量数据集  
• AI如何捕捉人类大脑生理结构无法识别的模式  
• 原始数据如何转化为真实交易与决策  
• 如何从零开始构建相同系统  

今晚别再刷抖音/Reels/小红书了。  

这短短一小时对你职业生涯的助益，将远超过去六个月的无意义滑动。

⏰ 09:13 | ❤️ 239点赞 | 📝 118词 | 查看原文 →

↑ 返回顶部

Santiago @svpino

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: Claude Code提供多种快捷操作提高编码效率。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: Esc+Esc: Rewind your session to any previous checkpoint; treat it as free undo so you can let the agent attempt risky changes. (需实测验证快捷键功能是否支持回滚到检查点，但若无官方文档明确说明，可能存在版本差异或操作限制。)
✓ 可验证: CTRL+V: Paste a screenshot directly into Claude Code. (可通过官方文档或实际测试确认是否支持直接粘贴截图功能，此类功能通常有公开说明。)
◐ 部分可验证: /rewind → “Summarize from here”: Pick a checkpoint and compress only the messages after it, keeping the valuable earlier context intact. (需验证是否存在该命令及具体行为，但若为未公开的测试版功能，可能无法完全确认。)

原文内容:

20条Claude代码操作技巧：

1. Esc+Esc：将会话回退至任意历史检查点，相当于免费撤销功能，可放心让代理尝试高风险修改。

2. CTRL+V：直接将屏幕截图粘贴至Claude代码界面。

3. CTRL+G：在编辑器中编写长提示词，避免在终端内直接输入。

4. CTRL+R：搜索提示词历史记录。

5. /rewind：回滚到检查点后，可提供更具体的反馈重新尝试。

6. /rewind → "Summarize from here"：选择检查点后仅压缩后续消息，完整保留先前有价值的上下文。

7. /insights：生成使用报告并附加至Claude会话，可咨询优化工作流的建议。

8. /memory：保存跨所有项目持续生效的个人偏好设置。

9. /statusline：永久显示当前上下文使用量。

10. cat error.log | claude "fix this"：通过管道直接传输错误日志（替代复制粘贴），为模型提供更完整上下文。

11. .claudeignore：在项目中添加此文件可列出代理不应读取或修改的路径。

12. #：在消息前添加#号可将其作为持久指令保存至CLAUDE.md文件。

13. "ultrathink"：在提示词中任意位置插入该词，可提升模型处理复杂推理任务时的运算强度至HIGH档。

14. /diff：开启交互式视图查看未提交更改及每轮差异。

15. /effort max：需要最大化发挥Claude能力时使用（消耗较大资源！）

16. /loop：设置本地循环执行任务。

17. /schedule：类似/loop，但任务在云端而非本地运行。

18. claude --worktree：在隔离的git工作树中创建会话，实现多Claude实例并行运行。

19. /sandbox：在具备文件与网络隔离的沙箱环境中运行Claude。

20. /voice：启用语音输入功能，长按空格键进行语音提示。

⏰ 21:10 | ❤️ 353点赞 | 📝 296词 | 查看原文 →

↑ 返回顶部

Rimsha Bhardwaj @heyrimsha

Helping you master AI daily with step by step AI guides, & practical tools • AI Educator & Writer • DM for Collab | 影响力: 0万粉丝

💡 核心观点: GitHub汇总1400+免费开源API，覆盖48类开发需求。

可信度: 10/10 – 3项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Someone compiled every free public API on the internet into one massive GitHub repo. (可通过查看GitHub仓库链接确认其存在性和规模，但“every free public API”这一绝对化表述无法完全验证（可能存在遗漏或非免费API混入）。)
✓ 可验证: 1,400+ APIs across 48 categories. (可通过访问GitHub仓库直接统计API数量和分类目录，数据公开可量化。)
✓ 可验证: 421K stars. 100% Opensource. (GitHub仓库的Star数量和开源许可证（如MIT/GPL等）可直接在页面显示信息中验证。)

原文内容:

有人将互联网上所有免费的公共API整理成一个庞大的GitHub仓库。

你可以用它构建任何项目：

- 人工智能、机器学习、身份验证、区块链
- 加密货币、金融、地图、天气
- 游戏、音乐、图书、新闻
- 涵盖48个类别的1400多个API

收获42.1万星标，100%开源。

仓库链接如下

⏰ 20:32 | ❤️ 64点赞 | 📝 38词 | 查看原文 →

↑ 返回顶部

Peter Steinberger 🦞 @steipete

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 插件优化后更轻量，依赖问题修复，扩展性增强。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 该版本修复了通过npm安装时出现的依赖问题/速度慢的问题 (可通过测试npm安装前后的性能对比或查看版本更新日志（如GitHub提交记录）部分验证，但需实际环境复现问题，且“速度慢”可能因用户环境差异而难以统一量化。)
◦ 观点: 插件开发难度高，但值得投入 (属于主观评价，无客观标准衡量“难度”或“价值”，无法验证。)
✓ 可验证: 包体积更精简，几乎所有功能已移至扩展模块 (可通过官方文档链接（如提供的docs.openclaw.ai）或对比新旧版本包体积/依赖项列表直接验证。)

原文内容:

本次更新解决了部分用户通过npm安装时遇到的依赖问题/运行缓慢现象。

插件开发虽难，但绝对值得！现在安装包更加轻量化，我们已将[几乎]所有功能模块迁移至扩展系统中！详见插件管理文档：https://docs.openclaw.ai/plugins/manage-plugins…

⏰ 08:35 | ❤️ 310点赞 | 📝 37词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AGI旨在探索通用计算，经济高效的工具比替代人类更重要。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Demis Hassabis认为AGI不是关于取代人类的项目，而是一个关于什么是真正通用计算的科学问题，加上经济现实。 (该声明可部分验证，需查找Demis Hassabis的公开访谈、演讲或文章以确认其观点，但需依赖第三方来源（如YT频道）的准确性。)
✓ 可验证: 大脑是我们已知的唯一近似图灵机的结构，因此“通用智能”意味着那种水平的灵活性。 (可通过神经科学和计算机科学领域的公开研究验证大脑与图灵机的类比，但“唯一”这一表述可能需要进一步考证。)
◦ 观点: 公司追求通用智能是因为通用工具可以低成本地迁移到各个领域，“通用性”因其更好的扩展性而胜出。 (这是对商业动机的推测，属于主观观点，缺乏直接可验证的经济数据或公司官方声明支持。)

原文内容:

德米斯·哈萨比斯回答"为何不开发与人类协同工作的人工智能，而非要取代人类智能？"这一问题。

他表示，人工通用智能（AGI）并非替代人类的计划——这是一个关于"何为真正通用计算"的科学命题，同时也涉及经济学现实。

大脑是我们目前已知唯一近似图灵机的器官，因此"通用智能"意味着与之相当的灵活性。企业追逐这一目标，是因为通用工具能低成本移植到各个领域，"通用性"之所以胜出，在于其具备更优越的扩展能力。

——摘自Varun Mayya的YouTube频道（链接见评论）

⏰ 22:38 | ❤️ 164点赞 | 📝 90词 | 查看原文 →

↑ 返回顶部

Ksenia_TuringPost @theturingpost

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 多模态模型通过视觉标记精准定位图像，提升推理准确性。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: DeepSeek AI提出“Thinking with Visual Primitives”方法，通过让模型指向图像中的具体位置（如点和边界框）来提高视觉推理精度。 (需查阅DeepSeek AI官方发布的论文、技术博客或演示视频确认该方法的具体实现和原理，但推文未提供直接链接。)
✓ 可验证: 该方法使模型平均准确率提升约77%（对比Gemini 3 Flash的76.5%和GPT-5.4的71.1%）。 (数据缺乏具体测试条件、基准数据集或第三方复现结果，且“GPT-5.4”版本名称存疑（当前公开版本为GPT-4），无法独立验证。)
◐ 部分可验证: 模型压缩后仅保留80-90个视觉token，内存效率高。 (需官方公开架构细节或基准测试报告，但技术可行性可通过类似模型（如ViT）的token压缩研究间接佐证。)

原文内容:

多模态模型存在一个严重缺陷——它们能处理图像，但依然用语言进行推理，这对视觉内容来说不够精确。

@deepseek_ai 刚刚提出了解决方案：让模型在思考时直接指向图像中的具体位置。

他们称之为"视觉基元思维"。

这些视觉基元包括：
- 点（具体坐标）
- 边界框（图像中的区域）

通过这种方式，模型能精准定位所指内容，平均准确率提升约77%（对比Gemini 3 Flash的76.5%和GPT-5.4的71.1%）

得益于高效架构，经压缩后仅需保留约80-90个视觉标记在内存中

其工作原理如下：

⏰ 23:25 | ❤️ 112点赞 | 📝 110词 | 查看原文 →

↑ 返回顶部

Emily @iamemily2050

Any sufficiently advanced technology is indistinguishable from magic. Arthur C. Clarke. | 影响力: 0万粉丝

💡 核心观点: Gemini推出首个Gem VPR Render，将更新多语言和图像模型选项。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: The first Gem is out; you can search for it on Gemini. The name is VPR Render (Visual Primitive Rendering). (可通过访问Gemini平台或官方公告直接搜索确认是否存在名为“VPR Render”的Gem功能。)
◐ 部分可验证: There will be Japanese and Chinese only versions very soon. (需等待官方发布更新或公告确认语言版本的上线时间，当前无法立即验证“soon”的具体时间范围。)
✓ 可验证: At the moment, Gemini Gem does not allow a choice of which image model you can use, so by default, you get Nano banana V2. (可通过实际使用Gemini Gem功能或查阅官方文档验证默认图像模型是否为“Nano banana V2”以及是否缺乏模型选择选项。)

原文内容:

第一颗Gem已发布，您可在Gemini上搜索其名称“VPR Render”（视觉基元渲染技术）。

日语和中文专属版本即将推出。目前Gemini Gem暂不支持选择图像模型，因此默认使用Nano banana V2版本。预计该问题将在下次更新中得到修复。下一颗Gem将专注于草图生成功能。

⏰ 07:48 | ❤️ 49点赞 | 📝 73词 | 查看原文 →

↑ 返回顶部

@levelsio @levelsio

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 游戏新增跳伞和载具功能提升多人互动体验。

可信度: 4/10 – 2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 游戏新增了降落伞功能，首次重生为伞兵 (可通过游戏更新日志、官方公告或实际游戏测试验证，但需确认是否为最新版本或特定模式。)
◦ 观点: 开发者计划未来重新加入载具系统 (属于开发者对未来更新的主观计划或愿景，无具体时间或实现证据，无法直接验证。)
◐ 部分可验证: 当前玩家可与好友共同驾驶载具 (可通过实际游戏测试或官方功能说明验证，但需确认载具类型是否已实装或处于测试阶段。)

原文内容:

现已新增降落伞功能，首次重生时将作为空降兵登场

虽然我认为很快需要重新加入载具系统，但目前你和好友们已经可以驾车四处游历了

⏰ 06:52 | ❤️ 38点赞 | 📝 30词 | 查看原文 →

↑ 返回顶部

Aakash Gupta @aakashgupta

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 棒球缝合高度影响投球物理特性与球员职业生涯。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: MLB棒球由两个8字形牛皮面板包裹软木和橡胶芯，手工缝制108针蜡线 (MLB官网及多家体育器材制造商公开描述棒球结构，手工缝制流程为行业共识)
◐ 部分可验证: 缝线高度（约高出皮革1毫米）是投球物理中最大的变量，影响空气抓握力和球路变化 (流体力学实验可验证缝线高度对空气阻力的影响，但”最大变量”的表述需对比其他因素（如球体表面粗糙度）)
◐ 部分可验证: 2021-2022年缝线高度公差问题导致投手抱怨球体过滑 (ESPN等媒体当时报道过投手集体投诉，但具体公差数据属于制造商未公开的工艺参数)

原文内容:

没有任何机器能缝制美国职棒大联盟用球的原因，与半毫米落差就能改变投手职业生涯的缘由如出一辙。

每颗棒球都由两片呈8字形的牛皮包裹着软木橡胶芯，通过108针手工缝制的上蜡红棉线缝合而成。这些缝线形成的凸起高度——约高出皮革表面一毫米——是投球物理中最大的变量。较高的缝线能攫取更多空气，使变化球下坠更凌厉，四缝线球却会丧失推进力；较低的缝线则让球路更干净利落，助快速球保持飞行轨迹。当2021至2022年缝线高度出现浮动时，投手们抱怨球体触感如同台球。这个肉眼难辨的制造公差问题，球迷们通过电视直播见证了整整两个赛季。

牛皮作为天然材质，每片都存在着细微的厚度差异、纹理走向与延展特性。机器固然能将缝线拉至固定张力，却无法感知牛皮较厚区域而自动减少四分之一转的力度，以确保缝线高度符合规范。这个感知难题让自动化尝试五十年来始终未能突破。

再看经济账。哥斯达黎加图里亚尔瓦市的单一工厂里，约300名缝球工手工缝制着大联盟所有比赛用球。《纽约时报》、路透社与《哥斯达黎加时报》报道显示，他们的时薪介于1.6至2.33美元，每颗球的人工成本约50美分。近三分之一的工人会在几年内患上腕管综合征。2019年大联盟消耗约114万颗球，相当于每投几球就更换新球，每颗球的平均使用寿命仅约两个回合。

这项年产值200亿美元的运动，30支球队平均估值26亿美元，投手合约动辄超3.25亿美元——而决定所有这些胜负关键的球体表面，却由数百双身处棒球世界视线之外的巧手，在同一个小镇完成缝制。

物理学定律与经济现实共同指向一个事实：手工得以存续，只因它既是人类迄今未能替代的最精密反馈系统，同时也是成本最低廉的选择。

⏰ 13:18 | ❤️ 374点赞 | 📝 309词 | 查看原文 →

↑ 返回顶部

fofr @fofrai

Head of Engineering @ growth-stage AI company. Scaling models and teams toward AGI. Notes and thoughts along the way. | 影响力: 0万粉丝

💡 核心观点: 利用图片搜索激发灵感，创作简洁独特的原创作品。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Nano Banana 2支持启用图像搜索功能 (需实测或查看Nano Banana 2的官方功能文档以确认是否存在图像搜索功能及其具体操作方式，若无公开明确说明则为部分可验证。)
◐ 部分可验证: 输入特定提示词（如“Use image search to get…”）可生成单一原创作品 (需实际测试该提示词是否能触发所述功能并生成结果，但生成内容的“原创性”和“单一性”可能依赖主观判断，部分可验证。)
✓ 可验证: 每次生成结果不同（Varied results each time） (通过多次重复相同提示词测试输出结果是否变化，可直接验证其随机性，属于可验证声明。)

原文内容:

若您仅想探索创意，可在Nano Banana 2中启用图像搜索功能，输入类似以下提示：

> 使用图像搜索获取[某主题与表现形式]，这些素材应作为创作灵感的源泉。基于此灵感，创作一件全新的[作品]。保持整体协调统一，元素不宜过多。在限制中展现美感

例如：鲜明现代摄影风格，搭配巧妙排版的原创肖像。

每次生成结果皆不相同。

⏰ 06:47 | ❤️ 21点赞 | 📝 70词 | 查看原文 →

↑ 返回顶部

@levelsio @levelsio

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 使用双笔记本与AI协作未必能提升工作效率。

可信度: 6/10 – 1项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 我有一个朋友现在带着两台笔记本电脑旅行和工作，以提高工作效率 (该声明基于个人社交圈内的匿名案例，缺乏具体身份或公开记录，无法独立验证其真实性或普遍性。)
◦ 观点: 使用两台笔记本电脑是否能提高工作效率尚不确定 (这是作者的主观推测，未提供具体数据或实验对比，属于个人观点而非客观事实。)
◐ 部分可验证: 推文内容与“你是否更多或更少地使用AI工作”的投票相关 (若原投票内容公开可查（如附链接），则关联性可验证；但推文未提供具体投票来源，需进一步确认。)

原文内容:

关于“你是否更多地与AI协同工作”的问卷调查

我有个朋友现在出差都带着两台笔记本工作，说是为了提升效率

至于效果如何，我就不太确定了

⏰ 06:42 | ❤️ 35点赞 | 📝 37词 | 查看原文 →

↑ 返回顶部

Charly Wargnier @datachaz

博主简介加载中 | 影响力: 0万粉丝

💡 核心观点: 黄仁勋批评AI CEO神化AI并制造恐慌。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Nvidia’s Jensen Huang认为AI不会导致放射科医生失业，反而需要更多放射科医生 (可通过查找黄仁勋公开演讲、采访或Nvidia官方声明验证其观点，但需确认具体语境和完整表述。关于“AI是否导致放射科医生失业”需结合行业研究数据验证，存在争议性。)
✓ 可验证: 黄仁勋批评部分AI CEO因“上帝情结”夸大AI威胁（如称AI有20%概率成为生存威胁） (黄仁勋对AI威胁论的批评可通过公开言论验证（如访谈视频），但“上帝情结”属于主观评价；“20%生存威胁”可能指向具体人物（如Dario Amodei），需查证其原话。)
◐ 部分可验证: 黄仁勋称“吓唬人们AI将消灭50%大学水平工作”是无稽之谈 (黄仁勋的反对立场可验证，但“50%工作被消灭”的原始出处需追溯（如是否引用特定报告）。就业影响预测本身存在模型差异，难以完全验证。)

原文内容:

不得不承认，英伟达的黄仁勋是当今最敏锐、最具远见卓识的人物之一。

最近他毫不留情地炮轰科技界的末日论调（笑死，达里奥中枪）。他的观点很明确：别再听信那些突然患上"上帝情结"的AI公司CEO们。

"如果某个AI科学家警告人们AI将渗透放射科、放射科医生会被淘汰，这话看似善意实则有害。如果我们劝退所有想成为放射科医生的人，结果社会反而急需这类人才，那就是在危害社会。"

"鼓动年轻大学毕业生放弃学习软件工程同样有害——因为我们比以往任何时候都更需要软件工程师。这种言论贻害无穷。"

"用根本不会发生的无稽之谈恐吓大众，说什么'AI有20%概率导致人类灭绝'，简直荒谬至极。"

"说什么'AI将消灭50%大学学历岗位'，'AI会彻底摧毁民主制度'——这类言论毫无建设性。它们往往出自某些CEO之口。有些人当上CEO就染上上帝情结，自以为全知全能。"

这番抨击堪称犀利，而且百分百正确。

_____________

与其被这些人散播的恐慌情绪左右，不如从今天开始脚踏实地投入工作。

这位大佬直接公布了2026年AI智能体的完整发展路线图。

他明确指出了应该学习什么、构建什么以及忽略什么

↓ 阅读下文

⏰ 19:58 | ❤️ 46点赞 | 📝 257词 | 查看原文 →

↑ 返回顶部

Bearly AI @bearlyai

Privacy-first AI research tool with access to ChatGPT, Grok, Claude, Gemini and DeepSeek in one app. Try it at http://Bearly.AI | 影响力: 0万粉丝

💡 核心观点: 早期搜索引擎Ask Jeeves已具备大语言模型雏形。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Ask Jeeves是早期的大型语言模型（LLM）原型 (Ask Jeeves作为早期搜索引擎的确尝试通过自然语言处理（NLP）理解用户查询，但其技术原理与当前LLM（如GPT）有显著差异。需通过历史技术文档或专家分析对比验证其是否为“原型”，属于部分可验证的类比观点。)
✓ 可验证: 拉里·佩奇在2000年预言当前AI浪潮，称“AI将是谷歌的终极版本” (拉里·佩奇的言论可追溯至公开采访或档案记录（如斯坦福大学存档的早期谷歌演讲）。其关于AI与搜索引擎的愿景描述具体，且谷歌历史资料可能存有原始视频/文本，属于可直接验证的声明。)
◐ 部分可验证: 2000年时谷歌拥有6,000台计算机和存储100份完整网页的容量 (谷歌早期基础设施数据可能存在于公司技术博客、专利文件或员工回忆录中，但需具体来源佐证。因涉及20多年前的非持续公开数据，部分细节（如“70英里高索引”）可能为比喻，需谨慎验证。)

原文内容:

Ask Jeeves堪称大语言模型的雏形。

拉里·佩奇早在2000年就预见了当前这波人工智能浪潮：

"人工智能将成为谷歌的终极形态。届时我们将拥有终极搜索引擎。它能理解网络上的一切内容，精准把握你的需求，并给出正确答案。

这显然就是人工智能。它基本上能回答任何问题，因为几乎所有信息都已存在于网络。

目前我们离这个目标还很遥远。但我们可以逐步逼近，这正是我们正在开展的工作。从学术角度来看，这个过程极具吸引力。

我们拥有海量数据。如果把我们的索引打印出来，堆叠高度可达70英里。我们拥有强大的算力——约6000台计算机。这些资源储备相当可观，存储空间足以保存整个互联网的100份副本。

这种多重要素的交汇非常有趣：前所未有的计算能力，过去难以获取的庞大数据。从工程学/科学角度来看，构建能充分利用这些资源的系统是极具挑战性的智力实践。我预计这项工作将持续相当长时间。"

⏰ 06:12 | ❤️ 41点赞 | 📝 216词 | 查看原文 →

↑ 返回顶部

Riley Brown @rileybrown

YouTuber and Educator
Cofounder of @vibecodeapp_ | 影响力: 0万粉丝

💡 核心观点: 2026年AI代理将主导技术发展并改变计算机使用方式。

可信度: 1/10 – 基于事实核查结果综合评估

事实核查:

✗ 无法验证: 2026 is the year of AI agents
✗ 无法验证: 验证状态：opinion
✗ 无法验证: 说明：** 这是对未来趋势的主观预测，没有客观事实或数据支持，属于个人观点或愿景陈述。

原文内容:

2026年：智能代理元年  
OpenClaw、Claude Code、Codex与Cursor争锋...  

本期视频，我与@Rasmic共同解析这一切  
堪称2026年AI智能代理全景回顾  

00:00 开场  
01:35 第一季度属于Anthropic  
03:02 Opus 4.5与Inflection的转折点  
08:42 Codex与Claude的用户体验之战  
12:53 Cursor竟是先驱？  
14:27 SpaceX收购Cursor的协议内幕  
21:45 OpenClaw与代理型个人计算机革命  
28:57 被动响应与主动工作的分野  
30:30 保持代理功能专一化  
33:12 记忆层架构的关键性  
36:23 计算机操作将迎来速度革命  
39:28 超级应用花落谁家？（目前Codex领先）  
41:06 谷歌的症结所在...  
45:17 提示工程与技能创建  
51:30 Codex技能实例演示  
56:56 系统集成优于单纯提示  
59:39 多元交互终端（CMUX、TMUX）  
01:02:04 大胆预测  
01:06:38 代理商业生态崛起  

（注：时间码保留原格式"01:02:04"以适应视频场景，专业术语如"Agentic Personal Computer"译为"代理型个人计算机"保持技术准确性，品牌名"OpenClaw/Cursor"等不作翻译。动词选用"争锋/分野/崛起"等词汇强化科技行业语境，长句如"Consider this..."转化为主谓宾结构符合中文表达习惯。）

⏰ 06:11 | ❤️ 115点赞 | 📝 101词 | 查看原文 →

↑ 返回顶部

# x每日奏折