【AI 英文奏折】05月27日

x每日奏折2个月前发布 tianming

160 0 0

【AI 英文奏折】2026年05月27日

共收录 17 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

Amira Zairi: Topaz Labs新版照片修复工具能自然增强面部细节和降噪锐化。
Rohan Paul: 华为突破制裁限制，通过系统优化提升芯片性能。
Rohan Paul: 人形机器人实用性关键在于灵巧手部操作而非行走。
Rimsha Bhardwaj: 天才AI学者Yi Tay从谷歌离职创业又回归，率队赢得数学奥赛。
Hasan Toor: Rezonant Alter用语音标注实时产品修改并生成代码。
Rimsha Bhardwaj: 推荐适合初学者的AI/ML开源学习项目。
Bearly AI: 闪存先驱创业28年售出公司后，执掌美光市值激增33倍至万亿。
Amira Zairi: 分享3D立体书插画提示：分层纸艺场景、柔和光影、手作质感。
Rohan Paul: AI安全核心问题是运行时行为风险，非漏洞发现能力。
Rohan Paul: Uber CEO称AI工程师效率远超人类，未来将用AI取代人力。
Rohan Paul: AI冲击白领工作未达预期，人类判断力仍不可替代。
谷歌AI实验室: 随时随地用谷歌AI Studio实现创意灵感。
Alex Prompter: 各大AI模型互相犀利点评同窗表现。
Rohan Paul: 字节跳动以低价AI业务股票激励争夺AI人才。
Rohan Paul: 长文本AI易被少量错误段落污染，首段误导即致整体偏差。
Pierrick Chevallier | IA: AI代理一键生成完整广告，高效自动化。
Rohan Paul: AI使人感觉高效但实际收益微乎其微，且易形成依赖循环。

📖 详细内容

Amira Zairi @azed_ai

AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝

💡 核心观点: Topaz Labs新版照片修复工具能自然增强面部细节和降噪锐化。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Face Recovery 3功能可修复低分辨率人像照片中的面部细节（如眼睛、睫毛、眼镜、妆容等）且效果自然 (可通过Topaz Labs官网或官方演示视频验证功能描述，但“效果自然”需用户实测或对比样本，存在主观性。)
◐ 部分可验证: Noise-Aware Sharpening能在提升清晰度的同时有效抑制噪点，适用于电影帧、AI生成图或压缩图像 (官网可能提供技术说明或案例，但实际效果需依赖具体图像测试，噪点抑制程度无客观标准。)
✓ 可验证: Autopilot功能可自动分析图像并推荐优化设置，简化编辑流程 (官网或官方文档通常会明确描述自动化功能，用户也可通过试用验证基础逻辑是否成立。)

原文内容:

我一直在测试新版@topazlabs的照片处理功能更新，这些改进确实非常实用。

Face Recovery 3功能在修复模糊人像或老旧低分辨率图像时表现卓越。它能精准还原面部细节，包括眼睛、睫毛、眼镜、妆容和皮肤纹理，同时确保处理效果自然不显人工痕迹。

目前我最青睐的是Noise-Aware Sharpening降噪锐化功能。它在提升画面清晰度的同时能有效抑制噪点，这对电影级画面、AI生成图像或压缩图片的编辑工作具有显著改善效果。

新版Autopilot自动模式也深得我心——通过智能分析图像自动推荐优化方案，省去了手动调试每个参数的繁琐过程。

⏰ 23:56 | ❤️ 32点赞 | 📝 117词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 华为突破制裁限制，通过系统优化提升芯片性能。

可信度: 9/10 – 2项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: Huawei’s Tau Scaling breakthrough: when shrinking slows, cut the time signals waste moving. (需通过华为官方技术白皮书或专利文件验证“Tau Scaling”技术细节，但推文未提供具体来源。若华为公开相关技术文档，则可验证；否则仅能依赖第三方分析或行业报道。)
◐ 部分可验证: Sanctions constrained access to leading EUV tools, forcing performance improvements in layout, bonding, data movement, and architecture instead of pure lithography. (制裁对EUV设备的限制（如ASML对华出口管制）为公开事实，但“性能改进转向其他领域”需结合华为或行业报告（如半导体技术路线图）验证，目前推文缺乏直接证据。)
✓ 可验证: China is being forced to optimize across boundaries (e.g., memory with logic, packaging with architecture). (中国半导体产业的技术整合趋势（如Chiplet、异构集成）可通过中科院、华为或长电科技等企业的公开技术成果（如专利、发布会）验证，但推文中的“forced”表述含主观推断。)

原文内容:

华为的Tau Scaling突破：当制程微缩放缓时，就削减信号传输的耗时浪费。

这正是制裁可能带来的意外效果：当无法获得最先进的极紫外光刻设备时，企业不得不从布局设计、封装互联、数据流动和架构创新中挖掘性能潜力，而非单纯依靠光刻技术。

中国正被迫进行跨领域协同优化：将内存与逻辑单元整合、封装技术与架构设计结合、芯片设计与计算集群设计联动、硬件特性与工作负载行为匹配。

图片来源：@zephyr_z9

⏰ 15:15 | ❤️ 41点赞 | 📝 74词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 人形机器人实用性关键在于灵巧手部操作而非行走。

可信度: 6/10 – 1项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: Dexterity demonstrations with a range of finger movements of robotic hands. (可通过机器人技术公司的官方演示视频、研究论文或产品发布资料验证手指运动的灵活性和范围。)
◦ 观点: Humanoid usefulness depends less on walking than on hand manipulation. (这是主观观点，取决于对“有用性”的定义和应用场景，缺乏客观标准或数据支持。)
◐ 部分可验证: Useful work begins where fingers meet the world: grip, slip, pressure, cable routing, recovery from mistakes. (部分可验证，例如通过机器人抓取实验或工程报告验证抓握、防滑等功能，但“有用性”的具体标准需结合实际应用场景评估。)

原文内容:

机器人手部通过一系列手指动作展示灵巧性。  
人形机器人的实用性更依赖于手部操作而非行走能力。真正有用的工作始于手指与外界接触的环节：抓握、滑动、施压、线缆排布以及错误恢复。

⏰ 15:10 | ❤️ 23点赞 | 📝 37词 | 查看原文 →

↑ 返回顶部

Rimsha Bhardwaj @heyrimsha

Helping you master AI daily with step by step AI guides, & practical tools • AI Educator & Writer • DM for Collab | 影响力: 23.09k万粉丝

💡 核心观点: 天才AI学者Yi Tay从谷歌离职创业又回归，率队赢得数学奥赛。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: Yi Tay grew up in Singapore and earned a classical piano performance diploma from Trinity College London in 2012. (Trinity College London的学历可通过学校官方记录或公开数据库验证，但需具体查询Yi Tay的个人信息。新加坡成长经历需依赖个人或媒体报道，无直接官方来源。)
✓ 可验证: Yi Tay joined Google Brain as a research scientist and co-led PaLM-2, the brain behind Google’s AI stack. (Google Brain团队成员及项目贡献可通过Google官方公告、LinkedIn个人资料或学术论文（如PaLM-2相关研究）验证。)
◐ 部分可验证: He built a model that competed with GPT-4 in a year after starting a frontier AI lab with $60 million funding. (融资金额和实验室成立可通过商业新闻（如TechCrunch）或公司官网验证，但模型性能对标GPT-4需技术评测报告支持，可能缺乏公开直接对比数据。)

原文内容:

一位来自新加坡的年轻人，自幼接受古典钢琴家训练，却成为了当今最重要的AI研究者之一。他放弃谷歌职位，带领20人团队以6000万美元资金创立前沿AI实验室，一年内打造出比肩GPT-4的模型，而后又离开自己创建的独角兽企业重返谷歌，如今正领导着刚刚用AI赢得国际数学奥林匹克冠军的团队。

他叫Yi Tay。在AI研究界之外，这个名字几乎无人知晓。

故事要从头说起。

Yi在新加坡长大。2012年获得伦敦圣三一学院古典钢琴演奏文凭后，他几乎成为职业音乐家。但最终选择计算机科学道路，在南洋理工大学取得博士学位，随后以研究科学家身份加入谷歌大脑团队。当时新加坡几乎没有从事前沿AI研究的学者，他常说自己走的是条无人开拓的路。

在谷歌期间，他成为PaLM-2模型的联合负责人——这套系统如今是谷歌整个AI技术栈的核心。他发明的UL2预训练方法已成为行业标准，首创的可微分搜索索引技术被应用于谷歌助手、YouTube和搜索引擎。

2022年底ChatGPT问世时，Yi做出了震惊学术界的决定：离开谷歌。

2023年，他与来自DeepMind和Meta的研究者共同创立Reka。这家总部设在旧金山的公司，团队却分散在亚欧美三大洲。没有科技巨头背书，仅20人的团队拿着6000万美元启动资金。要知道，OpenAI投入约600人开发GPT-4，谷歌Gemini技术报告署名作者达950人，而Reka负责预训练的团队不足5人。

接下来的639天里，Yi过着昼夜颠倒的生活：日均五杯咖啡、两顿外卖，体重增加15公斤。初为人父的他跨时区协调全球团队，在谷歌视为理所当然的基础设施领域从零搭建系统。

2024年5月，Reka Core模型登陆LMSYS排行榜第七位——这是全球除OpenAI、谷歌、Anthropic和Meta外唯一达到GPT-4水平的模型。20人的公司，5人负责预训练，却交付了前沿大模型。阿里云、英伟达和甲骨文相继成为合作伙伴，公司估值飙升至13亿美元。

然而2024年11月，Yi做出了更令人意外的举动。

他选择离开。

博客上那篇题为《重返Google DeepMind》的短文宣告了他的决定。在四大巨头之外建立顶尖实验室639天后，他回到了曾经离开的公司。文中仅说"收获远超预期"，未多作解释。

谷歌为他下注重注：在新加坡建立DeepMind实验室，由他与Quoc Le共同执掌。这个专注推理、强化学习和Gemini后训练的创新中心，从最初12人扩展到300余人团队。

去年夏天，Yi团队主导的Gemini Deep Think项目夺得国际数学奥赛金牌。该模型在实时竞赛中解出了全球不足百人能在限时内完成的IMO难题。他们还在ICPC 2025赛事中为Gemini斩获金牌。

Yi依然居住在新加坡，闲暇时仍会弹奏钢琴。他自称"世界公民"，不囿于任何区域性AI圈层。若计入Reka的插曲，他在谷歌已近十四年。他说，新加坡实验室的故事才刚刚开始。

这位来自新加坡的钢琴师，曾共同领导支撑谷歌AI的模型，离任后带领20人团队击败科技巨头的千军万马，如今又回归谷歌，正指挥着教会机器摘取数学奥赛金牌的团队。

此刻，这位你从未听闻却最具影响力的AI研究者，正坐在新加坡的办公室里训练下一代思维模型。

⏰ 19:19 | ❤️ 594点赞 | 📝 676词 | 查看原文 →

↑ 返回顶部

Hasan Toor @hasantoxr

AI & Tech Educator • Sharing insights on AI, Tech Tools, & practical ways to use AI & Tech Tools for you & your daily business • Founder & Writer @theprohumanai | 影响力: 0万粉丝

💡 核心观点: Rezonant Alter用语音标注实时产品修改并生成代码。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: Rezonant Alter可以替代Figma中“带箭头的截图”工作流程 (需实测或查看Rezonant Alter的功能演示，确认其是否能完全替代Figma的标注功能，目前仅能通过推文描述部分验证。)
✓ 可验证: Rezonant Alter允许用户实时指向产品任意部分并口头描述修改意见 (可通过官网或官方演示视频验证该功能是否存在及具体操作逻辑。)
◐ 部分可验证: Rezonant Alter能将修改需求直接传递给编码代理（coding agent） (需确认“coding agent”的具体定义（如是否对接AI或开发工具），功能实现程度可能因技术限制而部分可验证。)

原文内容:

有人刚刚彻底颠覆了"在Figma中用箭头标注截图"的工作流程。

这款名为Rezonant Alter的工具，允许你直接指向实时产品的任何部分，通过语音讲解修改需求，并将规范直接发送给编码代理程序。

以下是您需要了解的全部信息：

⏰ 19:46 | ❤️ 168点赞 | 📝 49词 | 查看原文 →

↑ 返回顶部

Rimsha Bhardwaj @heyrimsha

Helping you master AI daily with step by step AI guides, & practical tools • AI Educator & Writer • DM for Collab | 影响力: 23.09k万粉丝

💡 核心观点: 推荐适合初学者的AI/ML开源学习项目。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: “ML for Beginners”是适合初学者学习AI/ML的GitHub仓库 (可通过提供的GitHub链接（https://github.com/microsoft/ML-For-Beginners）直接访问仓库，查看内容、星标数、更新日期等公开信息，确认其存在且定位为入门教程。)
◐ 部分可验证: “Generative AI for Beginners”是2023年适合学习生成式AI的仓库 (仓库链接（https://github.com/microsoft/generative-ai-for-beginners）可验证其存在性和教学内容，但推文中“适合今年学习”的时效性需结合仓库更新频率和AI领域进展进一步判断。)
✓ 可验证: “nanoGPT”是学习GPT模型的有效资源 (通过链接（https://github.com/karpathy/nanoGPT）可确认其由知名AI研究者Andrej Karpathy维护，代码、文档及社区反馈均可公开验证其技术价值。)

原文内容:

今年最适合从零开始学习人工智能/机器学习的GitHub仓库：

1. 机器学习入门  
https://github.com/microsoft/ML-For-Beginners…

2. 生成式AI入门  
https://github.com/microsoft/generative-ai-for-beginners…

3. 大语言模型课程  
https://github.com/mlabonne/llm-course…

4. 大语言模型实战  
https://github.com/iusztinpaul/hands-on-llms…

5. nanoGPT轻量级实现  
https://github.com/karpathy/nanoGPT…

6. 从零构建大语言模型  
https://github.com/rasbt/LLMs-from-scratch…

7. AI智能体入门  
https://github.com/microsoft/ai-agents-for-beginners…

8. 用机器学习打造产品  
https://github.com/GokuMohandas/Made-With-ML…

9. 机器学习运维精选  
https://github.com/visenger/awesome-mlops…

⏰ 23:49 | ❤️ 107点赞 | 📝 101词 | 查看原文 →

↑ 返回顶部

Bearly AI @bearlyai

Privacy-first AI research tool with access to ChatGPT, Grok, Claude, Gemini and DeepSeek in one app. Try it at http://Bearly.AI | 影响力: 0万粉丝

💡 核心观点: 闪存先驱创业28年售出公司后，执掌美光市值激增33倍至万亿。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认

事实核查:

◐ 部分可验证: Sanjay Mehrotra co-invented technology for NAND flash memory (可通过专利数据库或SanDisk/Western Digital的官方技术历史记录验证其发明贡献，但需具体专利编号或公司公开的技术文档确认”co-invent”的具体范围和角色。)
✓ 可验证: SanDisk was sold to Western Digital for $19B in 2016 (该交易金额和时间为公开的商业收购事件，可通过Western Digital或SanDisk的官方公告、SEC文件（如10-K报告）或权威财经媒体（如彭博、路透）直接验证。)
✓ 可验证: Micron’s market cap grew >33x from $30B to $1T under Sanjay Mehrotra’s leadership (2017至今) (截至2023年10月，Micron市值约$700B（公开数据），未达$1T；”33倍增长”需明确时间范围，且$30B起始市值与历史数据不符（2017年Micron市值约$50B）。当前无法验证该声明，可能包含夸大或计算错误。)

原文内容:

美光科技首席执行官桑杰·梅赫罗特拉在领英上的个人页面堪称传奇：

> 共同发明NAND闪存技术
> 联合创立闪迪公司并执掌28年
> 2016年以190亿美元将闪迪出售给西部数据
> 2017年出任美光CEO，公司市值从300亿美元飙升至1万亿美元，增长超33倍

⏰ 05:45 | ❤️ 412点赞 | 📝 42词 | 查看原文 →

↑ 返回顶部

Amira Zairi @azed_ai

AI Educator & Creator | Ambassador @Adobe @LeonardoAi & @tripoai | Partner with leading brands | Collaboration → [email protected] | 影响力: 57.13k万粉丝

💡 核心观点: 分享3D立体书插画提示：分层纸艺场景、柔和光影、手作质感。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认

事实核查:

✓ 可验证: 推文描述了一个3D立体书插画的Prompt，包含分层纸张元素、柔和光线、纹理纸面、手工风格和特定配色方案 (该描述是公开分享的Prompt内容，可通过推文原文直接验证，属于可复现的创作指导)
◐ 部分可验证: 建议查看ATLs（可能指Art Tag Lists或类似标签列表）以获取灵感 (“ATLs”含义不明确，若指向特定公开标签（如平台内的#ArtTags）则可部分验证，但需确认具体来源和有效性)
✓ 可验证: 该Prompt生成的插画需呈现轻微角度以展示深度和细节 (推文明确描述了视角要求，属于可验证的具体创作指令)

原文内容:

提示词分享：立体弹出书

提示：
一幅3D立体弹出书风格的插画，以[主题]为主体，通过分层纸艺元素展开成微型场景。采用柔和光线、质感纸张表面、充满童趣的手工外观，搭配[颜色1]与[颜色2]的粉彩色调，从轻微倾斜视角呈现画面深度与细节。

可参考ATLs获取灵感

⏰ 19:00 | ❤️ 189点赞 | 📝 48词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI安全核心问题是运行时行为风险，非漏洞发现能力。

可信度: 5/10 – 2项需进一步确认；2项为观点陈述

事实核查:

◐ 部分可验证: Anthropic的“Mythos”在真实curl代码库中发现1个真实漏洞 (需通过Anthropic官方公告或curl代码库的漏洞记录验证，但推文未提供具体漏洞编号或链接。)
◐ 部分可验证: 360的安全团队在OpenClaw生态中发现23个漏洞，包括关键远程代码执行漏洞和大规模提示注入绕过 (需360团队公开报告或OpenClaw漏洞库记录佐证，但推文未提供具体漏洞详情或来源链接。)
◦ 观点: 当前AI安全的核心问题是运行时行为（代码、提示、工具等交互）而非模型找漏洞能力 (属于对技术趋势的主观判断，缺乏直接可验证的客观数据支持。)

原文内容:

在智能体时代，AI安全的焦点已不再是模型能否发现漏洞。

Anthropic公司研发的"危险级优秀"Mythos系统曾在真实curl代码库中发现1个有效漏洞。

而中国安全团队360的漏洞挖掘智能体，则在更广阔的OpenClaw生态系统中独立发现了23个缺陷，包括关键远程代码执行漏洞和大规模提示注入绕过漏洞。

真正的智能体安全问题在于运行时行为：当系统尚未触及文件、开放端口或执行命令时，代码、提示词、工具、本地服务与权限之间就已开始交互。

如果您正在开发智能体系统，这条推文值得您永久收藏。↓

⏰ 03:39 | ❤️ 23点赞 | 📝 95词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: Uber CEO称AI工程师效率远超人类，未来将用AI取代人力。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 90% of Uber’s engineers use AI currently. (需Uber官方公开内部工具使用数据或第三方审计报告验证，但若CEO公开声明且未被反驳，可部分采信。)
✓ 可验证: Top 30% AI power-users see unprecedented productivity gains (e.g., pushing more code diffs). (缺乏具体指标定义（如“diffs”数量基准）及公开数据支持，“unprecedented”为主观描述，需内部数据验证。)
◦ 观点: In 5 years, AI agents + GPU ROI will surpass human engineers, leading to hiring AI over humans. (属于CEO对未来的预测，依赖技术发展及市场变化，无客观事实依据，为典型主观观点。)

原文内容:

优步（Uber）首席执行官达拉·科斯罗萨西此前表示，目前公司90%的工程师都在使用人工智能，但其中前30%的高阶用户正获得前所未有的生产力提升。

这些AI高阶用户正在向代码库推送最大数量的"差异提交"。

他预测五年后，人类工程师的投资回报率将被增加更多AI智能体和GPU算力的投资回报率超越。因此到那时，公司将选择雇佣更多AI智能体并采购英伟达GPU，而非聘用人类软件工程师。

——摘自YouTube频道《The Diary Of A CEO》（链接见评论区）

⏰ 02:40 | ❤️ 149点赞 | 📝 94词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI冲击白领工作未达预期，人类判断力仍不可替代。

可信度: 10/10 – 3项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: OpenAI CEO Sam Altman表示，AI导致白领工作崩溃的担忧并未像他预期的那样快速到来 (可通过公开报道（如wionews原文链接）或Altman本人公开演讲/采访记录直接验证其言论真实性。)
✓ 可验证: Altman曾警告AI可能对常规办公室工作（尤其是初级任务）造成严重冲击 (Altman过去的相关警告可通过历史采访、演讲或OpenAI官方博客等公开资料查证（例如2023年国会听证会记录）。)
◦ 观点: Altman认为当前工作模式是“弯曲而非断裂”，因企业仍需要人类在判断、信任、情感解读等领域的参与 (该声明属于Altman对AI影响的主观分析，缺乏量化数据支持，无法通过客观事实直接验证。)

原文内容:

wionews：OpenAI首席执行官山姆·奥特曼最新表示，令人担忧的AI白领岗位崩塌并未如他预期般迅速到来。

奥特曼此前曾警告称，常规办公室工作，尤其是初级岗位任务，可能因AI而遭受重创。

他最新观点认为，职场正在"弯曲而非断裂"，因为企业仍需要人类进行判断决策、建立信任、把握审美品位、解读情绪，以及在复杂沟通场景中根据情境得出正确答案。

⏰ 02:00 | ❤️ 67点赞 | 📝 91词 | 查看原文 →

↑ 返回顶部

谷歌AI实验室 @googleaistudio

The fastest path from prompt to prototype to production with Gemini | 影响力: 162.34k万粉丝

💡 核心观点: 随时随地用谷歌AI Studio实现创意灵感。

可信度: 8/10 – 2项声明可直接验证；1项为观点陈述

事实核查:

✓ 可验证: 用户可以在Android上预注册Google AI Studio应用 (通过提供的Google Play商店链接可直接跳转至应用页面，确认预注册功能是否存在)
✓ 可验证: 用户可以在iOS上预购Google AI Studio应用 (通过提供的Apple App Store链接可直接跳转至应用页面，确认预购选项是否存在)
◦ 观点: 该应用支持“随时随地构建灵感”（build your ideas wherever inspiration strikes） (该描述为宣传性语言，属于主观功能愿景，无具体功能证据或客观标准验证)

原文内容:

灵感涌现之处，即刻构建你的创意

安卓版预注册：
https://play.google.com/store/apps/details?id=com.google.android.apps.aistudio…

iOS版预购：
https://apps.apple.com/us/app/google-ai-studio/id6761388855…

⏰ 01:24 | ❤️ 844点赞 | 📝 36词 | 查看原文 →

↑ 返回顶部

Alex Prompter @alex_prompter

Marketing + AI = $$$
@godofprompt (co-founder) | 影响力: 94.19k万粉丝

💡 核心观点: 各大AI模型互相犀利点评同窗表现。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 推文作者声称向多个主流大语言模型（LLM）提问，要求它们以“大学同学”的身份互相描述 (可通过实际向ChatGPT、Claude等模型提问类似问题验证其回应风格，但无法直接验证推文作者是否真实发起过此实验或是否完整呈现结果。)
◦ 观点: 各LLM在互相描述时“没有保留”（即可能包含尖锐或幽默的评价） (该描述为主观判断，取决于对“没有保留”的解读。不同用户对模型回答的“尖锐性”感知可能不同，且模型输出可能受提问方式影响。)
✓ 可验证: 推文列举了ChatGPT、Claude、Gemini、Grok和Perplexity五个模型的互评结果 (若推文附具体回答截图或文本，可直接验证内容真实性；若无，则需用户自行测试相同问题对比结果（部分模型如Grok需特定平台访问）。)

原文内容:

我让各大主流语言模型互相评价，就像让它们在大学里以同学身份彼此描述。

它们可一点都没留情面。以下是ChatGPT、Claude、Gemini、Grok和Perplexity对彼此的评价：

⏰ 17:56 | ❤️ 361点赞 | 📝 37词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 字节跳动以低价AI业务股票激励争夺AI人才。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: ByteDance is paying its Seed AI staff with special unit-linked shares (可通过FT原文链接（需订阅或访问权限）验证，但需确认ByteDance官方是否公开披露此类股权激励细节。若无直接官方声明，则部分依赖媒体报道。)
◐ 部分可验证: Special shares give employees low-priced Doubao stock at $13 a share, tied to Seed AI (股票定价和绑定Seed AI业务的信息可能来自内部文件或知情人士，需ByteDance或员工证实。公开财报或公告中可能未明确提及。)
✓ 可验证: The stock is linked specifically to ByteDance’s AI business performance, not the whole company (股权结构与业务绑定的具体条款通常为内部协议，除非公司主动披露（如招股书），否则无法独立验证。)

原文内容:

英国《金融时报》：中国人工智能人才争夺战现以特殊股票为筹码

字节跳动正通过特殊单位挂钩股支付其Seed AI团队薪酬，员工可获得每股13美元的低价"豆包"股票，该股票与Seed项目直接绑定。

即这类股票专门挂钩字节跳动人工智能业务的绩效或估值，而非整个字节跳动公司。

⏰ 01:39 | ❤️ 31点赞 | 📝 65词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: 长文本AI易被少量错误段落污染，首段误导即致整体偏差。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: A long-context AI can be poisoned by a few plausible wrong passages, not gradually worn down by many. (该声明涉及AI模型对错误信息的敏感性，需通过实验验证（如论文或基准测试），但推文未提供具体实验数据或来源，需进一步查阅相关研究。)
◐ 部分可验证: At just 10% bad context, the damage is already almost done. (该声明提出了量化阈值（10%错误内容导致显著损害），需依赖具体实验设置（如模型类型、任务类型），但推文仅提到“authors’ setup”和“Qwen2.5”示例，缺乏公开可查的完整数据。)
✓ 可验证: Hard distractors are dangerous because they are close enough to the question to look useful, but wrong enough to pull the model away from the gold evidence. (该声明符合已知的AI注意力机制原理（如softmax注意力偏向相关性高的干扰项），可通过机器学习论文或模型行为分析验证，但具体案例需结合实验数据。)

原文内容:

长文本AI可能被少量看似合理的错误段落所毒害，而非被大量错误逐渐侵蚀。

当错误内容仅占10%时，损害几乎已经形成。

"第一滴墨"效应，如同单滴墨水污染整杯清水。

常见误区是将上下文视为存储空间。

在处理长提示时，模型并非平静地将事实分门别类，而是在进行一场关于哪些文本片段值得关注的竞争——这些竞争将决定最终答案的生成。

强干扰项之所以危险，在于它们并非随机垃圾。

它们与问题足够接近而显得有用，却又足够错误以至于将模型从关键证据引开。

在作者设定的实验中，若性能损失与干扰项比例成正比，前10%的强干扰项本应造成约10%的损害，但在128K token的Qwen2.5测试环境下，实际损害达到58%。

其机制一旦点破便十分简单：softmax注意力机制奖励相对接近性，因此当误导性段落与答案在逻辑空间相邻时，其对分母的影响远超无关填充内容。

仅占10%比例的强干扰项，竟能产生约97%的干扰压力。

这改变了我们解读过滤结果的视角。

若删除文档确有助益，其益处可能更多源于缩短整体"战场"，而非单纯清除"不良"内容。

对于长文本系统而言，最安全的误导性段落就是永远不会进入提示词的那一段。

---

链接 – arxiv.org/abs/2605.10828

标题：《第一滴墨：误导信息在长文本推理中的非线性影响》

⏰ 01:22 | ❤️ 32点赞 | 📝 255词 | 查看原文 →

↑ 返回顶部

Pierrick Chevallier | IA @charaspowerai

AI VFX Artist & Photoshop Editor for House of David Saison 2 for Amazon | AI Artist & Formateur | 影响力: 0万粉丝

💡 核心观点: AI代理一键生成完整广告，高效自动化。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 通过一个提示（ONE prompt）生成了完整的30秒以上的Alpine A390广告 (需实测或查看具体工具（如Agent One）的功能演示，但无公开直接证据证明该广告的完整生成过程)
◐ 部分可验证: 广告包含图像、视频、剪辑和最终合成，全部由Agent One自主处理 (需依赖工具的实际操作验证或官方功能说明，但推文未提供具体生成内容或流程证据)
✓ 可验证: Agent One的工作流程可被复现（“我会展示具体操作方式”） (若推文作者后续提供教程或工具公开说明，可通过实际测试验证，但目前未实现)

原文内容:

Agent One真的开始让人觉得像开了外挂  

仅用一条指令，我就为Alpine A390生成了一则完整的30秒+广告：  
- 图像素材  
- 视频片段  
- 剪辑处理  
- 最终合成  

这个智能体自主完成了全流程。  
如果你想掌握这种工作方式，请收藏这个主题——我会完整展示它的运作机制

⏰ 00:59 | ❤️ 53点赞 | 📝 53词 | 查看原文 →

↑ 返回顶部

Rohan Paul @rohanpaul_ai

Compiling in real-time, the race towards AGI. The Largest Show on X for AI. | 影响力: 0万粉丝

💡 核心观点: AI使人感觉高效但实际收益微乎其微，且易形成依赖循环。

可信度: 10/10 – 3项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: AI can make people feel more efficient even when they are not actually becoming much more efficient (该声明基于MIT、斯坦福等机构的研究论文，但需查阅具体论文数据和方法论以确认结论的普遍性及实验设计是否支持这一结论)
✓ 可验证: People often use AI for simple tasks because it feels like it saves time, but the measured benefit is often tiny or negative (可通过论文中的实验数据（如2,691名参与者的测试结果）验证实际节省时间（7.5秒）与预期（55.7秒）的差异，但需确认实验任务是否具有代表性)
◐ 部分可验证: AI dependence grows from a mistaken feeling of convenience, not just real productivity gains (论文中提到的反馈循环（feedback loop）和参与者行为数据可部分支持此声明，但需排除其他潜在影响因素（如任务设计、用户习惯等）)

原文内容:

人工智能会让人产生效率提升的错觉——即便实际效益微乎其微。  

来自麻省理工、斯坦福、纽约大学和普林斯顿的最新研究指出：人们常将AI用于简单任务，误以为能节省时间精力，但实测效益往往微不足道、难以显现，甚至适得其反。  

核心发现在于反馈循环：一旦开始使用AI，人们就会越来越依赖它，即便处理本可以更快独立完成的简单任务时也是如此。换言之，AI依赖可能源于虚幻的便利感，而非真实的生产力提升。  

在针对2,691名参与者的三项预注册研究中，人们使用AI处理基础运算、拼写检查、信息回忆和简短改写的频率远超预期，尤其在简单任务上。参与者预期AI平均能节省55.7秒，实测节省仅7.5秒。  

处理简单工作时，真正的隐性成本并非智能不足，而是界面摩擦：构思指令、等待响应、阅读结果、核对内容、判断答案是否可用。一旦启动这个循环，就会产生"工作已外包"的错觉——尽管只是把原有流程重新排列组合。  

关键结论在于：AI使用会自我强化合理性认知。仅需两次使用后，受试者就更倾向于继续使用AI，即便独立完成速度更快。真正的危险并非戏剧性的依赖，而是悄然的认知重塑。  

今日向AI寻求琐碎答案的人，明天未必会丧失能力，但可能越来越难准确判断：何时自己的大脑才是更高效的工具。  

arxiv. org/abs/2605.22687  
《效率增益错觉：人们低估AI使用频率并高估其在简单任务中的收益》

⏰ 00:48 | ❤️ 54点赞 | 📝 294词 | 查看原文 →

↑ 返回顶部

# x每日奏折