【AI 奏折】06月20日

x每日奏折1个月前发布 tianming

209 0 0

【AI 奏折】2026年06月20日

共收录 18 篇深度内容

📋 今日内容速览

快速浏览，点击感兴趣的推文查看详细分析

Robinson · 鲁棒逊: 低壁垒行业因过度竞争挤压生存空间。
GitHubDaily: 开源插件自动整理论文生成结构化笔记并导入Obsidian。
dontbesilent: 避免专业术语才能有效吸引大众消费者。
Geek: 整理中国传统纹样高清素材库，分类详实开放共享。
宝玉: AI生图技能可自动为PPT等设计作品智能配图并导出编辑。
dontbesilent: 流量并非总是有益，精准小众内容更具商业价值。
dontbesilent: 生意成败取决于目标，规模化或反规模化各有利弊。
GitHubDaily: 生成式AI全景学习指南：理论实战结合，涵盖核心技术与云部署案例。
GitHubDaily: generative-ai提供系统化AI学习与实战资源，涵盖理论代码及部署指南。
向阳乔木: 多模型协作工具MCP开源，优化不同场景的AI使用效率。
iGeekbb: 北洋水师曾聘外籍将士参战，甲午海战多人伤亡。
Orange AI: 好行为可跨领域泛化，提升模型整体表现。
向阳乔木: 通过MCP连接网页版ChatGPT实现本地文件读取和双倍Codex额度。
Berryxia.AI: AI自主升级元技能框架，展示强大工程重构能力。
向阳乔木: 姚老师整合优化的Meta Skill远超官方工具，功能强大易用。
Berryxia.AI: Midjourney跨界研发超声扫描仪，用AI重构医疗成像范式。
Berryxia.AI: 开源浏览器agent模板B实现真实网页操作与实时可视化。
Berryxia.AI: 开源社区共享agent循环模板，避免重复设计轮子。

📖 详细内容

Robinson · 鲁棒逊 @python_xxt

Insight |
碳基信息漏斗丨
Believable. Reliable. | 影响力: 28.16k万粉丝

💡 核心观点: 低壁垒行业因过度竞争挤压生存空间。

可信度: 6/10 – 2项需进一步确认；3项为观点陈述

事实核查:

◐ 部分可验证: 在不到100米的范围内开了6家冷饮批发小店 (可通过实地考察或地图软件（如高德、百度地图）验证店铺数量和分布，但需确认具体位置和店铺类型是否完全匹配描述。)
◐ 部分可验证: 冷饮批发店提供“不看根数，六折”的优惠 (需实地走访或联系店铺确认促销政策，但可能存在时效性或区域性差异，无法完全依赖推文描述。)
◦ 观点: “还有一点需求、但没有壁垒”的行业容易被小资本和劳动力挤爆 (属于经济现象的主观分析，缺乏具体数据或案例支撑，无法直接验证其普遍性。)

原文内容:

一个观察

最卷的行业，是那些“还有一点需求、但没有壁垒”的生意

傍晚在家附近逛了一下，惊讶的发现，在不到100米的范围内，竟然开了6家 冷饮批发的小店，冰世界、冰令营、冰工厂、冷饮批发，而且不看根数，就可以六折了.....

这让我联想到，哪怕有一点点确定性需求的地方，都会被大量无处可去的小资本、小劳动力、小店主迅速挤爆

很可能，在下行时期，留给普通人的缝隙，会很快被溢出的小劳动力、小资本，像水一般的浸润式填充

原本只够一两家吃饭的缝隙，因为拥挤，
反而把生存空间堵塞了......

⏰ 20:52 | ❤️ 20点赞 | 📝 196字 | 查看原文 →

↑ 返回顶部

GitHubDaily @github_daily

挖掘开源的价值
坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术
A list cool, interesting projects of GitHub.
公众号：GitHubDaily | 影响力: 77.87k万粉丝

💡 核心观点: 开源插件自动整理论文生成结构化笔记并导入Obsidian。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: DeepPaperNote 是一个开源插件，能自动完成论文的证据收集、结构化整理和笔记生成，并支持输入论文标题、链接或本地 PDF (可通过提供的 GitHub 链接（http://github.com/917Dhj/DeepPaperNote）直接查看代码仓库、文档及功能描述，确认其开源属性和核心功能。)
◐ 部分可验证: 生成的笔记带完整的元数据和目录结构，直接存进 Obsidian 知识库，还能对接 Zotero 复用本地文献 (GitHub 文档可能描述该功能，但需实际安装测试以确认与 Obsidian 和 Zotero 的兼容性及具体实现效果。)
✓ 可验证: 可以安装到 Claude Code 或 Codex 上使用 (未提供具体安装指南或兼容性证明，且 “Claude Code” 和 “Codex” 的指向不明确（可能是笔误或非公开工具），无法直接验证。)

原文内容:

每次读完一篇论文后，想要把内容整理成笔记，在 PDF 和笔记工具之间来回切换，颇为麻烦。

最近找到 DeepPaperNote 这个开源插件，打通了论文到 Obsidian 笔记的链路。

给它一个论文标题、链接或本地 PDF，就能自动完成证据收集、结构化整理和笔记生成。

GitHub：http://github.com/917Dhj/DeepPaperNote…

它会根据论文类型调整阅读策略，方法论文、综述论文、实验论文各有侧重。

关键公式、实验数据、图表上下文都会保留，图片能直接插入，插不了的会留好占位说明。

生成的笔记带完整的元数据和目录结构，直接存进 Obsidian 知识库，还能对接 Zotero 复用本地文献。

可以安装到 Claude Code 或 Codex 上使用，有了它，我们能把更多精力留个思考。

⏰ 21:30 | ❤️ 27点赞 | 📝 212字 | 查看原文 →

↑ 返回顶部

dontbesilent @dontbesilent

商业哲学爱好者
伪装为早期维特根斯坦的晚期维特根斯坦
抖音/小红书/视频号：dontbesilent 聊赚钱
6.12 广州线下课，微信 DBsilent | 影响力: 78.11k万粉丝

💡 核心观点: 避免专业术语才能有效吸引大众消费者。

可信度: 8/10 – 1项声明可直接验证；2项需进一步确认；2项为观点陈述

事实核查:

◐ 部分可验证: FDE 这个词最近被大家频繁使用 (可通过社交媒体趋势分析工具（如 Google Trends、Twitter 话题统计）验证该词的近期使用频率，但需明确时间范围和平台范围。)
◦ 观点: 使用 FDE 这类术语会降低大众市场的购买意愿 (这是基于个人经验的营销策略观点，缺乏具体实验数据或消费者行为研究的直接支持。)
✓ 可验证: 用“苹果 17”比“iPhone 17”更能吸引普通消费者 (涉及假设性对比，需通过 A/B 测试或市场调研验证，但推文未提供实际案例或数据。)

原文内容:

我发现大家最近喜欢用 FDE 这个词

想赚钱的话，尤其是面向大众市场赚钱的话，这个词尽量少用或者不用

你无法让买家购买一个他不知道是什么东西

你应该让他买苹果 17，而不是 iPhone 17

如果你想炫技，最终你会因此而花钱，而不是赚钱

这个“花钱”体现在：你投入了时间成本和金钱成本，把你的流量打出去，然后没有人看得懂你在说什么

你会彻底消失在流量里，没人知道你的存在

⏰ 19:37 | ❤️ 35点赞 | 📝 151字 | 查看原文 →

↑ 返回顶部

Geek @geekbb

💡 核心观点: 整理中国传统纹样高清素材库，分类详实开放共享。

可信度: 10/10 – 4项声明可直接验证；1项需进一步确认

事实核查:

✓ 可验证: 已上线100张高清卡片图（规划总共800张），按6大类分类 (可通过提供的GitHub链接（https://github.com/dososo/chinese-traditional-patterns）直接查看已上线的卡片数量、分类及具体内容，规划总数属于项目目标，但当前进度可验证。)
✓ 可验证: 每张卡片为1086×1448的PNG，附中文名、英文名、寓意说明等元数据 (GitHub仓库中的文件可直接下载，检查图片分辨率、格式及元数据字段（如中英文名称、寓意说明等），完全可验证。)
◐ 部分可验证: 素材库包含“中文详情页”，讲解构成、载体、配色和现代用法 (需实际下载文件确认是否存在详情页及内容完整性，但基于GitHub仓库的公开性，部分信息（如文件命名、目录结构）可初步验证。)

原文内容:

把散落在瓷器、织锦、建筑里的中国传统纹样重新整理成一套开放的、带高清图的素材库。

目前已上线 100 张高清卡片图（规划总共 800 张），按 6 大类分好：植物花卉、动物瑞兽、几何纹样、云水山石、吉祥器物和文字福寿。

每张都是一张 1086×1448 的 PNG，附中文名、英文名、寓意说明、视觉关键词，还有一页中文详情讲构成、载体、配色和现代用法。

https://github.com/dososo/chinese-traditional-patterns…

⏰ 16:20 | ❤️ 103点赞 | 📝 125字 | 查看原文 →

↑ 返回顶部

宝玉 @dotey

Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management. | 影响力: 0万粉丝

💡 核心观点: AI生图技能可自动为PPT等设计作品智能配图并导出编辑。

可信度: 9/10 – 2项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: baoyu-design技能支持在制作PPT、动画视频或网站时调用AI生图技能配图，需本地Agent配置画图Skill (需通过GitHub链接查看技能文档和代码，确认功能逻辑，但实际调用需本地环境部署测试，部分依赖用户配置。)
◐ 部分可验证: Codex可直接调用内置画图工具，Claude Code需配合baoyu-image-gen技能调用Codex CLI画图 (需验证Codex和Claude的官方文档是否支持画图功能，且baoyu-image-gen的GitHub代码需检查是否兼容CLI调用，但实际集成效果需实测。)
✓ 可验证: 该技能可自动在PPT合适位置插入配图，并导出为PPTX供PowerPoint/Keynote二次编辑 (GitHub仓库的README或示例文件可能提供功能演示或输出样本，可直接检查是否支持PPTX导出及编辑兼容性。)

原文内容:

宝玉设计技能更新：现可在制作PPT、动画视频或网站时调用AI生图功能进行配图，前提是您的本地Agent已配置绘图技能。

若使用Codex，可直接调用内置画图工具；若使用Claude Code，则可配合宝玉图像生成技能调用Codex CLI进行绘图。

该功能特别适合生成PPT效果，能自动在PPT的合适位置插入配图。最强大的是，您可以将图片与PPT一起导出为PPTX格式，并继续使用PowerPoint或Keynote进行二次编辑。

推荐体验：
宝玉设计技能：https://github.com/jimliu/baoyu-design…
宝玉图像生成技能：https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-image-gen…

⏰ 15:46 | ❤️ 243点赞 | 📝 125字 | 查看原文 →

↑ 返回顶部

dontbesilent @dontbesilent

商业哲学爱好者
伪装为早期维特根斯坦的晚期维特根斯坦
抖音/小红书/视频号：dontbesilent 聊赚钱
6.12 广州线下课，微信 DBsilent | 影响力: 78.11k万粉丝

💡 核心观点: 流量并非总是有益，精准小众内容更具商业价值。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 短视频播放量超过30万的内容会比较水，不利于直接赚钱。 (可通过分析该用户的历史短视频数据（如播放量、内容质量、变现效果）进行部分验证，但需用户公开具体数据或第三方平台提供统计支持，且“水”的定义主观性较强。)
✓ 可验证: 播放量超过300万的流量对作者无实际价值，因为目标客户不看重此类流量。 (依赖作者个人业务模式和客户偏好，属于未公开的内部反馈或主观判断，无法通过公开数据验证。)
◐ 部分可验证: 播放量低于3万的内容可能更有深度且能直接赚钱，因与忠实买家达成共识。 (需对比该用户低播放量内容的实际变现效果与受众反馈，但“深度”和“共识”属主观描述，公开数据可能无法完全支持。)

原文内容:

《流量焦虑》

今天有人问我有没有流量焦虑，我觉得这个问题值得记录一下

我的习惯依然是判断这个问题背后的假设 —— 流量是个好东西，流量是个我们应该追逐的东西

但在我的真实业务里，常常不是这样的

比如说，如果我想要赚钱的话，我的短视频一般来讲播放量不能超过 30 万。一旦超过 30 万，这个内容就会比较水

那水一点的内容能不能做呢？也可以。如果播放量可以压在 300 万以内，那么虽然这个内容不能帮我直接赚钱，但是可以扩散影响力间接赚钱

但如果播放量超过 300 万，那基本上就是整活了。这种流量上和粉丝量的增长，对我来说真的没什么价值。给我买单的人真的不看重这个东西

反过来讲，如果我的一些内容真的流量很差，比如我在抖音这条内容连 3 万播放都没有。往往这可能是一个既有内容深度，又能快速赚钱的内容

除了让我的账号在数字上看起来不太好看，可以说是没有任何负面影响。因为我和我的少部分忠实买家在这里达成了共识。我们聊的就是大众不感兴趣的深度内容

所以回到开头说的，我有流量焦虑吗？

可能我更焦虑的是：不能高频产出这种播放量不到 3 万的内容

⏰ 14:43 | ❤️ 48点赞 | 📝 405字 | 查看原文 →

↑ 返回顶部

dontbesilent @dontbesilent

商业哲学爱好者
伪装为早期维特根斯坦的晚期维特根斯坦
抖音/小红书/视频号：dontbesilent 聊赚钱
6.12 广州线下课，微信 DBsilent | 影响力: 78.11k万粉丝

💡 核心观点: 生意成败取决于目标，规模化或反规模化各有利弊。

可信度: 8/10 – 1项声明可直接验证；2项需进一步确认；2项为观点陈述

事实核查:

◐ 部分可验证: 求职咨询行业，很多人可以轻易做到5w/月，但收入上限大概锁死在10w/月 (行业收入数据需依赖市场调研或从业者公开报告，但“轻易做到”和“上限锁死”属于主观判断，缺乏普遍数据支持。)
◐ 部分可验证: 求职咨询买家更愿意花高价购买非标准化服务，而非低价标品（如¥399的课程） (可通过用户调研或平台交易数据验证偏好差异，但“高价非标 vs 低价标品”的结论需具体案例支撑，可能存在个体差异。)
◦ 观点: 非标重度服务是月入几万的护城河，而规模化需从第一天卖标品以实现更高收入目标 (商业模式选择（非标 vs 标品）与收入目标的关联性属于策略性观点，无客观标准验证其普适性。)

原文内容:

有些生意成功的核心是规模化
有些生意成功的核心是反规模化

以求职咨询为例，很多人可以轻易做到 5w/月，但收入上限大概锁死在 10w/月

原因是这批买家的诉求是预支 1～2 个月的工资让自己找到工作，他们希望花高价购买非标准化的服务，但不愿意花低价买标品（比如售价 ¥399 的课）

想要规模化的卖家，都不愿意去做非标重度服务，如果你愿意做，你就可以相对容易月入几万。如果这就是你的收入目标，你就不该听信别人去做标品，非标才是你的护城河

但如果你的收入目标高于此，那你从第一天开始就要硬着头皮卖标品

什么是好内容？能满足你目标的内容就是好内容
什么是好产品？能满足你目标的产品就是好产品

所以，规模化也好，反规模化也好，前提是定好你的增长目标

如果你没有目标的话，无论你的产品有人买还是没人买，无论你的产品是标准化的还是非标准化的，都不是好产品

⏰ 14:31 | ❤️ 49点赞 | 📝 322字 | 查看原文 →

↑ 返回顶部

GitHubDaily @github_daily

💡 核心观点: 生成式AI全景学习指南：理论实战结合，涵盖核心技术与云部署案例。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: generative-ai 提供了一份全景式的 AI 学习与实战指南，涵盖大语言模型基础、向量嵌入、提示词工程等核心概念，每个知识点都配有文档和代码。 (可通过 GitHub 链接（http://github.com/genieincodebottle/generative-ai）直接查看仓库内容，确认是否包含所述文档、代码及知识点覆盖范围。)
✓ 可验证: 收录了 20 多个项目案例，包括高级检索增强生成（RAG）模式、多智能体系统搭建、自然语言转 SQL 查询等。 (通过 GitHub 仓库的公开项目文件或案例目录可统计具体案例数量及类型，确认是否与声明一致。)
◐ 部分可验证: 整理了 AWS、Azure、Google Cloud 三大云平台的部署指南。 (需检查仓库中是否存在对应云平台的部署文档，但实际部署效果需通过实测验证。)

原文内容:

想系统学习生成式 AI，网上找到资料过于零散，或者只讲理论没有实战，学习效率很低。

在寻找的众多资料中，generative-ai 脱颖而出，提供了一份全景式的 AI 学习与实战指南。

涵盖大语言模型基础、向量嵌入、提示词工程等核心概念，每个知识点都配有文档和代码。

GitHub：http://github.com/genieincodebottle/generative-ai…

收录了 20 多个项目案例，包括多种高级检索增强生成（RAG）模式、多智能体系统搭建、自然语言转 SQL 查询、情感分析等，都能直接跑起来。

还整理了 AWS、Azure、Google Cloud 三大云平台的部署指南，以及面试题库和职业路径建议。

⏰ 12:00 | ❤️ 26点赞 | 📝 176字 | 查看原文 →

↑ 返回顶部

GitHubDaily @github_daily

💡 核心观点: generative-ai提供系统化AI学习与实战资源，涵盖理论代码及部署指南。

可信度: 10/10 – 2项声明可直接验证；1项需进一步确认；2项为观点陈述

事实核查:

✓ 可验证: generative-ai 提供了一份全景式的 AI 学习与实战指南，涵盖大语言模型基础、向量嵌入、提示词工程等核心概念，每个知识点配有文档和代码 (可通过 GitHub 链接（http://github.com/genieincodebottle/generative-ai）直接查看仓库内容，确认是否存在相关文档和代码示例。)
◐ 部分可验证: 收录了 20 多个项目案例，包括高级检索增强生成（RAG）、多智能体系统搭建、自然语言转 SQL 查询等 (GitHub 仓库可验证项目案例的存在性和数量，但需实际运行代码以确认功能完整性（如是否“能直接跑起来”）。)
✓ 可验证: 整理了 AWS、Azure、Google Cloud 三大云平台的部署指南 (可通过 GitHub 仓库文件目录或文档内容直接验证是否存在三大云平台的部署指南。)

原文内容:

想系统学习生成式 AI，网上找到资料过于零散，或者只讲理论没有实战，学习效率很低。

在寻找的众多资料中，generative-ai 脱颖而出，提供了一份全景式的 AI 学习与实战指南。

涵盖大语言模型基础、向量嵌入、提示词工程等核心概念，每个知识点都配有文档和代码。

GitHub：http://github.com/genieincodebottle/generative-ai…

收录了 20 多个项目案例，包括多种高级检索增强生成（RAG）模式、多智能体系统搭建、自然语言转 SQL 查询、情感分析等，都能直接跑起来。

还整理了 AWS、Azure、Google Cloud 三大云平台的部署指南，以及面试题库和职业路径建议。

⏰ 12:00 | ❤️ 22点赞 | 📝 176字 | 查看原文 →

↑ 返回顶部

向阳乔木 @vista8

喜欢摇滚乐、爱钓鱼的PM
网站：https://qiaomu.ai | 影响力: 0万粉丝

💡 核心观点: 多模型协作工具MCP开源，优化不同场景的AI使用效率。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◦ 观点: Codex产品优秀，但有些场景还是需要Claude Code (该声明是对产品性能的主观评价，缺乏客观标准或公开数据支持)
◐ 部分可验证: 写作推荐使用4.6 sonnet，前端网页推荐使用4.8 (可通过官方文档或社区测试验证模型版本是否存在及推荐用途，但具体性能优劣需实测对比)
✓ 可验证: 项目已免费开源，见评论区 (可通过查看评论区链接直接访问开源仓库，验证项目是否存在及开源状态)

原文内容:

Codex产品优秀，但有些场景还是需要Claude Code。

比如写作还是用4.6 sonnet，前端网页用4.8 。

还有些场景要随时调用国产便宜模型，比如智谱 GLM-5.2，Deepseek V4 Flash等，用于开发、翻译等。

开发了个MCP，支持Codex中掉CC干活。

也支持多模型N轮讨论，交给Codex总结出方案。

项目已免费开源，见评论区

⏰ 11:32 | ❤️ 84点赞 | 📝 90字 | 查看原文 →

↑ 返回顶部

iGeekbb @igeekbb

发一些碎碎念和有趣的东东，主打一个快分享。-私信开放欢迎投稿- | 影响力: 74.97k万粉丝

💡 核心观点: 北洋水师曾聘外籍将士参战，甲午海战多人伤亡。

可信度: 9/10 – 2项声明可直接验证；2项需进一步确认

事实核查:

◐ 部分可验证: 北洋水师长期聘用过相当数量的外籍人员，来源以英国、德国为主，也有美国、法国人。 (该声明可通过历史档案、学术研究（如《北洋海军外籍雇员考》等论文）或清末官方文档（如《李文忠公奏稿》）部分验证，但具体人数和国籍比例因统计来源差异可能存在争议。)
✓ 可验证: 甲午战争期间有8名洋员随北洋舰队参加黄海海战，其中2人阵亡、4人重伤。 (该数据可通过甲午战争史料（如《海事档》《中日战争》丛刊）及外籍参战者个人记录（如马吉芬回忆录）交叉验证，且阵亡名单见于战后奏报。)
✓ 可验证: 美国人马吉芬以“镇远”舰帮带身份参加黄海海战并负重伤。 (马吉芬的职务和经历有其自述《鸭绿江外的海战》佐证，并与清廷档案（如李鸿章奏折）及国际媒体报道（1894-1895年西方报纸）一致。)

原文内容:

才知道北洋水师有外籍将士

北洋水师长期聘用过相当数量的外籍人员，来源以英国、德国为主，也有美国、法国人；历史统计略有差异，有的说约160余人，有的说近200人。

甲午战争期间外籍人员不仅存在，而且确实随舰参战。1894年黄海大海战中有8名洋员随北洋舰队参战，其中2人阵亡、4人重伤。

美国人马吉芬原为天津水师学堂教习，甲午爆发时合约已满，但仍主动留下，以“镇远”舰帮带身份参加黄海海战并负重伤；英国人 Puevis 则任“致远”舰总管轮，原本准备回国休假，最终留下参战，并随“致远”一同沉没。

⏰ 11:22 | ❤️ 65点赞 | 📝 195字 | 查看原文 →

↑ 返回顶部

Orange AI @oran_ge

CEO of MarsWave @ColaOSOfficial | 影响力: 170k万粉丝

💡 核心观点: 好行为可跨领域泛化，提升模型整体表现。

可信度: 6/10 – 1项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: OpenAI研究发现，在训练大模型时，如果教它做一件坏事（如写不安全的代码），它会将坏行为泛化到其他领域（如健康、教育等）。 (可通过论文或官方研究数据验证是否存在“涌现失调”现象，但具体泛化程度和领域依赖实验细节，需完整论文支持。)
✓ 可验证: OpenAI实验表明，训练模型在特定领域（如诚实、透明等）表现良好时，这些好行为也会泛化到其他未训练领域（44个评测中均改善）。 (论文链接（https://alignment.openai.com/beneficial-rl/）提供了实验设计、评测指标和结果数据，可直接验证泛化效果的具体数值和领域覆盖。)
◐ 部分可验证: 模型在对抗压力（如恶意微调、adversarial prompt）下仍能保持好行为的韧性，且不影响正常指令响应。 (论文可能包含对抗测试的细节，但实际韧性表现需依赖具体实验参数和攻击方法，需进一步复现或第三方验证。)

原文内容:

OpenAI 发布的新论文太有趣了，有点探索人性底层原理的意味。

业界研究发现在对齐大模型的时候，有个很糟糕的现象叫 emergent misalignment（涌现失调）：
一个模型如果在训练时被教着做一件坏事，比如写不安全的代码，它会自己泛化到其他领域，包括健康、教育、科学、法律等等。也就是说，坏行为会被泛化。

OpenAI 把问题反过来想：那好行为会不会也泛化？
如果训练模型在一个领域表现得诚实、透明、谦逊、可纠正，它会不会在别的领域也变得更好？

于是他们造了一批贴近现实的对话数据，专门测这些特质：
-诚实
-认知谦逊（epistemic humility，就是"我不确定"的时候能说出来）
-元认知透明（能解释自己的思考过程）
-可纠正性（corrigibility，被指错能认）
-普遍的公平
-对人的关心

数据覆盖健康、教育、科学、法律、工程这些领域。
然后用 RL 训练，只混进去一小部分这种数据，其余还是常规训练数据。

实验结束后，有三个核心发现：

第一，在训练领域内，模型确实变得更诚实、更透明、更容易认错。

第二，在训练领域外，44 个独立的、训练时没见过的评测上，模型都变好了。欺骗、谄媚、reward hacking、有害建议……全都降了。甚至就算只拿健康数据训练，非健康领域也变好了。

第三，这种改变在对抗压力下时也表现得更有韧性。不管是 adversarial prompt 还是恶意微调，都更难把它推向坏行为。而且模型并没有变得"不可塑造"，正常指令它还是听的，只是对坏的方向变固执了。

这篇论文的启示是，RL 不仅可以强化代码，也可以强化道德。
也许对齐超级 AI 没有想象中那么复杂，只对齐底层逻辑就有很好的效果。

这跟人是很像的，人的各种行为在其底层存在一致性，通过一些小事就能看到一个人的底色。

很有意思。

论文地址：https://alignment.openai.com/beneficial-rl/

⏰ 06:40 | ❤️ 931点赞 | 📝 557字 | 查看原文 →

↑ 返回顶部

向阳乔木 @vista8

喜欢摇滚乐、爱钓鱼的PM
网站：https://qiaomu.ai | 影响力: 0万粉丝

💡 核心观点: 通过MCP连接网页版ChatGPT实现本地文件读取和双倍Codex额度。

可信度: 8/10 – 2项声明可直接验证；1项需进一步确认；1项为观点陈述

事实核查:

◐ 部分可验证: 开发一个MCP可以连接到网页版的ChatGPT (需实际开发或查看官方API文档确认是否存在MCP（可能指自定义代理/插件）的合法接入方式，但未提供具体技术实现或官方支持证据。)
✓ 可验证: 通过MCP可读取本地文件 (无具体代码或工具展示，且ChatGPT网页端默认无本地文件访问权限，需依赖未公开的第三方工具实现，安全性存疑。)
✓ 可验证: 配置需在ChatGPT设置中开启“高级模式”和“开发模式” (目前ChatGPT网页端公开设置中无此类选项，可能为虚构功能或内部测试特性（未开放给公众）。)

原文内容:

有意思，开发一个MCP，连接到网页版的ChatGPT。

使用这个MCP就能读取本地的文件。

Codex额度用光，无法重置时，也可以继续用ChatGPT开发。

变向获得了双倍codex额度，虽然有点诡异。

配置注意事项：

打开 ChatGPT网页端，设置->应用->高级模式->开启开发模式，添加MCP

⏰ 08:14 | ❤️ 492点赞 | 📝 86字 | 查看原文 →

↑ 返回顶部

Berryxia.AI @berryxia

| 影响力: 39.76k万粉丝

💡 核心观点: AI自主升级元技能框架，展示强大工程重构能力。

可信度: 10/10 – 2项声明可直接验证；2项需进一步确认；1项为观点陈述

事实核查:

✓ 可验证: 姚金刚老师将元Skill（yao-meta-skill）重构并升级到2.0版本，已推送至GitHub (可通过访问GitHub仓库直接查看代码提交记录、版本标签及更新文档，确认是否存在2.0版本更新。)
◐ 部分可验证: Codex在38小时内提交301个分支，完成元Skill的升级任务 (需查看GitHub仓库的分支提交记录和时间戳，但需确认是否由Codex自动完成（需访问具体日志或开发者声明）。)
◐ 部分可验证: 升级后的版本在结构、可靠性和可扩展性上有明显提升 (可通过代码对比和文档说明验证结构变化，但可靠性和扩展性需实际测试或依赖开发者提供的性能指标。)

原文内容:

有人用Codex连续干了38小时、提交301个分支，把自己的“创建skill的skill”升级到了2.0版本。
兄弟们，免费开源直接用啊！

姚金刚老师把元Skill（yao-meta-skill）做了重构和2.0升级，现在已经完成并推送到GitHub。

Codex在整个过程中持续拆解任务、提交分支、修复问题、迭代优化，最后产出了完整的升级方案和2.0与1.0的详细对比报告。

这个元Skill本身就是用来创建其他skill的工具，现在它自己先升级了一版。

升级后的版本在结构、可靠性和可扩展性上都有明显提升，而且所有文档和对比都公开了，别人可以直接参考怎么用agent做复杂工程重构。

最有意思的是整个升级过程本身就是一个活生生的例子：用高级agent（Codex）来重构“创建agent工具”的元框架。

这说明agent的能力已经强到可以自己参与到“如何更好地使用agent”的迭代里了。

地址见评论区

⏰ 08:01 | ❤️ 190点赞 | 📝 262字 | 查看原文 →

↑ 返回顶部

向阳乔木 @vista8

喜欢摇滚乐、爱钓鱼的PM
网站：https://qiaomu.ai | 影响力: 0万粉丝

💡 核心观点: 姚老师整合优化的Meta Skill远超官方工具，功能强大易用。

可信度: 6/10 – 1项声明可直接验证；1项需进一步确认；2项为观点陈述

事实核查:

◐ 部分可验证: 该Skill比官方的Skill-creator强大很多 (需通过实际功能对比测试验证，但缺乏官方或第三方公开的性能对比数据，主观性较强。)
✓ 可验证: 该Skill来源于Anthropic官方泄露的Claude code源码及全网其他模型的整合 (未提供Anthropic官方泄露证据或具体整合来源，且涉及未公开代码，无法直接验证。)
◦ 观点: 经过姚老师长达一个月的打磨，这是我用过的最好的Meta Skill (个人主观评价，无客观标准或第三方验证依据。)

原文内容:

强烈推荐安装这款Skill，其功能远超官方Skill-creator。

若您不熟悉Skill编写，使用姚老师的这款Skill即可轻松创作出90分水平的作品。

该Skill整合了Anthropic官方泄露的Claude代码源码及全网各类模型的Skill精华，堪称终极元Skill。

经过姚老师历时一个月的精心打磨，这是我用过最出色的Meta Skill。

Github地址：https://github.com/yaojingang/yao-meta-skill…

⏰ 07:17 | ❤️ 1095点赞 | 📝 81字 | 查看原文 →

↑ 返回顶部

Berryxia.AI @berryxia

| 影响力: 39.76k万粉丝

💡 核心观点: Midjourney跨界研发超声扫描仪，用AI重构医疗成像范式。

可信度: 10/10 – 2项声明可直接验证；1项需进一步确认；2项为观点陈述

事实核查:

◐ 部分可验证: Midjourney推出名为“Midjourney Scanner”的全身体超声计算断层扫描设备 (需通过官方视频或公告确认设备的具体参数和功能，但技术细节（如成像原理）需专业领域验证。)
✓ 可验证: 该设备目标是比传统MRI更快、更便宜、辐射更低 (需实际测试或第三方机构数据对比，目前仅为宣传主张，无公开性能报告。)
✓ 可验证: Midjourney从AI图像生成跨界到医疗硬件领域 (可通过公司官方声明或产品发布信息确认业务方向转变。)

原文内容:

Mdijourney 这几天搞大事了啊！！
直接搞出硬件产品、马斯克都直呼牛逼！

Midjourney突然扔出一个长达几分钟的技术视频，讲他们新造的“Midjourney Scanner”—，一个全身体超声计算断层扫描设备。

工作原理就是：用超声波阵列进行计算断层成像，目标是做出比传统MRI更快、更便宜、辐射更低的3D全身扫描方案。

整个视频像极了他们在做AI图像生成时的技术深度，但这次把“生成图像”变成了“真实采集和重建人体内部结构”。

这家公司本来是做AI图像生成的，现在直接下场造医疗硬件，而且视频拍得异常专业、诚恳，没有过度营销。

评论区有人说“从goon slop到医疗设备”，也有人在认真讨论超声断层成像的物理限制和实际落地难度。

最有意思的是这背后的野心：他们似乎在用AI的思维方式重新审视一个传统医疗设备领域。

可不是简单做图像增强，是再试图用计算成像的方式重构整个成像范式。

以前大家觉得Midjourney只是个“画画的AI”，现在他们用实际行动证明：当你真正掌握了视觉生成和计算成像的能力后，边界可以远超数字内容。

你觉得一家AI图像公司造医疗扫描仪，是疯狂的跨界还是必然的进化？

⏰ 07:06 | ❤️ 35点赞 | 📝 378字 | 查看原文 →

↑ 返回顶部

Berryxia.AI @berryxia

| 影响力: 39.76k万粉丝

💡 核心观点: 开源浏览器agent模板B实现真实网页操作与实时可视化。

可信度: 10/10 – 2项声明可直接验证；1项需进一步确认；2项为观点陈述

事实核查:

✓ 可验证: 开源了一个浏览器agent模板B，基于Vercel的Eve构建 (可通过GitHub或Vercel官方文档验证该模板是否存在及其技术栈)
◐ 部分可验证: 该模板能让agent使用真实的云端浏览器，并实时观察操作过程 (需实际测试模板功能是否支持云端浏览器交互及实时可视化，但开源代码本身可初步验证架构设计)
◦ 观点: 解决了传统browser agent模拟环境不透明或黑箱问题 (属于对技术方案的优劣评价，需对比其他工具才能验证，无直接客观标准)

原文内容:

这货Browser Use又整活了，兄弟们！ 
这下真的是给你的“Agent 长眼睛了！”

开源还免费

它直接开源了个浏览器agent模板B，让任何agent都能用上真实的云端浏览器，还能实时看到它在网页上操作。

这个模板叫B，基于Vercel的Eve构建。

给你的agent接上Browser Use Cloud browser后，它就能真正上网浏览、点击、填写表单，而且你能通过browser-harness实时看到整个过程。

GitHub上直接clone就能用，还支持初始化skills和MCPs。

以前做browser agent最麻烦的就是：要么用模拟环境看不见真实交互，要么黑箱运行出问题不知道哪里错了。

现在有了这个模板，agent在网页上的每一步都可视化、可调试，还能直接连真实云浏览器。

这其实把browser automation从“能用”推向了“真正好用”的阶段。

Agent不再是只在代码里模拟网页，现在能在真实网页环境里执行任务，还能被人类实时观察和干预。

最关键的是它开源了模板，任何人都能基于这个快速搭建自己的browser agent。

未来可能越来越多agent会默认带上一个“看得见”的浏览器，而不是纯文本交互。
现在开源的生态真好啊

⏰ 06:51 | ❤️ 53点赞 | 📝 320字 | 查看原文 →

↑ 返回顶部

Berryxia.AI @berryxia

| 影响力: 39.76k万粉丝

💡 核心观点: 开源社区共享agent循环模板，避免重复设计轮子。

可信度: 10/10 – 2项声明可直接验证；1项需进一步确认；2项为观点陈述

事实核查:

✓ 可验证: Matthew Berman建立了一个名为Loop Library的库，集中各种agent loop模板 (可通过推文提到的评论区链接访问该库，查看其内容和功能是否属实。若链接有效且库存在，则可直接验证。)
◐ 部分可验证: 该库支持用户搜索现成模板或提交自己的agent loop (需实际访问库的界面或文档，确认是否提供搜索和提交功能。若功能存在但需注册或权限，则为部分可验证。)
◦ 观点: 库的目标是减少从零设计loop的时间，解决agent开发中循环结构设计的痛点 (此为愿景或主观描述，无法直接验证，除非库的文档明确声明此目标。)

原文内容:

Matthew Berman直接建了个Loop Library，把各种agent loop集中起来，找现成模板、提交自己的，一键就能用。

这个库专门收集可直接拿来用的agent循环流程，从简单的任务自动化到复杂的多步工作流。

想找现成的就去搜，想贡献自己的就直接提交。

背后还有http://here.now合作托管，目标就是让大家不用每次都从零设计loop。

以前做agent最费时间的就是设计循环结构：怎么退出、怎么验证、怎么处理失败。

现在有了社区库，这些“基础设施”被公开化了。
你可以直接拿别人验证过的loop改一改就用，或者把自己的经验贡献出去，让更多人少踩坑。

这其实在把agent开发从“每次都要重新发明轮子”往“搭积木”方向推。

Loop不是孤立的prompt，将其可复用、可迭代的工作单元。

把这些loop开源和社区化，相当于给agent生态建了一个公共的“流程市场”。

地址见评论区

⏰ 06:42 | ❤️ 40点赞 | 📝 265字 | 查看原文 →

↑ 返回顶部

# x每日奏折