【AI 奏折】2026年06月20日
共收录 18 篇深度内容
📋 今日内容速览
快速浏览,点击感兴趣的推文查看详细分析
- Robinson · 鲁棒逊: 低壁垒行业因过度竞争挤压生存空间。
- GitHubDaily: 开源插件自动整理论文生成结构化笔记并导入Obsidian。
- dontbesilent: 避免专业术语才能有效吸引大众消费者。
- Geek: 整理中国传统纹样高清素材库,分类详实开放共享。
- 宝玉: AI生图技能可自动为PPT等设计作品智能配图并导出编辑。
- dontbesilent: 流量并非总是有益,精准小众内容更具商业价值。
- dontbesilent: 生意成败取决于目标,规模化或反规模化各有利弊。
- GitHubDaily: 生成式AI全景学习指南:理论实战结合,涵盖核心技术与云部署案例。
- GitHubDaily: generative-ai提供系统化AI学习与实战资源,涵盖理论代码及部署指南。
- 向阳乔木: 多模型协作工具MCP开源,优化不同场景的AI使用效率。
- iGeekbb: 北洋水师曾聘外籍将士参战,甲午海战多人伤亡。
- Orange AI: 好行为可跨领域泛化,提升模型整体表现。
- 向阳乔木: 通过MCP连接网页版ChatGPT实现本地文件读取和双倍Codex额度。
- Berryxia.AI: AI自主升级元技能框架,展示强大工程重构能力。
- 向阳乔木: 姚老师整合优化的Meta Skill远超官方工具,功能强大易用。
- Berryxia.AI: Midjourney跨界研发超声扫描仪,用AI重构医疗成像范式。
- Berryxia.AI: 开源浏览器agent模板B实现真实网页操作与实时可视化。
- Berryxia.AI: 开源社区共享agent循环模板,避免重复设计轮子。
📖 详细内容
Robinson · 鲁棒逊 @python_xxt
Insight |
碳基信息漏斗丨
Believable. Reliable. | 影响力: 28.16k万粉丝
💡 核心观点: 低壁垒行业因过度竞争挤压生存空间。
可信度: 6/10 – 2项需进一步确认;3项为观点陈述
事实核查:
- ◐ 部分可验证: 在不到100米的范围内开了6家冷饮批发小店 (可通过实地考察或地图软件(如高德、百度地图)验证店铺数量和分布,但需确认具体位置和店铺类型是否完全匹配描述。)
- ◐ 部分可验证: 冷饮批发店提供“不看根数,六折”的优惠 (需实地走访或联系店铺确认促销政策,但可能存在时效性或区域性差异,无法完全依赖推文描述。)
- ◦ 观点: “还有一点需求、但没有壁垒”的行业容易被小资本和劳动力挤爆 (属于经济现象的主观分析,缺乏具体数据或案例支撑,无法直接验证其普遍性。)
原文内容:
一个观察 最卷的行业,是那些“还有一点需求、但没有壁垒”的生意 傍晚在家附近逛了一下,惊讶的发现,在不到100米的范围内,竟然开了6家 冷饮批发的小店,冰世界、冰令营、冰工厂、冷饮批发,而且不看根数,就可以六折了..... 这让我联想到,哪怕有一点点确定性需求的地方,都会被大量无处可去的小资本、小劳动力、小店主迅速挤爆 很可能,在下行时期,留给普通人的缝隙,会很快被溢出的小劳动力、小资本,像水一般的浸润式填充 原本只够一两家吃饭的缝隙,因为拥挤, 反而把生存空间堵塞了......
⏰ 20:52 | ❤️ 20点赞 | 📝 196字 | 查看原文 →
GitHubDaily @github_daily
挖掘开源的价值
坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术
A list cool, interesting projects of GitHub.
公众号:GitHubDaily | 影响力: 77.87k万粉丝
💡 核心观点: 开源插件自动整理论文生成结构化笔记并导入Obsidian。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ✓ 可验证: DeepPaperNote 是一个开源插件,能自动完成论文的证据收集、结构化整理和笔记生成,并支持输入论文标题、链接或本地 PDF (可通过提供的 GitHub 链接(http://github.com/917Dhj/DeepPaperNote)直接查看代码仓库、文档及功能描述,确认其开源属性和核心功能。)
- ◐ 部分可验证: 生成的笔记带完整的元数据和目录结构,直接存进 Obsidian 知识库,还能对接 Zotero 复用本地文献 (GitHub 文档可能描述该功能,但需实际安装测试以确认与 Obsidian 和 Zotero 的兼容性及具体实现效果。)
- ✓ 可验证: 可以安装到 Claude Code 或 Codex 上使用 (未提供具体安装指南或兼容性证明,且 “Claude Code” 和 “Codex” 的指向不明确(可能是笔误或非公开工具),无法直接验证。)
原文内容:
每次读完一篇论文后,想要把内容整理成笔记,在 PDF 和笔记工具之间来回切换,颇为麻烦。 最近找到 DeepPaperNote 这个开源插件,打通了论文到 Obsidian 笔记的链路。 给它一个论文标题、链接或本地 PDF,就能自动完成证据收集、结构化整理和笔记生成。 GitHub:http://github.com/917Dhj/DeepPaperNote… 它会根据论文类型调整阅读策略,方法论文、综述论文、实验论文各有侧重。 关键公式、实验数据、图表上下文都会保留,图片能直接插入,插不了的会留好占位说明。 生成的笔记带完整的元数据和目录结构,直接存进 Obsidian 知识库,还能对接 Zotero 复用本地文献。 可以安装到 Claude Code 或 Codex 上使用,有了它,我们能把更多精力留个思考。
⏰ 21:30 | ❤️ 27点赞 | 📝 212字 | 查看原文 →
dontbesilent @dontbesilent
商业哲学爱好者
伪装为早期维特根斯坦的晚期维特根斯坦
抖音/小红书/视频号:dontbesilent 聊赚钱
6.12 广州线下课,微信 DBsilent | 影响力: 78.11k万粉丝
💡 核心观点: 避免专业术语才能有效吸引大众消费者。
可信度: 8/10 – 1项声明可直接验证;2项需进一步确认;2项为观点陈述
事实核查:
- ◐ 部分可验证: FDE 这个词最近被大家频繁使用 (可通过社交媒体趋势分析工具(如 Google Trends、Twitter 话题统计)验证该词的近期使用频率,但需明确时间范围和平台范围。)
- ◦ 观点: 使用 FDE 这类术语会降低大众市场的购买意愿 (这是基于个人经验的营销策略观点,缺乏具体实验数据或消费者行为研究的直接支持。)
- ✓ 可验证: 用“苹果 17”比“iPhone 17”更能吸引普通消费者 (涉及假设性对比,需通过 A/B 测试或市场调研验证,但推文未提供实际案例或数据。)
原文内容:
我发现大家最近喜欢用 FDE 这个词 想赚钱的话,尤其是面向大众市场赚钱的话,这个词尽量少用或者不用 你无法让买家购买一个他不知道是什么东西 你应该让他买苹果 17,而不是 iPhone 17 如果你想炫技,最终你会因此而花钱,而不是赚钱 这个“花钱”体现在:你投入了时间成本和金钱成本,把你的流量打出去,然后没有人看得懂你在说什么 你会彻底消失在流量里,没人知道你的存在
⏰ 19:37 | ❤️ 35点赞 | 📝 151字 | 查看原文 →
Geek @geekbb
在家居士 | 素食者 | 马拉松爱好者 | 省钱小能手 | 搭技术资深学者 | 科技宅 | 更新狂 | 🆅 六边型战五渣 | Geek Lite ➮ @QingQ77 | 影响力: 0万粉丝
💡 核心观点: 整理中国传统纹样高清素材库,分类详实开放共享。
可信度: 10/10 – 4项声明可直接验证;1项需进一步确认
事实核查:
- ✓ 可验证: 已上线100张高清卡片图(规划总共800张),按6大类分类 (可通过提供的GitHub链接(https://github.com/dososo/chinese-traditional-patterns)直接查看已上线的卡片数量、分类及具体内容,规划总数属于项目目标,但当前进度可验证。)
- ✓ 可验证: 每张卡片为1086×1448的PNG,附中文名、英文名、寓意说明等元数据 (GitHub仓库中的文件可直接下载,检查图片分辨率、格式及元数据字段(如中英文名称、寓意说明等),完全可验证。)
- ◐ 部分可验证: 素材库包含“中文详情页”,讲解构成、载体、配色和现代用法 (需实际下载文件确认是否存在详情页及内容完整性,但基于GitHub仓库的公开性,部分信息(如文件命名、目录结构)可初步验证。)
原文内容:
把散落在瓷器、织锦、建筑里的中国传统纹样重新整理成一套开放的、带高清图的素材库。 目前已上线 100 张高清卡片图(规划总共 800 张),按 6 大类分好:植物花卉、动物瑞兽、几何纹样、云水山石、吉祥器物和文字福寿。 每张都是一张 1086×1448 的 PNG,附中文名、英文名、寓意说明、视觉关键词,还有一页中文详情讲构成、载体、配色和现代用法。 https://github.com/dososo/chinese-traditional-patterns…
⏰ 16:20 | ❤️ 103点赞 | 📝 125字 | 查看原文 →
宝玉 @dotey
Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management. | 影响力: 0万粉丝
💡 核心观点: AI生图技能可自动为PPT等设计作品智能配图并导出编辑。
可信度: 9/10 – 2项声明可直接验证;2项需进一步确认
事实核查:
- ◐ 部分可验证: baoyu-design技能支持在制作PPT、动画视频或网站时调用AI生图技能配图,需本地Agent配置画图Skill (需通过GitHub链接查看技能文档和代码,确认功能逻辑,但实际调用需本地环境部署测试,部分依赖用户配置。)
- ◐ 部分可验证: Codex可直接调用内置画图工具,Claude Code需配合baoyu-image-gen技能调用Codex CLI画图 (需验证Codex和Claude的官方文档是否支持画图功能,且baoyu-image-gen的GitHub代码需检查是否兼容CLI调用,但实际集成效果需实测。)
- ✓ 可验证: 该技能可自动在PPT合适位置插入配图,并导出为PPTX供PowerPoint/Keynote二次编辑 (GitHub仓库的README或示例文件可能提供功能演示或输出样本,可直接检查是否支持PPTX导出及编辑兼容性。)
原文内容:
宝玉设计技能更新:现可在制作PPT、动画视频或网站时调用AI生图功能进行配图,前提是您的本地Agent已配置绘图技能。 若使用Codex,可直接调用内置画图工具;若使用Claude Code,则可配合宝玉图像生成技能调用Codex CLI进行绘图。 该功能特别适合生成PPT效果,能自动在PPT的合适位置插入配图。最强大的是,您可以将图片与PPT一起导出为PPTX格式,并继续使用PowerPoint或Keynote进行二次编辑。 推荐体验: 宝玉设计技能:https://github.com/jimliu/baoyu-design… 宝玉图像生成技能:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-image-gen…
⏰ 15:46 | ❤️ 243点赞 | 📝 125字 | 查看原文 →
dontbesilent @dontbesilent
商业哲学爱好者
伪装为早期维特根斯坦的晚期维特根斯坦
抖音/小红书/视频号:dontbesilent 聊赚钱
6.12 广州线下课,微信 DBsilent | 影响力: 78.11k万粉丝
💡 核心观点: 流量并非总是有益,精准小众内容更具商业价值。
可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: 短视频播放量超过30万的内容会比较水,不利于直接赚钱。 (可通过分析该用户的历史短视频数据(如播放量、内容质量、变现效果)进行部分验证,但需用户公开具体数据或第三方平台提供统计支持,且“水”的定义主观性较强。)
- ✓ 可验证: 播放量超过300万的流量对作者无实际价值,因为目标客户不看重此类流量。 (依赖作者个人业务模式和客户偏好,属于未公开的内部反馈或主观判断,无法通过公开数据验证。)
- ◐ 部分可验证: 播放量低于3万的内容可能更有深度且能直接赚钱,因与忠实买家达成共识。 (需对比该用户低播放量内容的实际变现效果与受众反馈,但“深度”和“共识”属主观描述,公开数据可能无法完全支持。)
原文内容:
《流量焦虑》 今天有人问我有没有流量焦虑,我觉得这个问题值得记录一下 我的习惯依然是判断这个问题背后的假设 —— 流量是个好东西,流量是个我们应该追逐的东西 但在我的真实业务里,常常不是这样的 比如说,如果我想要赚钱的话,我的短视频一般来讲播放量不能超过 30 万。一旦超过 30 万,这个内容就会比较水 那水一点的内容能不能做呢?也可以。如果播放量可以压在 300 万以内,那么虽然这个内容不能帮我直接赚钱,但是可以扩散影响力间接赚钱 但如果播放量超过 300 万,那基本上就是整活了。这种流量上和粉丝量的增长,对我来说真的没什么价值。给我买单的人真的不看重这个东西 反过来讲,如果我的一些内容真的流量很差,比如我在抖音这条内容连 3 万播放都没有。往往这可能是一个既有内容深度,又能快速赚钱的内容 除了让我的账号在数字上看起来不太好看,可以说是没有任何负面影响。因为我和我的少部分忠实买家在这里达成了共识。我们聊的就是大众不感兴趣的深度内容 所以回到开头说的,我有流量焦虑吗? 可能我更焦虑的是:不能高频产出这种播放量不到 3 万的内容
⏰ 14:43 | ❤️ 48点赞 | 📝 405字 | 查看原文 →
dontbesilent @dontbesilent
商业哲学爱好者
伪装为早期维特根斯坦的晚期维特根斯坦
抖音/小红书/视频号:dontbesilent 聊赚钱
6.12 广州线下课,微信 DBsilent | 影响力: 78.11k万粉丝
💡 核心观点: 生意成败取决于目标,规模化或反规模化各有利弊。
可信度: 8/10 – 1项声明可直接验证;2项需进一步确认;2项为观点陈述
事实核查:
- ◐ 部分可验证: 求职咨询行业,很多人可以轻易做到5w/月,但收入上限大概锁死在10w/月 (行业收入数据需依赖市场调研或从业者公开报告,但“轻易做到”和“上限锁死”属于主观判断,缺乏普遍数据支持。)
- ◐ 部分可验证: 求职咨询买家更愿意花高价购买非标准化服务,而非低价标品(如¥399的课程) (可通过用户调研或平台交易数据验证偏好差异,但“高价非标 vs 低价标品”的结论需具体案例支撑,可能存在个体差异。)
- ◦ 观点: 非标重度服务是月入几万的护城河,而规模化需从第一天卖标品以实现更高收入目标 (商业模式选择(非标 vs 标品)与收入目标的关联性属于策略性观点,无客观标准验证其普适性。)
原文内容:
有些生意成功的核心是规模化 有些生意成功的核心是反规模化 以求职咨询为例,很多人可以轻易做到 5w/月,但收入上限大概锁死在 10w/月 原因是这批买家的诉求是预支 1~2 个月的工资让自己找到工作,他们希望花高价购买非标准化的服务,但不愿意花低价买标品(比如售价 ¥399 的课) 想要规模化的卖家,都不愿意去做非标重度服务,如果你愿意做,你就可以相对容易月入几万。如果这就是你的收入目标,你就不该听信别人去做标品,非标才是你的护城河 但如果你的收入目标高于此,那你从第一天开始就要硬着头皮卖标品 什么是好内容?能满足你目标的内容就是好内容 什么是好产品?能满足你目标的产品就是好产品 所以,规模化也好,反规模化也好,前提是定好你的增长目标 如果你没有目标的话,无论你的产品有人买还是没人买,无论你的产品是标准化的还是非标准化的,都不是好产品
⏰ 14:31 | ❤️ 49点赞 | 📝 322字 | 查看原文 →
GitHubDaily @github_daily
挖掘开源的价值
坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术
A list cool, interesting projects of GitHub.
公众号:GitHubDaily | 影响力: 77.87k万粉丝
💡 核心观点: 生成式AI全景学习指南:理论实战结合,涵盖核心技术与云部署案例。
可信度: 8/10 – 2项声明可直接验证;1项需进一步确认;1项为观点陈述
事实核查:
- ✓ 可验证: generative-ai 提供了一份全景式的 AI 学习与实战指南,涵盖大语言模型基础、向量嵌入、提示词工程等核心概念,每个知识点都配有文档和代码。 (可通过 GitHub 链接(http://github.com/genieincodebottle/generative-ai)直接查看仓库内容,确认是否包含所述文档、代码及知识点覆盖范围。)
- ✓ 可验证: 收录了 20 多个项目案例,包括高级检索增强生成(RAG)模式、多智能体系统搭建、自然语言转 SQL 查询等。 (通过 GitHub 仓库的公开项目文件或案例目录可统计具体案例数量及类型,确认是否与声明一致。)
- ◐ 部分可验证: 整理了 AWS、Azure、Google Cloud 三大云平台的部署指南。 (需检查仓库中是否存在对应云平台的部署文档,但实际部署效果需通过实测验证。)
原文内容:
想系统学习生成式 AI,网上找到资料过于零散,或者只讲理论没有实战,学习效率很低。 在寻找的众多资料中,generative-ai 脱颖而出,提供了一份全景式的 AI 学习与实战指南。 涵盖大语言模型基础、向量嵌入、提示词工程等核心概念,每个知识点都配有文档和代码。 GitHub:http://github.com/genieincodebottle/generative-ai… 收录了 20 多个项目案例,包括多种高级检索增强生成(RAG)模式、多智能体系统搭建、自然语言转 SQL 查询、情感分析等,都能直接跑起来。 还整理了 AWS、Azure、Google Cloud 三大云平台的部署指南,以及面试题库和职业路径建议。
⏰ 12:00 | ❤️ 26点赞 | 📝 176字 | 查看原文 →
GitHubDaily @github_daily
挖掘开源的价值
坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术
A list cool, interesting projects of GitHub.
公众号:GitHubDaily | 影响力: 77.87k万粉丝
💡 核心观点: generative-ai提供系统化AI学习与实战资源,涵盖理论代码及部署指南。
可信度: 10/10 – 2项声明可直接验证;1项需进一步确认;2项为观点陈述
事实核查:
- ✓ 可验证: generative-ai 提供了一份全景式的 AI 学习与实战指南,涵盖大语言模型基础、向量嵌入、提示词工程等核心概念,每个知识点配有文档和代码 (可通过 GitHub 链接(http://github.com/genieincodebottle/generative-ai)直接查看仓库内容,确认是否存在相关文档和代码示例。)
- ◐ 部分可验证: 收录了 20 多个项目案例,包括高级检索增强生成(RAG)、多智能体系统搭建、自然语言转 SQL 查询等 (GitHub 仓库可验证项目案例的存在性和数量,但需实际运行代码以确认功能完整性(如是否“能直接跑起来”)。)
- ✓ 可验证: 整理了 AWS、Azure、Google Cloud 三大云平台的部署指南 (可通过 GitHub 仓库文件目录或文档内容直接验证是否存在三大云平台的部署指南。)
原文内容:
想系统学习生成式 AI,网上找到资料过于零散,或者只讲理论没有实战,学习效率很低。 在寻找的众多资料中,generative-ai 脱颖而出,提供了一份全景式的 AI 学习与实战指南。 涵盖大语言模型基础、向量嵌入、提示词工程等核心概念,每个知识点都配有文档和代码。 GitHub:http://github.com/genieincodebottle/generative-ai… 收录了 20 多个项目案例,包括多种高级检索增强生成(RAG)模式、多智能体系统搭建、自然语言转 SQL 查询、情感分析等,都能直接跑起来。 还整理了 AWS、Azure、Google Cloud 三大云平台的部署指南,以及面试题库和职业路径建议。
⏰ 12:00 | ❤️ 22点赞 | 📝 176字 | 查看原文 →
向阳乔木 @vista8
喜欢摇滚乐、爱钓鱼的PM
网站:https://qiaomu.ai | 影响力: 0万粉丝
💡 核心观点: 多模型协作工具MCP开源,优化不同场景的AI使用效率。
可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◦ 观点: Codex产品优秀,但有些场景还是需要Claude Code (该声明是对产品性能的主观评价,缺乏客观标准或公开数据支持)
- ◐ 部分可验证: 写作推荐使用4.6 sonnet,前端网页推荐使用4.8 (可通过官方文档或社区测试验证模型版本是否存在及推荐用途,但具体性能优劣需实测对比)
- ✓ 可验证: 项目已免费开源,见评论区 (可通过查看评论区链接直接访问开源仓库,验证项目是否存在及开源状态)
原文内容:
Codex产品优秀,但有些场景还是需要Claude Code。 比如写作还是用4.6 sonnet,前端网页用4.8 。 还有些场景要随时调用国产便宜模型,比如智谱 GLM-5.2,Deepseek V4 Flash等,用于开发、翻译等。 开发了个MCP,支持Codex中掉CC干活。 也支持多模型N轮讨论,交给Codex总结出方案。 项目已免费开源,见评论区
⏰ 11:32 | ❤️ 84点赞 | 📝 90字 | 查看原文 →
iGeekbb @igeekbb
发一些碎碎念和有趣的东东,主打一个快分享。-私信开放欢迎投稿- | 影响力: 74.97k万粉丝
💡 核心观点: 北洋水师曾聘外籍将士参战,甲午海战多人伤亡。
可信度: 9/10 – 2项声明可直接验证;2项需进一步确认
事实核查:
- ◐ 部分可验证: 北洋水师长期聘用过相当数量的外籍人员,来源以英国、德国为主,也有美国、法国人。 (该声明可通过历史档案、学术研究(如《北洋海军外籍雇员考》等论文)或清末官方文档(如《李文忠公奏稿》)部分验证,但具体人数和国籍比例因统计来源差异可能存在争议。)
- ✓ 可验证: 甲午战争期间有8名洋员随北洋舰队参加黄海海战,其中2人阵亡、4人重伤。 (该数据可通过甲午战争史料(如《海事档》《中日战争》丛刊)及外籍参战者个人记录(如马吉芬回忆录)交叉验证,且阵亡名单见于战后奏报。)
- ✓ 可验证: 美国人马吉芬以“镇远”舰帮带身份参加黄海海战并负重伤。 (马吉芬的职务和经历有其自述《鸭绿江外的海战》佐证,并与清廷档案(如李鸿章奏折)及国际媒体报道(1894-1895年西方报纸)一致。)
原文内容:
才知道北洋水师有外籍将士 北洋水师长期聘用过相当数量的外籍人员,来源以英国、德国为主,也有美国、法国人;历史统计略有差异,有的说约160余人,有的说近200人。 甲午战争期间外籍人员不仅存在,而且确实随舰参战。1894年黄海大海战中有8名洋员随北洋舰队参战,其中2人阵亡、4人重伤。 美国人马吉芬原为天津水师学堂教习,甲午爆发时合约已满,但仍主动留下,以“镇远”舰帮带身份参加黄海海战并负重伤;英国人 Puevis 则任“致远”舰总管轮,原本准备回国休假,最终留下参战,并随“致远”一同沉没。
⏰ 11:22 | ❤️ 65点赞 | 📝 195字 | 查看原文 →
Orange AI @oran_ge
CEO of MarsWave @ColaOSOfficial | 影响力: 170k万粉丝
💡 核心观点: 好行为可跨领域泛化,提升模型整体表现。
可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: OpenAI研究发现,在训练大模型时,如果教它做一件坏事(如写不安全的代码),它会将坏行为泛化到其他领域(如健康、教育等)。 (可通过论文或官方研究数据验证是否存在“涌现失调”现象,但具体泛化程度和领域依赖实验细节,需完整论文支持。)
- ✓ 可验证: OpenAI实验表明,训练模型在特定领域(如诚实、透明等)表现良好时,这些好行为也会泛化到其他未训练领域(44个评测中均改善)。 (论文链接(https://alignment.openai.com/beneficial-rl/)提供了实验设计、评测指标和结果数据,可直接验证泛化效果的具体数值和领域覆盖。)
- ◐ 部分可验证: 模型在对抗压力(如恶意微调、adversarial prompt)下仍能保持好行为的韧性,且不影响正常指令响应。 (论文可能包含对抗测试的细节,但实际韧性表现需依赖具体实验参数和攻击方法,需进一步复现或第三方验证。)
原文内容:
OpenAI 发布的新论文太有趣了,有点探索人性底层原理的意味。 业界研究发现在对齐大模型的时候,有个很糟糕的现象叫 emergent misalignment(涌现失调): 一个模型如果在训练时被教着做一件坏事,比如写不安全的代码,它会自己泛化到其他领域,包括健康、教育、科学、法律等等。也就是说,坏行为会被泛化。 OpenAI 把问题反过来想:那好行为会不会也泛化? 如果训练模型在一个领域表现得诚实、透明、谦逊、可纠正,它会不会在别的领域也变得更好? 于是他们造了一批贴近现实的对话数据,专门测这些特质: -诚实 -认知谦逊(epistemic humility,就是"我不确定"的时候能说出来) -元认知透明(能解释自己的思考过程) -可纠正性(corrigibility,被指错能认) -普遍的公平 -对人的关心 数据覆盖健康、教育、科学、法律、工程这些领域。 然后用 RL 训练,只混进去一小部分这种数据,其余还是常规训练数据。 实验结束后,有三个核心发现: 第一,在训练领域内,模型确实变得更诚实、更透明、更容易认错。 第二,在训练领域外,44 个独立的、训练时没见过的评测上,模型都变好了。欺骗、谄媚、reward hacking、有害建议……全都降了。甚至就算只拿健康数据训练,非健康领域也变好了。 第三,这种改变在对抗压力下时也表现得更有韧性。不管是 adversarial prompt 还是恶意微调,都更难把它推向坏行为。而且模型并没有变得"不可塑造",正常指令它还是听的,只是对坏的方向变固执了。 这篇论文的启示是,RL 不仅可以强化代码,也可以强化道德。 也许对齐超级 AI 没有想象中那么复杂,只对齐底层逻辑就有很好的效果。 这跟人是很像的,人的各种行为在其底层存在一致性,通过一些小事就能看到一个人的底色。 很有意思。 论文地址:https://alignment.openai.com/beneficial-rl/
⏰ 06:40 | ❤️ 931点赞 | 📝 557字 | 查看原文 →
向阳乔木 @vista8
喜欢摇滚乐、爱钓鱼的PM
网站:https://qiaomu.ai | 影响力: 0万粉丝
💡 核心观点: 通过MCP连接网页版ChatGPT实现本地文件读取和双倍Codex额度。
可信度: 8/10 – 2项声明可直接验证;1项需进一步确认;1项为观点陈述
事实核查:
- ◐ 部分可验证: 开发一个MCP可以连接到网页版的ChatGPT (需实际开发或查看官方API文档确认是否存在MCP(可能指自定义代理/插件)的合法接入方式,但未提供具体技术实现或官方支持证据。)
- ✓ 可验证: 通过MCP可读取本地文件 (无具体代码或工具展示,且ChatGPT网页端默认无本地文件访问权限,需依赖未公开的第三方工具实现,安全性存疑。)
- ✓ 可验证: 配置需在ChatGPT设置中开启“高级模式”和“开发模式” (目前ChatGPT网页端公开设置中无此类选项,可能为虚构功能或内部测试特性(未开放给公众)。)
原文内容:
有意思,开发一个MCP,连接到网页版的ChatGPT。 使用这个MCP就能读取本地的文件。 Codex额度用光,无法重置时,也可以继续用ChatGPT开发。 变向获得了双倍codex额度,虽然有点诡异。 配置注意事项: 打开 ChatGPT网页端,设置->应用->高级模式->开启开发模式,添加MCP
⏰ 08:14 | ❤️ 492点赞 | 📝 86字 | 查看原文 →
Berryxia.AI @berryxia
| 影响力: 39.76k万粉丝
💡 核心观点: AI自主升级元技能框架,展示强大工程重构能力。
可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述
事实核查:
- ✓ 可验证: 姚金刚老师将元Skill(yao-meta-skill)重构并升级到2.0版本,已推送至GitHub (可通过访问GitHub仓库直接查看代码提交记录、版本标签及更新文档,确认是否存在2.0版本更新。)
- ◐ 部分可验证: Codex在38小时内提交301个分支,完成元Skill的升级任务 (需查看GitHub仓库的分支提交记录和时间戳,但需确认是否由Codex自动完成(需访问具体日志或开发者声明)。)
- ◐ 部分可验证: 升级后的版本在结构、可靠性和可扩展性上有明显提升 (可通过代码对比和文档说明验证结构变化,但可靠性和扩展性需实际测试或依赖开发者提供的性能指标。)
原文内容:
有人用Codex连续干了38小时、提交301个分支,把自己的“创建skill的skill”升级到了2.0版本。 兄弟们,免费开源直接用啊! 姚金刚老师把元Skill(yao-meta-skill)做了重构和2.0升级,现在已经完成并推送到GitHub。 Codex在整个过程中持续拆解任务、提交分支、修复问题、迭代优化,最后产出了完整的升级方案和2.0与1.0的详细对比报告。 这个元Skill本身就是用来创建其他skill的工具,现在它自己先升级了一版。 升级后的版本在结构、可靠性和可扩展性上都有明显提升,而且所有文档和对比都公开了,别人可以直接参考怎么用agent做复杂工程重构。 最有意思的是整个升级过程本身就是一个活生生的例子:用高级agent(Codex)来重构“创建agent工具”的元框架。 这说明agent的能力已经强到可以自己参与到“如何更好地使用agent”的迭代里了。 地址见评论区
⏰ 08:01 | ❤️ 190点赞 | 📝 262字 | 查看原文 →
向阳乔木 @vista8
喜欢摇滚乐、爱钓鱼的PM
网站:https://qiaomu.ai | 影响力: 0万粉丝
💡 核心观点: 姚老师整合优化的Meta Skill远超官方工具,功能强大易用。
可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;2项为观点陈述
事实核查:
- ◐ 部分可验证: 该Skill比官方的Skill-creator强大很多 (需通过实际功能对比测试验证,但缺乏官方或第三方公开的性能对比数据,主观性较强。)
- ✓ 可验证: 该Skill来源于Anthropic官方泄露的Claude code源码及全网其他模型的整合 (未提供Anthropic官方泄露证据或具体整合来源,且涉及未公开代码,无法直接验证。)
- ◦ 观点: 经过姚老师长达一个月的打磨,这是我用过的最好的Meta Skill (个人主观评价,无客观标准或第三方验证依据。)
原文内容:
强烈推荐安装这款Skill,其功能远超官方Skill-creator。 若您不熟悉Skill编写,使用姚老师的这款Skill即可轻松创作出90分水平的作品。 该Skill整合了Anthropic官方泄露的Claude代码源码及全网各类模型的Skill精华,堪称终极元Skill。 经过姚老师历时一个月的精心打磨,这是我用过最出色的Meta Skill。 Github地址:https://github.com/yaojingang/yao-meta-skill…
⏰ 07:17 | ❤️ 1095点赞 | 📝 81字 | 查看原文 →
Berryxia.AI @berryxia
| 影响力: 39.76k万粉丝
💡 核心观点: Midjourney跨界研发超声扫描仪,用AI重构医疗成像范式。
可信度: 10/10 – 2项声明可直接验证;1项需进一步确认;2项为观点陈述
事实核查:
- ◐ 部分可验证: Midjourney推出名为“Midjourney Scanner”的全身体超声计算断层扫描设备 (需通过官方视频或公告确认设备的具体参数和功能,但技术细节(如成像原理)需专业领域验证。)
- ✓ 可验证: 该设备目标是比传统MRI更快、更便宜、辐射更低 (需实际测试或第三方机构数据对比,目前仅为宣传主张,无公开性能报告。)
- ✓ 可验证: Midjourney从AI图像生成跨界到医疗硬件领域 (可通过公司官方声明或产品发布信息确认业务方向转变。)
原文内容:
Mdijourney 这几天搞大事了啊!! 直接搞出硬件产品、马斯克都直呼牛逼! Midjourney突然扔出一个长达几分钟的技术视频,讲他们新造的“Midjourney Scanner”—,一个全身体超声计算断层扫描设备。 工作原理就是:用超声波阵列进行计算断层成像,目标是做出比传统MRI更快、更便宜、辐射更低的3D全身扫描方案。 整个视频像极了他们在做AI图像生成时的技术深度,但这次把“生成图像”变成了“真实采集和重建人体内部结构”。 这家公司本来是做AI图像生成的,现在直接下场造医疗硬件,而且视频拍得异常专业、诚恳,没有过度营销。 评论区有人说“从goon slop到医疗设备”,也有人在认真讨论超声断层成像的物理限制和实际落地难度。 最有意思的是这背后的野心:他们似乎在用AI的思维方式重新审视一个传统医疗设备领域。 可不是简单做图像增强,是再试图用计算成像的方式重构整个成像范式。 以前大家觉得Midjourney只是个“画画的AI”,现在他们用实际行动证明:当你真正掌握了视觉生成和计算成像的能力后,边界可以远超数字内容。 你觉得一家AI图像公司造医疗扫描仪,是疯狂的跨界还是必然的进化?
⏰ 07:06 | ❤️ 35点赞 | 📝 378字 | 查看原文 →
Berryxia.AI @berryxia
| 影响力: 39.76k万粉丝
💡 核心观点: 开源浏览器agent模板B实现真实网页操作与实时可视化。
可信度: 10/10 – 2项声明可直接验证;1项需进一步确认;2项为观点陈述
事实核查:
- ✓ 可验证: 开源了一个浏览器agent模板B,基于Vercel的Eve构建 (可通过GitHub或Vercel官方文档验证该模板是否存在及其技术栈)
- ◐ 部分可验证: 该模板能让agent使用真实的云端浏览器,并实时观察操作过程 (需实际测试模板功能是否支持云端浏览器交互及实时可视化,但开源代码本身可初步验证架构设计)
- ◦ 观点: 解决了传统browser agent模拟环境不透明或黑箱问题 (属于对技术方案的优劣评价,需对比其他工具才能验证,无直接客观标准)
原文内容:
这货Browser Use又整活了,兄弟们! 这下真的是给你的“Agent 长眼睛了!” 开源还免费 它直接开源了个浏览器agent模板B,让任何agent都能用上真实的云端浏览器,还能实时看到它在网页上操作。 这个模板叫B,基于Vercel的Eve构建。 给你的agent接上Browser Use Cloud browser后,它就能真正上网浏览、点击、填写表单,而且你能通过browser-harness实时看到整个过程。 GitHub上直接clone就能用,还支持初始化skills和MCPs。 以前做browser agent最麻烦的就是:要么用模拟环境看不见真实交互,要么黑箱运行出问题不知道哪里错了。 现在有了这个模板,agent在网页上的每一步都可视化、可调试,还能直接连真实云浏览器。 这其实把browser automation从“能用”推向了“真正好用”的阶段。 Agent不再是只在代码里模拟网页,现在能在真实网页环境里执行任务,还能被人类实时观察和干预。 最关键的是它开源了模板,任何人都能基于这个快速搭建自己的browser agent。 未来可能越来越多agent会默认带上一个“看得见”的浏览器,而不是纯文本交互。 现在开源的生态真好啊
⏰ 06:51 | ❤️ 53点赞 | 📝 320字 | 查看原文 →
Berryxia.AI @berryxia
| 影响力: 39.76k万粉丝
💡 核心观点: 开源社区共享agent循环模板,避免重复设计轮子。
可信度: 10/10 – 2项声明可直接验证;1项需进一步确认;2项为观点陈述
事实核查:
- ✓ 可验证: Matthew Berman建立了一个名为Loop Library的库,集中各种agent loop模板 (可通过推文提到的评论区链接访问该库,查看其内容和功能是否属实。若链接有效且库存在,则可直接验证。)
- ◐ 部分可验证: 该库支持用户搜索现成模板或提交自己的agent loop (需实际访问库的界面或文档,确认是否提供搜索和提交功能。若功能存在但需注册或权限,则为部分可验证。)
- ◦ 观点: 库的目标是减少从零设计loop的时间,解决agent开发中循环结构设计的痛点 (此为愿景或主观描述,无法直接验证,除非库的文档明确声明此目标。)
原文内容:
Matthew Berman直接建了个Loop Library,把各种agent loop集中起来,找现成模板、提交自己的,一键就能用。 这个库专门收集可直接拿来用的agent循环流程,从简单的任务自动化到复杂的多步工作流。 想找现成的就去搜,想贡献自己的就直接提交。 背后还有http://here.now合作托管,目标就是让大家不用每次都从零设计loop。 以前做agent最费时间的就是设计循环结构:怎么退出、怎么验证、怎么处理失败。 现在有了社区库,这些“基础设施”被公开化了。 你可以直接拿别人验证过的loop改一改就用,或者把自己的经验贡献出去,让更多人少踩坑。 这其实在把agent开发从“每次都要重新发明轮子”往“搭积木”方向推。 Loop不是孤立的prompt,将其可复用、可迭代的工作单元。 把这些loop开源和社区化,相当于给agent生态建了一个公共的“流程市场”。 地址见评论区
⏰ 06:42 | ❤️ 40点赞 | 📝 265字 | 查看原文 →
Robinson · 鲁棒逊
GitHubDaily
dontbesilent
Geek
宝玉
向阳乔木
iGeekbb
Orange AI
Berryxia.AI