【AI 奏折】04月19日

x每日奏折7小时前发布 tianming
10 0 0

【AI 奏折】2026年04月19日

共收录 20 篇深度内容


📋 今日内容速览

快速浏览,点击感兴趣的推文查看详细分析

  1. 歸藏(guizang.ai): 智能墨水屏可远程监控审批AI状态,方便居家办公。
  2. 汉松: Agent通过执行prompt实现功能,代码成为底层抽象。
  3. 向阳乔木: NotebookLM可处理多种内容链接,支持付费绕过,功能强大。
  4. 海拉鲁编程客: 中国团队在GPU算力优化上实现工程突破。
  5. iGeekbb: 顾客曝光麦当劳店员施暴获赔后遭质疑,重发视频自证。
  6. Frank Wang 玉伯: AI分身是人的延伸,具有独特身份与无限可能。
  7. Viking: AI通过文本处理自动剪辑视频,减少无效视觉信息。
  8. Mr Panda: 在X平台打造个人IP并实现多元变现,欢迎加入知识星球共同成长。
  9. 向阳乔木: Claude适合工作,Gemini擅长科研,GPT强于编程。
  10. Justin: AI将消解公司形态,个体自足协作即可。
  11. sitin: Mano-P 1.0纯视觉GUI智能体跨平台操作,支持本地部署。
  12. fin: 未来CPU将因AI代理激增成为结构性瓶颈。
  13. dontbesilent: 小红书虚拟产品上架难催生第三方服务需求
  14. GitHubDaily: 极简AI框架GenericAgent越用越聪明,自动固化技能操控多设备。
  15. 汉松: AI设计工具ClaudeDesign让普通人也能轻松创作专业作品。
  16. -Zho-: 乔布斯亲自设计苹果计算器界面并沿用多年。
  17. 李继刚: 社会规训下人们活成他人,觉醒后才直面本真自我。
  18. GitHubDaily: AI智能体自我进化引擎可自动优化提示词并修复错误。
  19. sitin: 开源项目提供大牌设计规范,让AI生成界面更专业美观。
  20. iGeekbb: 美团举办骑手工服设计大赛,优秀作品遭下架引争议。

📖 详细内容

【AI 奏折】04月19日歸藏(guizang.ai) @op7418

关注人工智能、LLM 、 AI 图像视频和设计(Interested in AI, LLM, Stable Diffusion, and design)

歸藏的 AIGC 周刊|公众号:歸藏的AI工具箱 | 影响力: 0万粉丝

💡 核心观点: 智能墨水屏可远程监控审批AI状态,方便居家办公。

可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: 用户开发了一个基于Claude实体buddy项目的墨水屏监控工具,可远程查看Claude Code和Codex状态并进行审批 (需实际检查Claude官方是否提供”实体buddy项目”及API支持,且需验证M5StickCPlus/M5 Paper设备兼容性。开源前无法完全验证功能真实性。)
  • ✓ 可验证: 该工具只能在M5StickCPlus上运行且需Claude桌面端,但用户已适配M5 Paper墨水屏,仅需Cloud Code插件 (依赖用户未公开的代码修改细节,且”Cloud Code插件”无公开说明,需等待开源后才能验证技术可行性。)
  • ◦ 观点: 在家任何地方均可审批和查看Agent状态 (远程控制功能理论上可通过网络实现,但实际体验取决于家庭网络环境,属常见功能宣称,需实测验证稳定性。)

原文内容:

牛逼,现在人手一个智能硬件!

我现在能用这个墨水屏监控我的 Claude Code 和 Codex 的状态,同时进行审批。

在在家里的任何一个地方都可以。

项目基于 Claude 那个实体 buddy 项目。

但是它只能在 M5StickCPlus 上运行,而且必须安装 Claude 桌面端。

我把它改成了可以在 M5 Paper 这个墨水屏上运行,只需要装一个 Cloud Code 的插件就可以。

如果有需要的话后面开源一下。

这样的话,你在家里的任何一个地方都能审批和查看你的 Agent 的状态。

⏰ 14:30 | ❤️ 68点赞 | 📝 147字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日汉松 @yonah_x

阿福 AgentTeam | AI 降临派 | 终身学习者 | Taste is all you need | 影响力: 0万粉丝

💡 核心观点: Agent通过执行prompt实现功能,代码成为底层抽象。

可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: Claude Design 的导出 HTML 功能是通过发指令给旁边的 Agent 来实现的 (需实测或查看官方文档确认功能实现机制,目前无公开技术细节支持该描述)
  • ◦ 观点: Agent 成了 prompt 的解释器,prompt 即代码 (这是对技术范式的类比和主观展望,无具体技术实现或官方声明佐证)
  • ✓ 可验证: 所有功能都不需要代码,直接让 Agent 现场开发 (推文未说明功能范围和限制条件,且”所有功能”的绝对化表述缺乏实证依据)

原文内容:

Claude Design的设计理念实在太具智能体(agentic)特质了,它的HTML导出功能竟然只是向旁边的智能体发送一条指令,让它即时开发一个HTML页面。每个功能对应一个提示词(prompt),这简直就是未来智能体软件的雏形。所有功能都不需要编写代码,直接让智能体现场开发即可。

我突然领悟到"提示词即代码"的意味——智能体成为了提示词的解释器。就像过去通过Python解释器执行Python代码那样,现在直接通过智能体执行提示词即可,代码反而成了更底层的抽象概念。

⏰ 22:30 | ❤️ 28点赞 | 📝 123字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日向阳乔木 @vista8

喜欢摇滚乐、爱钓鱼的PM
网站:https://qiaomu.ai | 影响力: 0万粉丝

💡 核心观点: NotebookLM可处理多种内容链接,支持付费绕过,功能强大。

可信度: 10/10 – 3项声明可直接验证;2项需进一步确认

事实核查:

  • ◐ 部分可验证: NotebookLM可以处理B站、小宇宙、喜马拉雅的链接并转写文本,整合自Get笔记Skill,年费99元 (需实测验证链接转写功能是否有效,且需查看Get笔记Skill的官方说明或定价页面确认年费信息。开源地址提供了部分代码,但功能整合细节需进一步测试。)
  • ✓ 可验证: 支持X(Twitter)URL读取,使用免费jina和defuddle工具 (jina和defuddle为公开工具,其免费性可通过官网确认;X URL读取功能可通过测试推文链接或查看代码实现验证。)
  • ✓ 可验证: 通过Bypass Paywalls Clean项目和archive.ph获取付费内容缓存 (涉及付费内容绕过可能违反平台条款,archive.ph的缓存功能虽可验证,但具体实现是否合规或稳定无法公开确认。)

原文内容:

独家技能更新:任何内容都能交给NotebookLM处理,目前已收获760星,哈哈。

1. 将B站、小宇宙、喜马拉雅的链接扔过去,就能获取转录文本并交由NotebookLM处理。

该功能整合自Get笔记技能,年费99元超值。

2. 支持X平台URL读取,包括帖子和文章等。使用免费的jina和defuddle实现。

3. 已让AI学习Bypass Paywalls Clean项目,付费内容也可通过archive.ph获取缓存文章。

4. 支持飞书文档、公众号文章、YouTube视频、Epub电子书等多种格式的读取处理。

开源地址:https://github.com/joeseesun/qiaomu-anything-to-notebooklm…

安装方法:将上方链接发给CC,说"帮我安装这个技能"。

⏰ 22:00 | ❤️ 163点赞 | 📝 129字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日海拉鲁编程客 @hylarucoder

Indie Maker
油管「海拉鲁编程客」
沦为程序员的段子手/猫咪 | 影响力: 0万粉丝

💡 核心观点: 中国团队在GPU算力优化上实现工程突破。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: Prefill(预填充)和Decode(解码)是AI推理的两个阶段,Prefill阶段算力密集,Decode阶段算力需求较低。 (该描述符合AI推理(如Transformer模型)的通用技术原理,Prefill阶段需并行处理全部输入序列(计算注意力等),而Decode阶段是逐token生成,算力需求差异可通过公开论文(如《Attention Is All You Need》)或框架文档(如HuggingFace)验证。)
  • ◐ 部分可验证: 将Prefill和Decode解耦到不同硬件(如高算力卡与普通卡)并通过跨机房传输KV cache可优化资源利用率。 (解耦设计在学术和工程中确有讨论(如微软的DeepSpeed框架支持部分类似优化),但具体跨机房传输KV cache的可行性需实测验证,因延迟和带宽限制可能影响性能,且未提及具体实现方(如Kimi)的公开技术文档。)
  • ◐ 部分可验证: KV cache体积过大导致跨机房传输难以实现是行业普遍面临的算法限制。 (KV cache随序列长度增长而膨胀是已知问题(可参考LLM优化研究),但“其他人因算法限制未能实现”属于推测性表述,需对比实际企业方案(如Inflection的分布式推理)才能部分验证。)

原文内容:

第一眼看过去平平无奇:Prefill/Decode 解耦,多了个跨数据中心
                                                                                                                                              
和 AI 聊了会,发现老中真的是在压满 GPU 这件事上,工程创新又一轮                                           
                                                                                                                                              
你一句话发到服务端,服务器开始推理。Prefill 是思考——把你的输入读完、想明白,算力密集。Decode                                               是说话——一字一字往外蹦,不吃很高算力。中间递一份"思考笔记",叫 KV cache                        
                                                                                                                                              
既然两阶段的资源需求完全不同,为什么非得挤在同一台机器上甚至一个机房里?Prefill 集中到高算力卡上批量跑,Decode 散到其他卡上慢慢蹦,中间把 KV cache 传过去就行。

其他人肯定也这么想过,但是由于算法受限,KV cache 太大,跨机房传输就使命不达。
                                                                                                                                              Kimi Linear 的 hybrid attention 压缩了 KV cache,这使得传输不再变得那么不可行。而即便是可能可行,也需要足够多的线上流量才能证明真的可行。

盲猜这种工程感觉 openai 之类的公司也肯定想过(也可能没想过,毕竟没那么缺卡),但不见得会分享出来。

而更有想象空间的是,这说话 decode 这一步的硬件,国产卡、二手卡都能做,这个想象空间可就更大了。

⏰ 21:05 | ❤️ 133点赞 | 📝 319字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日iGeekbb @igeekbb

发一些碎碎念和有趣的东东,主打一个快分享。-私信开放欢迎投稿- | 影响力: 0万粉丝

💡 核心观点: 顾客曝光麦当劳店员施暴获赔后遭质疑,重发视频自证。

可信度: 9/10 – 2项声明可直接验证;2项需进一步确认

事实核查:

  • ◐ 部分可验证: 天津北辰麦当劳店员辱骂、推搡顾客并导致其被门夹伤。 (事件描述基于顾客发布的视频和网络曝光内容,但需核实视频真实性及具体细节(如店员行为与伤害的直接关联)。麦当劳门店的赔付行为间接佐证事件存在,但具体冲突过程需依赖第三方监控或目击者证词。)
  • ◐ 部分可验证: 麦当劳门店赔付849元医疗费,涉事店员向韩红基金会捐款2000元后顾客选择原谅并删除视频。 (赔付和捐款行为可通过顾客提供的转账记录或基金会公开捐赠记录部分验证,但需确认款项用途是否与事件直接相关。顾客删除视频的行为可被截图或平台记录佐证,但动机(如是否因和解)属于主观推断。)
  • ✓ 可验证: 有人质疑顾客讹诈麦当劳,导致其重新发布原视频。 (网络质疑言论难以追溯具体来源和真实性,顾客重新发布视频的动机(如回应质疑)无法客观验证,属于个人行为解释。)

原文内容:

天津这个地方多少是有点说法的,连户晨风推荐年夜饭指定商家麦当劳都这么豪横。

这位小哥在天津北辰麦当劳店取自己点的外卖,遭到店员辱骂、推搡,还被门夹伤。事情发到网上曝光后,麦当劳门店先替店员赔付了849元医疗费;涉事店员又当着他的面,向韩红基金会捐了2000元。小哥因此选择原谅,认为事情已经妥善解决,并删除了视频。

后来有人在网上说他是在讹麦当劳的钱,他这又把原视频放出来了

⏰ 21:00 | ❤️ 23点赞 | 📝 164字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日Frank Wang 玉伯 @lifesinger

I am curious and honest | 影响力: 0万粉丝

💡 核心观点: AI分身是人的延伸,具有独特身份与无限可能。

可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: 余一演示了真人余一和 AI 余一的互动式讲演 (可通过发布会官方录像、活动报道或参会者公开记录验证互动讲演的存在,但AI余一的具体表现和互动细节需实际体验或进一步信息确认。)
  • ✓ 可验证: 陶博是中国AI圈中对分身(Second Me)思考最久最深的人 (属于主观评价,缺乏公开的行业比较数据或权威排名支持,且“最久最深”难以量化验证。)
  • ◐ 部分可验证: 分身有外部性和身份性,是与干活的Agent不同的关键区隔点 (可通过陶博的公开演讲、论文或产品白皮书验证其理论观点,但“关键区隔”是否成立需技术或市场实践佐证。)

原文内容:

今天在良渚参加分身互联网暨 Second Me 客厅发布会,很喜欢这种有点村味的朋友聚会式的活动。

全程基本有在认真听讲。

余一演示了真人余一和 AI 余一的互动式讲演。之前更多感受到真人余一的狂热,这次初步看见了 AI 余一也是个有趣的灵魂。余一不演讲时,刚好坐我旁边。有种给我淑女的幻觉。

陶博很认真分享了做 Second Me 背后的思考。在中国 AI 圈里,陶博可能是对分身思考最久也是思考最深的人。分身有外部性和身份性,这是分身与干活的 Agent 非常不一样的区隔点。人会珍惜人本身,很难摆脱自私性,分身是人的延伸,理论上可以无限延伸。瞬息宇宙是可能存在的。

斯斯是一个能量满满的闪亮少女。今天是第二次线下见斯斯,热情背后,能真切感受到斯斯的好奇心、向外的爱意和略带一丝担心的疲惫。下半场的小分享,斯斯的内容稍凌乱,但口才着实一流。斯斯是一个无论男生或女生见了,都会被正向感染的人。

第一次近距离见卡兹克。卡神原来和我一样,i 得如此明显。看见卡兹克的小紧张那一刻,有种秒懂的好感。卡兹克的分享很棒。AI 很难替代人的,是判断,是品位。分身有机会帮我们去做掉一些浅层次的判断和沟通,深层次的沟通和判断,依旧还得是人。

启师傅今天没分享。忙前忙后,非常像一位温柔体贴的大家长。听说启师傅准备要开一所 AI 学校,很快会变成启校长了。特别期待。特别开心有人开始用 AI 做教育。

其他分享嘉宾里,光耀是最年轻同时讲解最技术的一位极客,Roger 的分享里有种温暖让人感动,孙洋的分享让人意识到线下是很难替代的。

我自己分享了对品味的思考。品位是说不清楚的但在影响你选择的东西,是一种默会知识(tacit knowledge)。能说出来的,都不叫品位。这也意味着,AI 很难替代人的品位。品位来自日常的点点滴滴,来自碎片。YouMind 的新版本,致力于通过 YouMind 精灵,来陪伴用户养成品位,进而做出更好的内容创作。分享时间有点短,后续有机会录个视频再讲讲。

傍晚去了长命村小学,很开心碰见了一位老师。一起合了个影。

风暖起来了。

⏰ 20:45 | ❤️ 38点赞 | 📝 695字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日Viking @vikingmute

独立开发者 自由职业
作品
TinyShip http://tinyship.cn 现代化全栈 SaaS 开发平台,支持国内外双市场 Monorepo 架构 三框架支持
简单简历 http://easycv.cn 五分钟打造程序员的金牌简历 | 影响力: 0万粉丝

💡 核心观点: AI通过文本处理自动剪辑视频,减少无效视觉信息。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: video-use工具可以通过自然语言与Claude Code交互,自动剪辑原始视频并添加效果 (需通过实际测试GitHub仓库(https://github.com/browser-use/video-use)的demo功能,确认是否支持自然语言指令生成成品视频。但工具效果可能受输入素材质量、用户指令复杂度影响,需部分实测验证。)
  • ✓ 可验证: 工具通过ElevenLabs Scribe实现音频转录,输出词级时间戳、说话人区分等结构化数据 (ElevenLabs官方文档(https://elevenlabs.io/docs)公开了Scribe API的转录功能,可验证其是否支持所述输出。但具体集成到该工具的效果需结合代码库检查。)
  • ◐ 部分可验证: LLM主要依赖12KB的takes_packed.md文件决策视频内容,仅在必要时调用视觉快照(PNG) (GitHub仓库中若存在takes_packed.md示例文件及timeline_view相关代码,可部分验证。但LLM内部决策逻辑是否完全依赖该文件需进一步代码分析或开发者说明。)

原文内容:

最近看到这个 video use https://github.com/browser-use/video-use… 是非常有趣的 skill,他可以让 claude-code 帮你处理视频,将一堆原始视频扔到文件夹中,然后用自然语言和 Claude Code 聊天,它就能自动帮你剪辑出一条高质量的成品视频,中间可以加各种效果。

原理非常有趣:
第一层是音频转录:对每个原始视频素材,只需调用一次 ElevenLabs Scribe,就能得到词级时间戳、说话人区分以及各种音频事件。

所有素材最终被打包成一个大约 12KB 的 takes_packed.md 文件 —— 这就是 LLM 的主要阅读界面。

Layer 2 是 视觉复合

timeline_view 会为任意时间范围生成一张 PNG 图片,包含一系列源数据信息。只有在需要决策的关键时刻才会调用。

LLM 主要靠文字来理解和决策视频内容。只在必要时才看少量视觉快照,避免海量无效 token,不给 LLM 一大堆截图,而是给它结构化的 DOM 只不过这里应用在了视频上。

repo 中有 demo 大家可以感受一下。

⏰ 20:14 | ❤️ 31点赞 | 📝 268字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日Mr Panda @pandatalk8

程序员 | AI 创业者 | 个人IP教练 | 商业技术观察 | 公众号:PandaTalk8 | 影响力: 0万粉丝

💡 核心观点: 在X平台打造个人IP并实现多元变现,欢迎加入知识星球共同成长。

可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: 在X上已经帮我挣了一辆BYD的钱 (该声明涉及个人收入,但未提供具体金额、时间范围或公开的收益截图等证据,属于未公开数据,无法通过第三方验证。)
  • ◐ 部分可验证: 在2025年帮助了很多新同学实现X冷启动,很多同学从0到1万fo (若“新同学”的账号公开且粉丝增长记录可查(如社交媒体历史数据),可部分验证;但“帮助”的具体作用(如培训内容、直接关联性)难以量化,需依赖当事人反馈。)
  • ◐ 部分可验证: 目前搞X的好处包括平台收益、商业推广、个人IP、产品代言 (X平台若公开创作者收益和商业化政策(如广告分成规则),部分条款可验证;但“个人IP”“产品代言”的效果取决于主观目标,属于混合事实与观点。)

原文内容:

我在X上已经帮我挣了(不是赚了) 一辆 BYD 的钱。 

在2025年帮助了很多新同学实现了X冷启动, 很多同学也从0到跑到了1万fo。 

我有一点点作用, 但是还人家个人的努力。  

目前搞X的好处:
1. 在X 拿 平台的收益,
2. 成为博主,获得商业付费推广,
3. 打造个人IP
4. 为自己的产品代言。  

我现在重启知识星球, 早期星球冷启动只要 79¥ ,早早入手。  

还是那句话, 一个人也许很快,但一群人可以走的更远。  

欢迎你的加入。

⏰ 18:49 | ❤️ 41点赞 | 📝 148字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日向阳乔木 @vista8

喜欢摇滚乐、爱钓鱼的PM
网站:https://qiaomu.ai | 影响力: 0万粉丝

💡 核心观点: Claude适合工作,Gemini擅长科研,GPT强于编程。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: Claude Opus 4.7在GDPval-AA测试中得分1753分,比第二名高出79分 (需核实GDPval-AA测试的官方定义、评分标准及公开排名数据。若该测试由第三方机构发布且结果公开可查(如白皮书或基准测试平台),则可验证;否则需依赖推文作者提供数据来源。)
  • ◐ 部分可验证: Gemini 3.1 Pro在HLE、GPQA Diamond、SciCode等学术测试中排名第一 (需确认这些测试的官方结果(如学术论文、基准测试官网)。若测试为公开竞赛或研究项目(如Big-Bench),部分结果可能可查;但若涉及未公开数据集(如GPQA Diamond),则难以完全验证。)
  • ✓ 可验证: GPT-5.4在TerminalBench Hard和CritPt测试中表现最佳 (目前无公开信息提及GPT-5.4版本(截至2023年,最新为GPT-4),且TerminalBench Hard和CritPt测试来源不明,可能为内部或未公开基准,缺乏独立验证渠道。)

原文内容:

一句话总结:干活用Claude,科研用Gemini,写码用GPT

1. Claude Opus 4.7在实际工作任务上遥遥领先。

GDPval-AA这个测试中拿到1753分,比第二名高出79分。

这个测试不是做选择题,而是模拟真实工作。

2. Gemini 3.1 Pro的强项是知识和科学推理。

它在HLE(人类最后的考试)、GPQA Diamond(研究生级别物理化学题)、SciCode(科学编程)这些学术测试中都排第一。

如果你的工作涉及科研、需要处理专业知识,Gemini更合适。

3. GPT-5.4则在长周期编程和科学推理上占优。

它在TerminalBench Hard(复杂终端操作)和CritPt(批判性思维)这些需要长时间思考、多轮迭代的任务中表现最好。

⏰ 18:25 | ❤️ 94点赞 | 📝 175字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日Justin @interjc

ENTJ-A|程序员|大阪在住 | 影响力: 0万粉丝

💡 核心观点: AI将消解公司形态,个体自足协作即可。

可信度: 4/10 – 1项需进一步确认;2项为观点陈述

事实核查:

  • ◦ 观点: AI的发展将使许多公司失去存在的必要,因为公司形态是为多人互补协作而设计的 (该声明是对未来AI影响的预测性观点,缺乏具体数据或案例支持,属于主观推断。)
  • ◦ 观点: 未来每个人都能完成所有事,全成为个体工商户并通过互相采购协作 (这是对未来经济形态的假设性描述,无现实依据或可验证的路径,属于主观愿景。)
  • ◐ 部分可验证: 公司形态的存在是因为个人无法独立完成复杂任务,需多人互补 (公司起源和协作效率的理论有经济学研究支持(如科斯定理),但“无法独立完成”是概括性表述,需具体场景验证。)

原文内容:

AI 这么发展下去,很多公司就没有了存在的必要,因为公司这种形态,本身就是给一个人没法完成太多事,必须很多人互补来准备的

照这么发展下去,未来每个人都可以完成所有的事,大家全都成为个体工商户,互相采购就好了

⏰ 18:16 | ❤️ 117点赞 | 📝 92字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日sitin @sitinme

增长黑客/ 社群运营/AI 出海赚美刀
对爬虫和RPA机器人有一点研究,http://aigocode.com
擅长用AI搞点副业 / vx: 257735 | 影响力: 0万粉丝

💡 核心观点: Mano-P 1.0纯视觉GUI智能体跨平台操作,支持本地部署。

可信度: 7/10 – 1项声明可直接验证;3项需进一步确认

事实核查:

  • ◐ 部分可验证: Mano-P 1.0是一个纯视觉的GUI智能体模型,不依赖API、DOM或协议解析,通过“看屏幕”操作界面 (需通过测试实际模型或查阅开源代码验证其是否仅依赖视觉输入,但技术原理可能需官方文档或论文支持(若未公开则部分不可验证)。)
  • ✓ 可验证: Mano-P 1.0支持本地部署,一台M4芯片的Mac即可运行,数据无需上传云端 (可通过官方GitHub仓库或文档查看系统要求、部署指南及隐私政策,硬件兼容性和数据本地化属客观事实。)
  • ◐ 部分可验证: Mano-P 1.0能操作网页、桌面软件及非标准界面,理论覆盖范围广 (需实测验证跨平台兼容性,非标准界面的支持程度可能因场景而异,官方Demo或案例可部分佐证。)

原文内容:

不管是之前的OpenClaw,还是刚冒头的Hermes Agent,大家都想让AI帮着做重复的界面操作,但大多都有坑——要么依赖API,要么只局限在浏览器,跨桌面应用根本不好使。

不过倒是也有开源项目在做这件事,Mano-P 1.0,它是一个纯视觉的GUI智能体模型,不靠插件,不靠 DOM,不靠协议解析,而是像人一样“看屏幕、理解界面、再动手操作”。

只要能看到屏幕,它就有机会理解并操作,不管是网页、桌面软件,还是一些非标准界面,理论上都能覆盖。

支持本地部署,一台 M4 芯片的 Mac 就能跑,数据不用上传云端,这对隐私和离线场景都很友好。

用法两种方式:要么用终端命令行安装,要么作为Skill装到OpenClaw、Claude Code里,Agent会自动调用。

⏰ 16:58 | ❤️ 26点赞 | 📝 219字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日fin @fi56622380

立场不重要,事物的运行逻辑和内在规律才是更值得关注的部分 |

读过三个不同专业的学位,体验过两个大洲的尘世生活,设计过一次火星车芯片,还没有去看过心心念念的冰川 | 影响力: 0万粉丝

💡 核心观点: 未来CPU将因AI代理激增成为结构性瓶颈。

可信度: 8/10 – 1项声明可直接验证;2项需进一步确认;2项为观点陈述

事实核查:

  • ◐ 部分可验证: “如果没有 MI308X,Q4 Data Center 只会比 Street 高不到 1%”这一数据点说明了当前CPU增长主要来源于AI芯片绑定的自研CPU,而非外部服务器需求 (需验证MI308X(假设为某AI加速芯片)的实际配置中CPU占比,以及数据中心季度增长数据的公开性。若厂商未披露具体绑定比例或细分数据,则无法完全验证。)
  • ◦ 观点: 软件API调用量将呈指数型增长,目前处于微小起步阶段,未来CPU需求会因agent调用量增加而成为结构性瓶颈 (属于对未来技术趋势的预测,缺乏具体数据支撑(如当前API调用基数或增长曲线)。虽符合逻辑推论,但无法通过现有公开信息验证。)
  • ◐ 部分可验证: 每代GPU的token吞吐量翻倍,将导致每个GPU支持的agent数量增加,从而需要更多CPU线程,最终使CPU成为瓶颈 (GPU的token吞吐量提升可通过厂商技术文档(如NVIDIA H100/B100白皮书)部分验证,但“CPU成为瓶颈”需结合具体应用场景的线程需求实测,目前缺乏公开案例。)

原文内容:

CPU 不能像 memory / optics 那样猛涨价,这个判断在“普通紧缺”场景里是合理的,就像今年年初一样,只有10%的涨价

但他的前提是,每块GPU带几个CPU比例是主要的CPU增量:“如果没有 MI308X,Q4 Data Center 只会比 Street 高不到 1%”这个data point很有价值,充分说明了现在CPU增长的来源,agentic flow带来的增量几乎为零

但是很明显未来并不是这样,软件API调用是指数型上升的,现在还处于完全没有起步的微小阶段

CPU shortage debt会越来越多,早晚要还的,因为这是结构性的比例变化,现在一个agent调用的CPU还不多,以后会越来越多,API就像是GPU的手脚一样,CPU以后会成为结构性瓶颈

每一个GPU产生的token每一代是翻倍的,那么以后每一个GPU能批量同时支持的agent也是越来越多的,也就对应了调用的CPU threads也越来越多,所以CPU不够会成为瓶颈

CPU 还是 capex share loser,这个说法在2026没啥问题,因为现在确实不是瓶颈。但是在agent coding量一年十倍的背景下,以及每一个GPU的token throughput每一代都翻倍的背景下,2027-2028呢?

我们要用动态的眼光看问题

他的datapoint反而支持了我的论点:我的四个逻辑点里,第一个逻辑点明确强调了,“这部分CPU主要是各家AI 芯片绑定自研,并不是纯粹的CPU服务器,其实不算是外部CPU服务器的机会”,也就是说,软件API调用指数型增长的机会,目前仍然是零的情况下,CPU已经涨价20%,已经供不应求了

那等软件API调用指数型增长的时候,CPU得涨价多少?

PS:抱歉没用英文回复,我用中文回复思路会清晰一些也快一些

⏰ 14:08 | ❤️ 337点赞 | 📝 455字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日dontbesilent @dontbesilent

商业哲学爱好者
dbskill 作者|开放了我的商业方法论
生活合伙人 @xiaoniantalk | 影响力: 0万粉丝

💡 核心观点: 小红书虚拟产品上架难催生第三方服务需求

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: 小红书对虚拟产品的打击力度比抖音/视频号更大 (可通过对比三家平台的公开规则或下架案例验证,但需具体数据支持(如官方公告或第三方统计),目前无直接公开数据证明“过之而不及”的量化结论。)
  • ◦ 观点: 未来第三方店铺代上架虚拟产品将成为小红书主流(与抖音/快手/视频号方案一致) (属于对未来趋势的预测,无现行政策或官方声明支持,且“主流”定义模糊,无法客观验证。)
  • ✓ 可验证: 某第三方平台计划下季度开通小红书代上架服务 (依赖匿名信源(“其中一家”),未提供平台名称或公开证据,且“下季度”为未发生事件,无法追溯验证。)

原文内容:

小红书对虚拟产品的打击,相比抖音/视频号,已经有过之而不及

未来通过第三方店铺实现在小红书代上架,应该会变成主流,和现在抖音/快手/视频号方案一致

目前我熟悉的这几个第三方平台,还没正式开通小红书这边的服务(可能也是因为摸不清小红书的喜怒无常),其中有一家和我说是下季度上线这个服务

对于虚拟产品商家而言,如果能稳定上架,交给第三方 10%~20% 服务费是没什么问题的

如果有人能在现在这个节骨眼提供这个服务,我觉得我能拉过来 1000 个商家

⏰ 15:37 | ❤️ 83点赞 | 📝 190字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日GitHubDaily @github_daily

挖掘开源的价值
坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术
A list cool, interesting projects of GitHub.
公众号:GitHubDaily | 影响力: 0万粉丝

💡 核心观点: 极简AI框架GenericAgent越用越聪明,自动固化技能操控多设备。

可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: GenericAgent 是一个只有约 3000 行核心代码的极简自主 Agent 框架 (可通过 GitHub 仓库(http://github.com/lsdefine/GenericAgent)直接查看代码量,确认核心代码规模。)
  • ◐ 部分可验证: GenericAgent 内置 9 个工具,能操控浏览器、终端、文件系统甚至手机 (GitHub 仓库可查看工具列表和功能描述,但需实测验证具体操控能力(如 ADB 控制手机)。)
  • ◐ 部分可验证: 每完成一个新任务,执行路径会自动固化成技能,下次直接调用 (需通过实际测试任务(如发邮件)验证技能固化逻辑,仓库文档可能提供部分说明。)

原文内容:

各类 AI Agent 框架动辄几十万行代码,还有复杂的环境配置,光看到这些就让感到头疼。

偶然看到,一款主打极简和自我进化的自主 Agent 框架:GenericAgent,用完即进化,越用越聪明。

只有约 3000 行核心代码,内置 9 个工具,就能让大模型直接操控你的电脑,覆盖浏览器、终端、文件系统甚至手机。

GitHub:http://github.com/lsdefine/GenericAgent…

每完成一个新任务,执行路径会自动固化成技能,下次遇到同类任务直接调用,不用重复折腾。

比如第一次让它帮你发邮件,它会自己配置流程并保存,之后一句话就能搞定。 

还能注入真实浏览器保留登录状态,通过 ADB 控制手机操作。

自带分层记忆机制,上下文消耗不到常规框架的零头,极大降低了我们的调用成本。

还支持接入个人微信、飞书、钉钉等作为前端机器人,方便随时随地发号施令。

顺带一提,这个项目仓库的代码提交甚至都是由 Agent 自己独立完成的。

适合想要一个轻量级、能不断进化成专属 AI 助理的朋友拿去折腾。

⏰ 15:30 | ❤️ 72点赞 | 📝 315字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日汉松 @yonah_x

阿福 AgentTeam | AI 降临派 | 终身学习者 | Taste is all you need | 影响力: 0万粉丝

💡 核心观点: AI设计工具ClaudeDesign让普通人也能轻松创作专业作品。

可信度: 10/10 – 3项声明可直接验证;1项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: Claude Design 能让设计小白一次做出可交互的动态演示稿 (需实际测试 Claude Design 的功能,观察其是否支持非专业用户通过截图和简单指令生成交互稿,但官方若提供案例或演示视频则可部分验证。)
  • ✓ 可验证: Claude Design 提供脑爆模式(快速生成四版初稿)和深入设计模式 (若官方文档或宣传材料明确说明该功能模式(如官网功能介绍或演示视频),则可直接验证。)
  • ✓ 可验证: Figma、Adobe 市值闪崩与 Claude Design 的推出直接相关 (市值波动受多重因素影响,无公开证据表明两者存在直接因果关系,且推文未提供数据来源或时间关联性分析。)

原文内容:

今天看到“Claude Design 暴击设计行业,Figma、Adobe 市值闪崩”,“设计师迎来 ClaudeCode 时刻”的标题我内心是毫无波澜,内心 OS:又开始在制造焦虑了。等我试用完 Claude Design 之后,我只能说“Figma、Adobe”跌的不冤,我现在终于理解了非程序员使用 ClaudeCode 做出软件时的那种感觉。

我对设计一窍不通,但我用Claude Design 居然一次就做出了一个好看的交互稿,而且是可以交互,动态演示的。

设计的过程跟程序员用 ClaudeCode 真的很像。把各种想要的效果截图发给它,然后说一下要求,它会询问好几个问题,就像 Plan 模式一样,等我确认完然后就开始开发,一次给我提供了四个版本的效果。

ClaudeDesign 有两种模式,一种就是视频里面的脑爆模式,AI 帮我快速提供四个版本的初稿。另一种是脑爆后选一种进行深入设计的模式。

从人人都是产品经理,到人人都是程序员,现在人人都是设计师,下一个是谁?

⏰ 15:20 | ❤️ 78点赞 | 📝 277字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日-Zho- @zho_zho_zho

Aichitect ➟ Architect | Artist | AI explorer @ZHO_ZHO_ZHO_EN | 影响力: 0万粉丝

💡 核心观点: 乔布斯亲自设计苹果计算器界面并沿用多年。

可信度: 6/10 – 1项声明可直接验证;1项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: 乔布斯使用“Steve Jobs 自定义计算器结构器”设计了Mac计算器的外观 (该声明引自《史蒂夫·乔布斯传》,但书中内容需通过查阅原书或权威传记渠道确认,且工具“Steve Jobs 自定义计算器结构器”是否为正式名称存疑,需进一步核实苹果内部历史记录或开发者证言。)
  • ✓ 可验证: 乔布斯的设计成为Mac计算器15年的标准外观 (可通过对比历代Mac系统(如1984年Mac OS至2000年前后)的计算器界面设计变化,或苹果官方设计文档、历史资料验证其一致性。)
  • ◦ 观点: Claude Design与40年前的Vibe Design相似 (推文将“Claude Design”与“Vibe Design”类比属于主观审美判断,无客观标准或直接证据支持这一比较。)

原文内容:

Claude Design 让我想起了40 年前的 Vibe Design 

Apple 计算器 正是乔布斯 vibe 出来的哈哈哈哈哈哈

“
有一天,埃斯皮诺萨灵机一动,发明了一个“Steve Jobs 自定义计算器结构器”,这样乔布斯就可以随意调整线条的粗细、按钮的大小、阴影、背景和其他属性来设计计算器的外观,定制符合自己心意的计算器。

一天下午,乔布斯又过来了,埃斯皮诺萨把这个程序展示给乔布斯用。乔布斯并没有一笑置之,而是这刻用了起来,依照自己的品位调整计算器外观。

10 分钟以后,他把计算器设计成了自己喜欢的样子。不出意料,他的设计成为 Mac上最终使用的设计,未来15年也一直都是苹果电脑计算器的标准外观
”
出自《史蒂夫·乔布斯传》

⏰ 15:07 | ❤️ 23点赞 | 📝 230字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日李继刚 @lijigang

一个把问题当燃料的人 | 影响力: 0万粉丝

💡 核心观点: 社会规训下人们活成他人,觉醒后才直面本真自我。

可信度: 6/10 – 1项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ◐ 部分可验证: 人类行为大多受社会影响(穿相似衣服、说相似话、关心相似事物等),这是人作为社会动物的体现。 (社会学和心理学研究(如从众实验、社会规范理论)可部分支持这一现象,但“大多数时候”的量化表述缺乏明确数据支撑,且个体差异未被纳入。)
  • ◐ 部分可验证: 重大人生事件(如重病、亲人离世)可能引发对死亡的焦虑(海德格尔所称的”Angst”),导致个体脱离社会化的”人们”维度,进入”本真”状态。 (存在主义哲学(如海德格尔理论)和创伤后成长研究可部分验证这一机制,但“本真”属于哲学概念,无法通过实证完全验证,且个体反应差异较大。)
  • ✓ 可验证: 海德格尔提出的”本真”和”决断”指个体在脱离社会规范后选择真正属于自己的生活方式。 (这一声明可直接通过海德格尔的著作(如《存在与时间》)中的原始论述验证,属于哲学理论的定义范畴。)

原文内容:

「大多数时候,你不是你——你是"人们"。你穿大家穿的衣服,说大家说的话,关心大家关心的事,对大家厌恶的东西厌恶。你看新闻,是因为大家看;你升职加薪,是因为大家以为这是好的;你结婚生子,是因为时间到了大家都这么做。这不全是坏事,这是人之所以是社会动物的方式。但代价是:你的存在不是你的,是借来的。你随时可以把它还回去,因为你从一开始就没真正拿过它。

直到有一天——通常是被某个事件砸中,比如一场重病、一个亲人的死、一次破产、一段关系的崩塌——某种深层的焦虑(不是怕某个具体的东西,是莫名地焦虑,海德格尔叫 Angst)涌上来,你突然看见:我有一天会死,而且死的是我,没有任何人能替我死。这一刻,那个借来的"人们"维度突然崩了,剩下你赤裸地面对自己的可能性。

这个赤裸时刻,海德格尔叫"本真"。不是道德上的高尚,不是修行人的境界——是一种结构上的"领会自己"。从这里你可以选择真正属于自己的活法——他叫"决断"。」

⏰ 14:46 | ❤️ 121点赞 | 📝 335字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日GitHubDaily @github_daily

挖掘开源的价值
坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术
A list cool, interesting projects of GitHub.
公众号:GitHubDaily | 影响力: 0万粉丝

💡 核心观点: AI智能体自我进化引擎可自动优化提示词并修复错误。

可信度: 9/10 – 2项声明可直接验证;2项需进一步确认

事实核查:

  • ◐ 部分可验证: Evolver 是一个专为 AI 智能体设计的自我进化引擎,能够自动扫描运行日志和错误模式,提取关键特征信号,生成提示词引导自我修复与迭代。 (可通过 GitHub 仓库(http://github.com/EvoMap/evolver)查看项目描述、代码结构和文档,验证其功能设计是否匹配声明。但需实际部署测试以确认自动扫描、特征提取等核心功能的真实效果。)
  • ✓ 可验证: Evolver 提供四种策略模式(日常均衡、快速上新、稳定性加固、紧急修复),可通过一个参数切换。 (GitHub 仓库的文档或代码中应明确列出策略模式及其切换方式,属于可直接验证的技术实现。)
  • ◐ 部分可验证: Evolver 仅输出进化策略,绝不擅自修改底层业务代码,保证运行安全性。 (需通过代码审计或测试运行确认其权限控制逻辑,但安全性声明需长期实践验证,存在部分主观性。)

原文内容:

在开发 AI Agent 应用时,根据报错手动微调提示词,不仅繁琐,修改记录也很难沉淀复用。

在 GitHub Trending 榜单上,看到一个专为 AI 智能体设计的自我进化引擎:Evolver。

能够自动扫描运行日志和错误模式,从中提取出关键的特征信号。

进而匹配专属的进化基因,生成带有严格协议约束的提示词,引导智能体完成系统性的自我修复与迭代。

GitHub:http://github.com/EvoMap/evolver

只负责输出进化策略,绝不会擅自修改我们的底层业务代码,保证了极高的运行安全性。

内置四种策略模式,日常均衡发展、快速上新功能、专注稳定性加固、紧急修复,一个参数就能切换。

提供开箱即用的离线模式,也可以接入 EvoMap 网络和其他节点协作进化、共享技能。

如果你在维护 AI Agent 项目,正面临提示词管理混乱的问题,或者想让 AI 具备规范的自适应纠错能力,这个引擎值得花时间研究一下。

⏰ 14:22 | ❤️ 20点赞 | 📝 280字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日sitin @sitinme

增长黑客/ 社群运营/AI 出海赚美刀
对爬虫和RPA机器人有一点研究,http://aigocode.com
擅长用AI搞点副业 / vx: 257735 | 影响力: 0万粉丝

💡 核心观点: 开源项目提供大牌设计规范,让AI生成界面更专业美观。

可信度: 10/10 – 2项声明可直接验证;2项需进一步确认;1项为观点陈述

事实核查:

  • ✓ 可验证: 开源项目 awesome-design-md 在 GitHub 上线 10 天左右获得 4 万 Star (可通过 GitHub 仓库的 Star 历史记录或公开统计数据直接验证)
  • ◐ 部分可验证: awesome-design-md 将 Nike、Notion、Claude、Figma 等知名网站的设计风格整理为 AI 可读的 DESIGN.md 文件 (需检查 GitHub 项目内容是否包含所述设计规范,但“AI 能直接读懂”需实测模型效果,无法完全通过公开信息验证)
  • ✓ 可验证: DESIGN.md 文件包含字体、阴影、边框等细节参数,而非空泛的风格描述 (可直接查看项目中的 DESIGN.md 文件内容,确认是否包含具体设计参数)

原文内容:

解决你的 AI 生成的界面丑陋的问题的开源项目,叫 awesome-design-md。开源 10 天左右,GitHub 就冲到 4 万 Star 了。

它干的事很直接:把 Nike、Notion、Claude、Figma 这些知名网站的设计风格,整理成 AI 能直接读懂的 DESIGN.md 文件。

以前大家用 AI 写页面,最大的问题不是功能写不出来,而是做出来总有点土。颜色不对,间距不对,字重不对,整体看着就很“AI 味”。

但有了这种 DESIGN.md,你就相当于直接把一套成熟的大牌设计规范塞给 AI,让它照着来,出来的东西一下就顺眼很多。

而且它不只是随便写几句“极简风”“科技感”这种空话,里面很多都是从真实网站里提出来的细节参数。

比如字体、阴影、边框、间距、组件样式这些,全都写得很细。你把文件扔进项目里,再告诉 AI 参考这个风格生成 UI,基本就相当于请了一个不会下班的设计参谋。

DESIGN.md ,它很可能会慢慢改变设计和开发的配合方式。以前设计规范更多是给人看的,后面很可能会越来越多变成给 AI 读的。

功能怎么做,看 AGENTS.md;界面长什么样,看 DESIGN.md。一个管逻辑,一个管颜值,这套搭配还真挺顺。

⏰ 14:09 | ❤️ 30点赞 | 📝 332字 | 查看原文 →

↑ 返回顶部

【AI 奏折】04月19日iGeekbb @igeekbb

发一些碎碎念和有趣的东东,主打一个快分享。-私信开放欢迎投稿- | 影响力: 0万粉丝

💡 核心观点: 美团举办骑手工服设计大赛,优秀作品遭下架引争议。

可信度: 8/10 – 2项声明可直接验证;1项需进一步确认

事实核查:

  • ✓ 可验证: 美团外卖、站酷、中国服装设计师协会将于2026年4月举办“第一届黄衣服设计大赛” (该声明涉及未来事件(2026年),目前无法通过公开渠道验证其真实性,且未提供官方公告或活动链接作为依据。)
  • ✓ 可验证: 大赛奖金池为120万元,面向大众征集骑手工服设计方案,要求为安全、舒服、好看 (奖金金额和参赛规则同样属于未来计划,缺乏当前可查证的官方信息支持。)
  • ◐ 部分可验证: 有几幅设计不错的黄衣服被下架了 (该陈述未说明下架的具体作品、原因或来源,且事件发生于未来(假设大赛已举办),目前无法核实。)

原文内容:

2026年4月,美团外卖和站酷、中国服装设计师协会一起办了个"第一届黄衣服设计大赛"。奖金池 120 万,面向大众征集骑手工服设计方案,要求就三条:安全、舒服、好看。

非常遗憾,有几幅设计不错的黄衣服被下架了……

⏰ 13:24 | ❤️ 257点赞 | 📝 81字 | 查看原文 →

↑ 返回顶部

© 版权声明

相关文章

暂无评论

暂无评论...