原来批量爬公众号文章可以不花钱

AI赚钱4个月前更新 sevennight
294 0 0

概要:工具就是给人用的,作者使用了Claude Artifacts,进行多次尝试,从不同角度实现自己批量爬公众号文章的需求想法,对于非专业码农来说,借鉴意义重大。

本文作者:杨昌。发文时间:2024.7.30


我记得去年圣诞前后,曾YY过一个小项目:

把某科普类公众号潜在客户的文章批量扒下来,然后做成其他形态的内容,去更多渠道给他们搞销售线索。

后来因为各种原因,项目不了了之。但其中的一个原因,我现在都印象特别深刻:

之前获得的某「批量下载公众号文章付费工具」的免费时长,已经到期了……

1、难题

最近,我又收到一个相关的问题,对方说:

“我想让AI写一段简单的爬虫代码,实现对某公众号特定时间段的内容进行保存。

我知道可以用分步或者工作流的方式去实现。

但对于真小白而言,光问AI有哪些实现方式,用哪种语言合适,需要配置哪些环境就足以消耗耐心。

更不用说后续的debug过程……”

感谢这个好问题,也非常生动形象地讲清楚了我去年圣诞的尴尬处境。我当时不是没想过让AI 写代码,但光想想这些问题,就不敢轻易下手了。

2、改换思路

不过今时,已经不同往日。

自从 Claude 出了 Artifacts 之后,我们技术小白,也可以更快写一个功能。当然,我也是今天才发现,原来用Claude Artifacts写代码,居然这么容易。

Artifacts 刚出来的时候,我就关注到了。不过当时没想好,该用在什么地方,就没有试过。

再后来,Poe 参考Claude Artifacts,出了个 Preview 的功能;Monica、Chatbox 等产品,也纷纷推出了Artifacts。我仍然没想好,该用在什么地方。

直到今早,在生财有术里看了篇“用AI 自学编程”的文章,觉得是时候试试了,才终于鼓起勇气用Claude Artifacts 写了版“开心消消乐”。

3、尝试

别说,这个开心消消乐的效果,还真不错。而且我完全用的是Claude 的免费机会,没花一分钱……

当我把效果展示给同事过后,对方又让我写了个超级马里奥和抢票脚本,也都成功了。这几轮下来,给了我很大的自信。

那会儿我也正在考虑今天回答什么问题,无意中看到了前面那个爬公众号的问题。行,就它了。

4、失败

回答之初,我习惯性地问了下 perplexity,它给我推荐了WeChatDownload 的 github 项目。

当我看完README 后,就有了开头的那句感叹:“原来批量爬公众号文章,是可以不花钱的……”

可当我费劲巴拉把软件下载下来之后,确发现没有支持 Mac 的版本,根本用不了。

那就退而求其次,先自己用 Claude Artifacts 写一个爬单篇公众号文章的小工具吧。结果还是不行,Claude 官方拒绝回答这个问题……

说个题外话,早一些时候用 Claude Artifacts 写抢票脚本的时候,它也是拒绝的。扭扭捏捏了聊了几轮过后,给我写了个看12306 上余票数量的……

5、继续尝试

不过,天无绝人之路。白天在群里,刚好跟大家聊到了 poe 等上面类似的功能。

于是我就重新打开了 poe,找到 Claude 的官方机器人,输出提示词:“做一个微信公众号文章的小爬虫,我把公众号文章给它,它就能自动抓取文章中的内容,你的答案是?”

原来批量爬公众号文章可以不花钱

演示效果图(图一)

这回可以了,它没有拒绝我。不过前三轮,它只给了个演示效果图(图一),并不能达到输入链接就爬取内容的效果。

它还解释说:“要实现一个完全功能的网页爬虫,我们需要一个后端服务器来处理请求和执行爬虫操作,这超出了我们在这里能直接实现的范围。”

原来批量爬公众号文章可以不花钱

Claude机器人给出的建议

行吧,那就让它给我写个可以在 colab 上运行的版本。结果很快出来了,不仅给了完整代码,还给了操作步骤(见图二)。运行第一遍,失败了,我就截图把报错信息发过去让它改。很快,就初步实现我想要的效果了(见图三)。

原来批量爬公众号文章可以不花钱

实现效果

开心,虽然很多国产AI 都可以读公众号文章了,但它们输出长度有限,做不到一次性输出全部内容。现在我自己用代码写了个爬虫,想爬多长就爬多长……

———

看来,非技术人员的春天,真的来了。一些小的功能,真的可以通过Claude Artifacts 等免费实现。

担心Claude 被封号,就不妨用 poe 的 preview。仅靠免费额度,就能写出好几个小工具,风控还没有那么严格。

© 版权声明

相关文章

暂无评论

暂无评论...