离谱?老师要下载公众号80+图片并合并成PDF!
原创2023年7月21日大约 2 分钟...约 688 字
1. 需求😲
你好,我是悦创。
这次,我可是接到很离谱的一个需求了。话不多说,上聊天💬记录。
说实话,对于老师这种不合理且自私的行为,我不想做什么评价。
但是,对于我的私教学员来说,我得确得为她提供帮助,毕竟时间短任务重。
2. 思路
- 爬虫:批量保存图片
- Python 读取多张图片进行合并导出 PDF
3. 开始
3.1 爬虫抓取
Code
import requests
url = "https://mp.weixin.qq.com/s/E2JfYua4WR9l6HIRgUxH2A"
headers = {
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36"
}
response = requests.get(url, headers=headers)
print(response.text)
输出
https://github.com/AndersonHJB/BornforthisData/blob/main/blog/2023/7month/02/out.html
但是,通过输出结果可以发现:找不到需要的图片的链接:
好吧😑,但是比较着急没找到。写文章的时候,找到了:
但是,我还是分享一下,但是没找到的原因以及我的处理方法。
- 原因:我直接复制图片链接后,没有进行适当的删除导致没有搜索到。
- 此时,我直接采用手动复制一页的源代码,接着使用 BeautifulSoup 来进行解析。
当然,现在既然请求中有需要的数据,我们接着解析。
因为,本次不是爬虫教程,这里不写具体的实现过程,有需要留言评论。
3.2 完整的爬虫代码
欢迎关注我公众号:AI悦创,有更多更好玩的等你发现!
公众号:AI悦创【二维码】
AI悦创·编程一对一
AI悦创·推出辅导班啦,包括「Python 语言辅导班、C++ 辅导班、java 辅导班、算法/数据结构辅导班、少儿编程、pygame 游戏开发、Linux、Web 全栈」,全部都是一对一教学:一对一辅导 + 一对一答疑 + 布置作业 + 项目实践等。当然,还有线下线上摄影课程、Photoshop、Premiere 一对一教学、QQ、微信在线,随时响应!微信:Jiabcdefh
C++ 信息奥赛题解,长期更新!长期招收一对一中小学信息奥赛集训,莆田、厦门地区有机会线下上门,其他地区线上。微信:Jiabcdefh
方法一:QQ
方法二:微信:Jiabcdefh
你认为这篇文章怎么样?
- 0
- 0
- 0
- 0
- 0
- 0