爬取网站数据
爬虫基本步骤
1 | import requests |
经验(●’◡’●)
- 静态页面一般可以直接通过get请求获得网页数据
- 需要js动态渲染的页面获取数据会稍微复杂一点,可以先查看返回的xhr或json文件是否有想要的数据(预览),或者ctrl+F搜索关键词
- 通过“发起程序”可以查看文件的请求程序发起链
- 爬虫的关键是抓包!找到我们感兴趣的数据!
应用案例1:爬取网站课件
1 | import requests |
应用案例2:爬取Allen小鼠脑图谱
1 | import requests |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Stray Birds!
评论