Zohar的博客
爬虫与反爬虫策略 爬虫与反爬虫策略
什么是爬虫爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并将数据抓取下来,然后使用一定的规则提取有价值的数据。说白了就是使用任何技术手段,批量获取网站信息的一种方式。 爬虫是正经爬虫流不流氓我不知道爬虫需要遵守法律,程序员不仅要学
2022-12-27
主流爬虫框架对比 主流爬虫框架对比
目前的主流爬虫框架包括: JAVA Python PHP C# C/C++ apache Nutch2 scraty phpspider DotnetSpider open-source-search-engine webm
2022-12-17