如何使用VBA或网络爬虫抓取网站数据
VBA网捕捉的常用方法
1,xmlhttp/winhttp方法:
使用xmlhttp/winhttp模拟向服务器发送请求和接收服务器返回的数据。
优点:效率高,基本没有兼容性问题。
缺点:需要fiddler这样的工具来模拟http请求。
2、IE/webbrowser方法:
创建IE控件或webbrowser控件,结合htmlfile对象的方法和属性模拟浏览器操作,获取浏览器页面的数据。
优点:这种方法可以模拟大部分浏览器操作。所见即所得,浏览器能看到的数据都可以通过代码获取。
缺点:各种弹窗都挺烦的,兼容性真的是个伤脑筋的问题。在IE中上传文件是不可能的。
3.QueryTables方法:
因为是excel自带的,勉强算个方法。其实这个方法和xmlhttp差不多,也是以GET或者POST的形式发送请求,然后从服务器得到响应,返回给cell。
优点:excel自带,可以通过录制宏来获取代码,处理表格非常方便。
。代码简短,适合快速获取源代码表中存在的一些数据。
缺点:不能模拟referer和其他包头。
您还可以使用收集工具来收集网页上的数据,而无需编写代码。