《VBA信息获取与处理》教程是我推出第六套教程,目前已经是初版修订了。这套教程定位于最高级,是学完低级,中级后的教程。这部教程给大家讲解的内容有:跨运用程序信息得到、随机信息的利用、电子邮件的发送、VBA互联网数据抓取、VBA延时操作,剪贴板运用、Split函数扩展、事情表信息与其他运用交互,FSO工具的利用、事情表及文件夹信息的获取、图形信息的获取以及定制事情表信息函数等等内容。程序文件通过32位和64位两种OFFICE系统测试。是非常抽象的,更具研究的代价。
教程共两册,八十四讲。今日的内容是专题六“VBA中利用XMLHTTP完成网抓数据”的第1讲:XMLHTTP的大略讲解
第一节 XMLHTTP的大略讲解及干系观点的先容
现在的社会是网络的社会,离开了网络,很多事情会变得不通畅。我们日常的生活也是和网络紧密联系一起的,那么网络是如何搭建的呢?我们可以通过本讲的讲解理解到HTTP 超文本传输协议,TCP/IP的先容,XMLHTTP的先容,等等。
1 什么是XMLHTTP,它是用来做什么的?
1) XML的先容 XML指可扩展标记措辞(EXtensible Markup Language),设计宗旨是传输数据,是W3C (万维网同盟World Wide Web Consortium)的推举标准。XML 是各种运用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越盛行。
2) HTTP的先容 HTTP 超文本传输协议(HyperText Transfer Protocol,超文本传输协议)是因特网上运用最为广泛的一种网络传输协议,所有的WWW文件都必须遵守这个标准。
HTTP是一个基于TCP/IP通信协议来通报数据(HTML 文件, 图片文件, 查询结果等)。
3) TCP/IP的先容 TCP/IP是供已连接因特网的打算机进行通信的通信协议(Transmission Control Protocol / Internet Protocol)。定义了电子设备(比如打算机)如何连入因特网,以及数据如何在它们之间传输的标准。
TCP 用于运用程序之间的通信。当运用程序希望通过 TCP 与另一个运用程序通信时,它会发送一个通信要求。这个要求必须被送到一个确切的地址。在双方“握手”之后,TCP 将在两个运用程序之间建立一个全双工 (full-duplex) 的通信。这个全双工的通信将占用两个打算机之间的通信线路,直到它被一方或双方关闭为止。
IP 用于打算机之间的通信。IP 是无连接的通信协议。它不会占用两个正在通信的打算机之间的通信线路。这样,IP 就降落了对网络线路的需求。每条线可以同时知足许多不同的打算机之间的通信须要。通过 IP,(或者其他数据)被分割为小的独立的包,并通过因特网在打算机之间传送。IP 卖力将每个包路由至它的目的地。
TCP/IP协议意味着 TCP 和 IP 在一起协同事情。TCP 卖力运用软件(比如你的浏览器)和网络软件之间的通信。IP 卖力打算机之间的通信。TCP 卖力将数据分割并装入 IP 包,然后在它们到达的时候重新组合它们。IP 卖力将包发送至接管者。
4) XMLHTTP的先容 XMLHTTP是一套可以在Javascript、VbScript、Jscript等脚本措辞中通过http协议传送或从吸收XML及其他数据的一套API。XmlHttp最大的用途是可以更新网页的部分内容而不须要刷新全体页面。
来自MSDN的阐明:XmlHttp供应客户端同http做事器通讯的协议。客户端可以通过XmlHttp工具(MSXML2.XMLHTTP.3.0)向http做事器发送要求并利用微软XML文档工具模型Microsoft® XML Document Object Model (DOM)处理回应。
现在的绝对多数浏览器都增加了对XmlHttp的支持,IE中利用ActiveXObject办法创建XmlHttp工具,其他浏览器如:Firefox、Opera等通过window.XMLHttpRequest来创建xmlhttp工具.
2 运用XMLHTTP抓取数据的步骤1)创建XMLHTTP工具 //需MSXML4.0支持
2)打开与做事真个连接,同时定义指令发送办法,做事网页(URL)和要求权限等。客户端通过Open命令打开与做事真个做事网页的连接。与普通HTTP指令传送一样,可以用"GET"方法或"POST"方法指向做事真个做事网页。
3)发送指令。
4)等待并吸收做事端返回的处理结果。
5)开释XMLHTTP工具
3 XMLHTTP的属性及方法1) XMLHTTP的常见属性:
onreadystatechange:在同步实行办法下得到返回结果的事宜句柄。只能在DOM中调用。
responseBody: 结果返回为无符号整数数组。
responseStream: 结果返回为IStream流。
responseText: 结果返回为字符串。
responseXML: 结果返回为XML格式数据。
2) XMLHTTP的常用方法:
① Open(bstrMethod, bstrUrl, varAsync, bstrUser, bstrPassword)创建一个新的http要求,并指定此要求的方法、URL以及验证信息(用户名/密码)打开指定网址
bstrMethod: 数据传送办法,即GET或POST。
bstrUrl: 做事网页的URL。
varAsync: 是否同步实行。缺省为True,即同步实行,但只能在DOM中履行同步实行。用中一样平常将其置为False,即异步实行。
bstrUser: 用户名,可省略。
bstrPassword:用户口令,可省略。
setRequestHeader(bstrHeader, bstrvalue)
bstrHeader:HTTP 头(header)
bstrvalue: HTTP 头(header)的值
如果Open方法定义为POST,可以定义表单办法上传:
xmlhttp.setRequestHeader("Content-Type", "application/x-www-form-urlencoded")
② Send(varBody)发送要求到http做事器并吸收回应
varBody:指令集。可以是XML格式数据,也可以是字符串,流,或者一个无符号整数数组。也可以省略,让指令通过Open方法的URL参数代入。
③ abort 取消当前要求
④ getAllResponseHeaders 获取相应的所有http头
⑤ getResponseHeader 从相应信息中获取指定的http头
以上我给出了一些常用的属性和方法,其他的大家可以参考干系的资料,或许我在今后的课程中会用到时讲解。同时我们还要紧张下面的把稳点:
1、ResponseBody是二进制的数据,是做事器传来的没有经由任何加工的数据。
2 ResponseText是按照utf-8编码把ResponseBody转换而成,也便是:ResponseText=ByteToStr(ResponseBody,"UTF-8")
本节知识点回向:理解一些观点,HTTP,TCP/IP,XMLHTTP,以及XMLHTTP的常用属性和方法。
我20多年的VBA实践履历,全部浓缩不才面的各个教程中,教程学习顺序: