《VBA信息获取与处理》教程是我推出第六套教程,目前已经是初版修订了。
这套教程定位于最高级,是学完低级,中级后的教程。
这部教程给大家讲解的内容有:跨运用程序信息得到、随机信息的利用、电子邮件的发送、VBA互联网数据抓取、VBA延时操作,剪贴板运用、Split函数扩展、事情表信息与其他运用交互,FSO工具的利用、事情表及文件夹信息的获取、图形信息的获取以及定制事情表信息函数等等内容。
程序文件通过32位和64位两种OFFICE系统测试。
是非常抽象的,更具研究的代价。

教程共两册,八十四讲。
今日的内容是专题六“VBA中利用XMLHTTP完成网抓数据”的第1讲:XMLHTTP的大略讲解

第一节 XMLHTTP的大略讲解及干系观点的先容

现在的社会是网络的社会,离开了网络,很多事情会变得不通畅。
我们日常的生活也是和网络紧密联系一起的,那么网络是如何搭建的呢?我们可以通过本讲的讲解理解到HTTP 超文本传输协议,TCP/IP的先容,XMLHTTP的先容,等等。

jsxmlhtmlXMLHTTP的简略讲授 SQL

1 什么是XMLHTTP,它是用来做什么的?

1) XML的先容 XML指可扩展标记措辞(EXtensible Markup Language),设计宗旨是传输数据,是W3C (万维网同盟World Wide Web Consortium)的推举标准。
XML 是各种运用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越盛行。

2) HTTP的先容 HTTP 超文本传输协议(HyperText Transfer Protocol,超文本传输协议)是因特网上运用最为广泛的一种网络传输协议,所有的WWW文件都必须遵守这个标准。

HTTP是一个基于TCP/IP通信协议来通报数据(HTML 文件, 图片文件, 查询结果等)。

3) TCP/IP的先容 TCP/IP是供已连接因特网的打算机进行通信的通信协议(Transmission Control Protocol / Internet Protocol)。
定义了电子设备(比如打算机)如何连入因特网,以及数据如何在它们之间传输的标准。

TCP 用于运用程序之间的通信。
当运用程序希望通过 TCP 与另一个运用程序通信时,它会发送一个通信要求。
这个要求必须被送到一个确切的地址。
在双方“握手”之后,TCP 将在两个运用程序之间建立一个全双工 (full-duplex) 的通信。
这个全双工的通信将占用两个打算机之间的通信线路,直到它被一方或双方关闭为止。

IP 用于打算机之间的通信。
IP 是无连接的通信协议。
它不会占用两个正在通信的打算机之间的通信线路。
这样,IP 就降落了对网络线路的需求。
每条线可以同时知足许多不同的打算机之间的通信须要。
通过 IP,(或者其他数据)被分割为小的独立的包,并通过因特网在打算机之间传送。
IP 卖力将每个包路由至它的目的地。

TCP/IP协议意味着 TCP 和 IP 在一起协同事情。
TCP 卖力运用软件(比如你的浏览器)和网络软件之间的通信。
IP 卖力打算机之间的通信。
TCP 卖力将数据分割并装入 IP 包,然后在它们到达的时候重新组合它们。
IP 卖力将包发送至接管者。

4) XMLHTTP的先容 XMLHTTP是一套可以在Javascript、VbScript、Jscript等脚本措辞中通过http协议传送或从吸收XML及其他数据的一套API。
XmlHttp最大的用途是可以更新网页的部分内容而不须要刷新全体页面。

来自MSDN的阐明:XmlHttp供应客户端同http做事器通讯的协议。
客户端可以通过XmlHttp工具(MSXML2.XMLHTTP.3.0)向http做事器发送要求并利用微软XML文档工具模型Microsoft® XML Document Object Model (DOM)处理回应。

现在的绝对多数浏览器都增加了对XmlHttp的支持,IE中利用ActiveXObject办法创建XmlHttp工具,其他浏览器如:Firefox、Opera等通过window.XMLHttpRequest来创建xmlhttp工具.

2 运用XMLHTTP抓取数据的步骤

1)创建XMLHTTP工具 //需MSXML4.0支持

2)打开与做事真个连接,同时定义指令发送办法,做事网页(URL)和要求权限等。
客户端通过Open命令打开与做事真个做事网页的连接。
与普通HTTP指令传送一样,可以用"GET"方法或"POST"方法指向做事真个做事网页。
 

3)发送指令。
 

4)等待并吸收做事端返回的处理结果。
 

5)开释XMLHTTP工具

3 XMLHTTP的属性及方法

1) XMLHTTP的常见属性: 

onreadystatechange:在同步实行办法下得到返回结果的事宜句柄。
只能在DOM中调用。
 

responseBody:   结果返回为无符号整数数组。
 

responseStream:  结果返回为IStream流。
 

responseText:   结果返回为字符串。
 

responseXML:   结果返回为XML格式数据。

2) XMLHTTP的常用方法: 

① Open(bstrMethod, bstrUrl, varAsync, bstrUser, bstrPassword)创建一个新的http要求,并指定此要求的方法、URL以及验证信息(用户名/密码)打开指定网址

bstrMethod:  数据传送办法,即GET或POST。
 

bstrUrl:    做事网页的URL。
 

varAsync:   是否同步实行。
缺省为True,即同步实行,但只能在DOM中履行同步实行。
用中一样平常将其置为False,即异步实行。
 

bstrUser:    用户名,可省略。
 

bstrPassword:用户口令,可省略。
 

setRequestHeader(bstrHeader, bstrvalue)

bstrHeader:HTTP 头(header) 

bstrvalue: HTTP 头(header)的值 

如果Open方法定义为POST,可以定义表单办法上传: 

xmlhttp.setRequestHeader("Content-Type", "application/x-www-form-urlencoded") 

② Send(varBody)发送要求到http做事器并吸收回应

varBody:指令集。
可以是XML格式数据,也可以是字符串,流,或者一个无符号整数数组。
也可以省略,让指令通过Open方法的URL参数代入。

③ abort 取消当前要求

④ getAllResponseHeaders 获取相应的所有http头

⑤ getResponseHeader 从相应信息中获取指定的http头

以上我给出了一些常用的属性和方法,其他的大家可以参考干系的资料,或许我在今后的课程中会用到时讲解。
同时我们还要紧张下面的把稳点:

1、ResponseBody是二进制的数据,是做事器传来的没有经由任何加工的数据。

2 ResponseText是按照utf-8编码把ResponseBody转换而成,也便是:ResponseText=ByteToStr(ResponseBody,"UTF-8")

本节知识点回向:理解一些观点,HTTP,TCP/IP,XMLHTTP,以及XMLHTTP的常用属性和方法。

我20多年的VBA实践履历,全部浓缩不才面的各个教程中,教程学习顺序: