计算机网络部分——http学习汇总

    科技2022-07-11  117

    文章目录

    1. 什么是HTTP1.1 概念1.2 版本1.3 工作原理1.4 特性1.5 导图 2. HTTP的消息结构2.1 请求部分(请求报文)2.1.1 格式2.1.2 具体格式 2.2 响应部分2.2.1 响应格式2.2.2 具体格式分析 2.3 额外信息2.3.1 对比响应部分和请求部分2.3.2 状态码2.3.3 请求方法2.3.4 响应头 3. 内容类型3.1 语法格式3.2 相关格式说明 4. 使用google调试页面5 其他相关问题5.1 http1.0、1.1,2.0的区别5.2 https和http的区别

    1. 什么是HTTP

    1.1 概念

    1、什么是协议

    网络协议是计算机之间为了实现网络通信而达成的一种“约定”或者”规则“,有了这种”约定“,不同厂商的生产设备,以及不同操作系统组成的计算机之间,就可以实现通信。

    2、什么是http协议

    HTTP协议是超文本传输协议的缩写,英文是Hyper Text Transfer Protocol。它是从WEB服务器传输超文本标记语言(HTML)到本地浏览器的传送协议。它是因特网上应用最为广泛的一种网络传输协议,所有的WWW文件都必须遵守这个标准。

    HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。

    设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。

    1.2 版本

    HTPP有多个版本,目前广泛使用的是HTTP/1.1版本。 版本如:HTTP1.0,HTTP1.1,HTTP2.0

    关于HTTP版本2.0

    HTTP/2(超文本传输协议第2版,最初命名为HTTP 2.0),简称为h2(基于TLS/1.2或以上版本的加密连接)或h2c(非加密连接),是HTTP协议的的第二个主要版本,使用于万维网。

    HTTP/2是HTTP协议自1999年HTTP 1.1发布后的首个更新,主要基于SPDY协议。它由互联网工程任务组(IETF)的Hypertext Transfer Protocol Bis(httpbis)工作小组进行开发。该组织于2014年12月将HTTP/2标准提议递交至IESG进行讨论,于2015年2月17日被批准。

    HTTP/2标准于2015年5月以RFC 7540正式发表。HTTP/2的标准化工作由Chrome、Opera、Firefox、Internet Explorer 11、Safari、Amazon Silk及Edge等浏览器提供支持。

    多数主流浏览器已经在2015年底支持了该协议。此外,根据W3Techs的数据,截至2019年6月,全球有36.5%的网站支持了HTTP/2。

    1.3 工作原理

    HTTP协议工作于客户端-服务端架构上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。

    Web服务器有:Apache服务器,IIS服务器(Internet Information Services)等。

    Web服务器根据接收到的请求后,向客户端发送响应信息。

    HTTP默认端口号为80,但是你也可以改为8080或者其他端口。

    备注

    1.4 特性

    http基于请求和响应模型

    必须先有请求才能响应请求和响应成对出现简单快捷(传输格式简单)

    HTTP三点注意事项:

    HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

    1.5 导图

    2. HTTP的消息结构

    HTTP在 应用层 交互数据的方式——报文;

    HTTP的报文分为:请求报文 + 响应报文

    2.1 请求部分(请求报文)

    2.1.1 格式

    验证: 第一步,我们简单编写一个http服务器如下:

    package SocketProgram; import java.io.IOException; import java.io.InputStream; import java.io.PrintWriter; import java.net.ServerSocket; import java.net.Socket; /** * 模拟创建自己的http服务器 */ public class Practice4_MyBrowser_Server { public static void main(String[] args) throws IOException { System.out.println("服务器启动!"); ServerSocket ss = new ServerSocket(9090);//服务器端口 Socket s = ss.accept(); System.out.println(s.getInetAddress()+"..连接!"); InputStream in = s.getInputStream(); byte []bytes = new byte[1024]; int len = in.read(bytes); //将请求信息都打印出来 System.out.println(new String(bytes,0,len)); PrintWriter pw = new PrintWriter( s.getOutputStream(), true); //给客户端反馈信息 pw.println("<html>" + "<font color='red' size='7'>这是简单模拟的服务器程序,作者LH</font>" + "</html>"); s.close(); ss.close(); } }

    第二步,现在运行服务器: 第三步,打开微软浏览器,往主机localhost的9090端口发送请求: 得到了我们写的服务器响应,是乱码,查看元数据:

    第四步,回到IDEA,看:

    2.1.2 具体格式

    请求行组成——请求方法【空格】请求域名或者资源路径【空格】http协议/版本号请求头组成——header(字段名):【空格】value;value可以多个,key只能一个

    2.2 响应部分

    2.2.1 响应格式

    验证 第一步,模仿浏览器发送请求的格式,编写一个客户端程序:

    package SocketProgram; import java.io.IOException; import java.io.InputStream; import java.io.PrintWriter; import java.net.InetSocketAddress; import java.net.Socket; import java.net.SocketAddress; /** * 既然我们知道了浏览器是如何发送请求的,那我们可以模拟这个请求 * 创建一个自己的浏览器。 * 访问的网页是:"www.icourse163.org"; * */ public class Practice4_MyBrowser_Client { public static void main(String[]args) throws IOException { Socket s = new Socket(); String hostname = "www.icourse163.org"; SocketAddress address = new InetSocketAddress(hostname,80); s.connect(address); //发送请求,按照http的格式 PrintWriter pw = new PrintWriter(s.getOutputStream(),true); pw.println("GET /channel/2001.htm HTTP/1.1"); pw.println("Host: "+hostname+":80 "); pw.println("Connection: keep-alive"); pw.println("Upgrade-Insecure-Requests: 1"); pw.println("User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) " + "AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36"); pw.println("Accept: text/html,application/xhtml+xml,application/xml;q=0.9," + "image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9"); pw.println("Accept-Encoding: gzip, deflate, br"); pw.println("Accept-Language: zh-CN,zh;q=0.9,en;q=0.8"); //注意加一个空行 pw.println(); //将接收到的数据打印出来。 InputStream in = s.getInputStream(); byte[]bytes = new byte[1024]; int len; while((len=in.read(bytes))!=-1){ //将响应得到的数据都打印出来下来 System.out.println(new String(bytes,0,len)); } s.close(); } }

    第二步,运行程序,观察输出:

    2.2.2 具体格式分析

    状态行组成——协议/版本【空格】状态码【空格】状态码描述响应头组成——键值对响应体组成——存放需要发送给客户端的数据

    2.3 额外信息

    2.3.1 对比响应部分和请求部分

    2.3.2 状态码

    当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。

    HTTP状态码的英文为HTTP Status Code。

    下面是常见的HTTP状态码:

    200 - 请求成功301 - 资源(网页等)被永久转移到其它URL404 - 请求的资源(网页等)不存在500 - 内部服务器错误

    2.3.3 请求方法

    2.3.4 响应头

    应答头说明Allow服务器支持哪些请求方法(如GET、POST等)。Content-Encoding文档的编码(Encode)方法。只有在解码之后才可以得到Content-Type头指定的内容类型。利用gzip压缩文档能够显著地减少HTML文档的下载时间。Java的GZIPOutputStream可以很方便地进行gzip压缩,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet应该通过查看Accept-Encoding头(即request.getHeader(“Accept-Encoding”))检查浏览器是否支持gzip,为支持gzip的浏览器返回经gzip压缩的HTML页面,为其他浏览器返回普通页面。Content-Length表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。如果你想要利用持久连接的优势,可以把输出文档写入 ByteArrayOutputStream,完成后查看其大小,然后把该值放入Content-Length头,最后通过byteArrayStream.writeTo(response.getOutputStream()发送内容。Content-Type表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。由于经常要设置Content-Type,因此HttpServletResponse提供了一个专用的方法setContentType。Date当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。Expires应该在什么时候认为文档已经过期,从而不再缓存它?Last-Modified文档的最后改动时间。客户可以通过If-Modified-Since请求头提供一个日期,该请求将被视为一个条件GET,只有改动时间迟于指定时间的文档才会返回,否则返回一个304(Not Modified)状态。Last-Modified也可用setDateHeader方法来设置。Location表示客户应当到哪里去提取文档。Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302。Refresh表示浏览器应该在多少时间之后刷新文档,以秒计。除了刷新当前文档之外,你还可以通过setHeader(“Refresh”, “5; URL=http://host/path”)让浏览器读取指定的页面。注意这种功能通常是通过设置HTML页面HEAD区的<META HTTP-EQUIV=“Refresh” CONTENT=“5;URL=http://host/path">实现,这是因为,自动刷新或重定向对于那些不能使用CGI或Servlet的HTML编写者十分重要。但是,对于Servlet来说,直接设置Refresh头更加方便。注意Refresh的意义是"N秒之后刷新本页面或访问指定页面”,而不是"每隔N秒刷新本页面或访问指定页面"。因此,连续刷新要求每次都发送一个Refresh头,而发送204状态代码则可以阻止浏览器继续刷新,不管是使用Refresh头还是<META HTTP-EQUIV=“Refresh” …>。注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但Netscape和IE都支持它。Server服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。Set-Cookie设置和页面关联的Cookie。Servlet不应使用response.setHeader(“Set-Cookie”, …),而是应使用HttpServletResponse提供的专用方法addCookie。参见下文有关Cookie设置的讨论。WWW-Authenticate客户应该在Authorization头中提供什么类型的授权信息?在包含401(Unauthorized)状态行的应答中这个头是必需的。例如,response.setHeader(“WWW-Authenticate”, “BASIC realm=\“executives\””)。注意Servlet一般不进行这方面的处理,而是让Web服务器的专门机制来控制受密码保护页面的访问(例如.htaccess)。

    3. 内容类型

    Content-Type(内容类型),一般是指网页中存在的 Content-Type,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式、什么编码读取这个文件,这就是经常看到一些 PHP 网页点击的结果却是下载一个文件或一张图片的原因。

    Content-Type 标头告诉客户端实际返回的内容的内容类型。

    3.1 语法格式

    Content-Type: text/html; charset=utf-8 Content-Type: multipart/form-data; boundary=something

    3.2 相关格式说明

    4. 使用google调试页面

    红色代表已经激活记录了。 这个时候访问网址,如www.baidu.com,按下enter即可显示

    5 其他相关问题

    5.1 http1.0、1.1,2.0的区别

    关于HTTP/2和HTTP1的比较

    5.2 https和http的区别

    加s的是加密的,http是没加密的。 一图解决

    Processed: 0.010, SQL: 8