百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

HTTP/HTTPS协议基础

zhezhongyun 2025-04-24 10:35 11 浏览

以下是对 HTTP/HTTPS协议 的全面基础讲解,包含请求/响应结构、状态码、Header/Cookie的核心概念,并附带代码示例和实际应用场景分析。


1. HTTP/HTTPS协议基础

HTTP (HyperText Transfer Protocol)

  • 无状态协议:每次请求独立,不保留之前交互的信息(依赖Cookie/Session维持状态)。
  • 明文传输:数据未加密,易被窃听(HTTPS解决了此问题)。
  • 默认端口:80。
  • HTTPS (HTTP Secure)
  • 加密传输:基于TLS/SSL协议,对HTTP内容加密。
  • 身份验证:通过证书验证服务器身份。
  • 默认端口:443。
  • 核心流程
    1. 客户端与服务端通过TLS握手交换密钥。
    2. 使用对称加密传输数据。

2. HTTP请求与响应结构

HTTP请求(Request)

GET /index.html HTTP/1.1          # 请求行(方法 + 路径 + 协议版本)
Host: www.example.com             # 必需Header(指定目标域名)
User-Agent: Mozilla/5.0           # 客户端标识
Accept: text/html                 # 可接受的内容类型
Cookie: session_id=abc123         # 客户端携带的Cookie
(空行)                            # 分隔Header和Body
(请求体,GET方法通常无Body)

HTTP响应(Response)

HTTP/1.1 200 OK                   # 状态行(协议版本 + 状态码 + 状态描述)
Content-Type: text/html           # 响应内容类型
Set-Cookie: session_id=abc123     # 服务端设置Cookie
Content-Length: 1024              # 响应体长度
(空行)                            # 分隔Header和Body
<!DOCTYPE html>                   # 响应体(HTML内容)
<html>...</html>

3. 常见HTTP方法

方法

作用

安全性与幂等性

GET

获取资源

安全、幂等

POST

提交数据(如表单)

不安全、不幂等

PUT

更新资源

不安全、幂等

DELETE

删除资源

不安全、幂等

HEAD

获取Header元数据

安全、幂等


4. HTTP状态码详解

状态码

类别

常见状态码

渗透测试中的意义

1xx

信息响应

100 Continue

少见,通常用于大文件上传

2xx

成功

200 OK, 201 Created

请求成功

3xx

重定向

301 永久重定向, 302 临时重定向

检查重定向目标是否可控(钓鱼攻击)

4xx

客户端错误

400 Bad Request, 401 Unauthorized, 403 Forbidden, 404 Not Found

探测权限漏洞(如403绕过)

5xx

服务器错误

500 Internal Server Error

暴露服务端漏洞(如SQL注入错误回显)


5. 核心HTTP Header

请求头(Request Headers)

Header

作用

安全相关场景

Cookie

携带会话凭证

会话劫持、Cookie篡改

Referer

请求来源页面

检查CSRF防护(Referer验证)

User-Agent

客户端浏览器/设备信息

伪造UA绕过WAF检测

Authorization

认证信息(如Basic Token)

弱密码爆破、Token泄露

响应头(Response Headers)

Header

作用

安全相关场景

Set-Cookie

设置客户端Cookie

检查Secure/HttpOnly属性缺失

Content-Type

响应内容类型(如text/html)

检测MIME类型混淆漏洞

Location

重定向目标URL

开放重定向漏洞(钓鱼攻击)

CORS相关头

跨域资源共享控制

配置错误导致跨域数据泄露


6. Cookie机制与安全

Cookie属性

Set-Cookie: session_id=abc123; Path=/; Secure; HttpOnly; SameSite=Lax

属性

作用

安全意义

Secure

仅通过HTTPS传输

防止明文传输被窃听

HttpOnly

禁止JavaScript访问Cookie

防御XSS窃取Cookie

SameSite

限制跨站请求携带Cookie(Strict/Lax/None)

防御CSRF攻击

Expires

设置Cookie过期时间

会话固定攻击检查

Cookie在渗透测试中的应用

  • 会话劫持:通过XSS窃取Cookie后伪造用户身份。
  • Cookie篡改:修改Cookie参数尝试越权访问(如user_role=admin)。
  • 会话固定攻击:强制用户使用已知的Session ID。

7. 实战代码示例

Python模拟HTTP请求(包含Header/Cookie操作)

import requests

# 自定义Header和Cookie
headers = {
    "User-Agent": "Mozilla/5.0 (渗透测试专用)",
    "Referer": "http://evil.com"
}
cookies = {"session_id": "hacked_123"}

# 发送GET请求并获取响应头
response = requests.get(
    "http://example.com/admin",
    headers=headers,
    cookies=cookies
)

# 输出关键信息
print("状态码:", response.status_code)
print("响应头:", response.headers)
print("Set-Cookie:", response.headers.get("Set-Cookie"))

分析HTTPS请求(使用Wireshark抓包)

  1. 过滤TLS握手包:tls.handshake.type == 1(Client Hello)
  2. 观察加密后的应用数据包(内容不可读,但可分析元数据)。

8. 渗透测试中的应用场景

  1. 信息泄露
    • 检查HTTP响应头是否暴露敏感信息(如Server: Apache/2.4.6)。
  1. 会话管理漏洞
    • 验证Cookie是否缺少HttpOnly或Secure属性。
  1. 开放重定向
    • 修改Location头参数,测试是否可跳转到恶意网站。
  1. CORS配置错误
    • 检查Access-Control-Allow-Origin: *是否允许任意域访问。

9. 学习建议

  1. 动手实践
    • 使用浏览器开发者工具(F12)查看每个请求的Header和Cookie。
    • 在Kali Linux中用curl -v http://example.com观察原始HTTP交互。
─(kalikali)-[~]
└─$ curl -v http://example.com
* Host example.com:80 was resolved.
* IPv6: 2600:1406:3a00:21::173e:2e65, 2600:1406:bc00:53::b81e:94c8, 2600:1408:ec00:36::1736:7f31, 2600:1406:bc00:53::b81e:94ce, 2600:1406:3a00:21::173e:2e66, 2600:1408:ec00:36::1736:7f24
* IPv4: 23.215.0.136, 23.192.228.84, 96.7.128.198, 23.192.228.80, 23.215.0.138, 96.7.128.175
*   Trying 23.215.0.136:80...
*   Trying [2600:1406:3a00:21::173e:2e65]:80...
* Immediate connect fail for 2600:1406:3a00:21::173e:2e65: 网络不可达
*   Trying [2600:1406:bc00:53::b81e:94c8]:80...
* Immediate connect fail for 2600:1406:bc00:53::b81e:94c8: 网络不可达
*   Trying [2600:1408:ec00:36::1736:7f31]:80...
* Immediate connect fail for 2600:1408:ec00:36::1736:7f31: 网络不可达
*   Trying [2600:1406:bc00:53::b81e:94ce]:80...
* Immediate connect fail for 2600:1406:bc00:53::b81e:94ce: 网络不可达
*   Trying [2600:1406:3a00:21::173e:2e66]:80...
* Immediate connect fail for 2600:1406:3a00:21::173e:2e66: 网络不可达
*   Trying [2600:1408:ec00:36::1736:7f24]:80...
* Immediate connect fail for 2600:1408:ec00:36::1736:7f24: 网络不可达
* Connected to example.com (23.215.0.136) port 80
> GET / HTTP/1.1
> Host: example.com
> User-Agent: curl/8.5.0
> Accept: */*
> 
< HTTP/1.1 200 OK
< Content-Type: text/html
< ETag: "84238dfc8092e5d9c0dac8ef93371a07:1736799080.121134"
< Last-Modified: Mon, 13 Jan 2025 20:11:20 GMT
< Cache-Control: max-age=1544
< Date: Sat, 12 Apr 2025 08:00:51 GMT
< Content-Length: 1256
< Connection: keep-alive
< 
<!doctype html>
<html>
<head>
    <title>Example Domain</title>

    <meta charset="utf-8" />
    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <style type="text/css">
    body {
        background-color: #f0f0f2;
        margin: 0;
        padding: 0;
        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
        
    }
    div {
        width: 600px;
        margin: 5em auto;
        padding: 2em;
        background-color: #fdfdff;
        border-radius: 0.5em;
        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
    }
    a:link, a:visited {
        color: #38488f;
        text-decoration: none;
    }
    @media (max-width: 700px) {
        div {
            margin: 0 auto;
            width: auto;
        }
    }
    </style>    
</head>

<body>
<div>
    <h1>Example Domain</h1>
    <p>This domain is for use in illustrative examples in documents. You may use this
    domain in literature without prior coordination or asking for permission.</p>
    <p><a href="https://www.iana.org/domains/example">More information...</a></p>
</div>
</body>
</html>
* Connection #0 to host example.com left intact

以下是针对 curl -v http://example.com 输出的逐段讲解:

1. DNS 解析
* Host example.com:80 was resolved.
* IPv6: 2600:1406:3a00:21::173e:2e65, ...
* IPv4: 23.215.0.136, ...
● 域名解析:curl 首先将域名 example.com 解析为 IPv4 和 IPv6 地址。
● IPv6/IPv4 地址列表:服务器返回了多个 IP 地址,确保高可用性(部分地址为冗余备份)。

2. 尝试连接
* Trying 23.215.0.136:80...
* Trying [2600:1406:3a00:21::173e:2e65]:80...
* Immediate connect fail for ...: 网络不可达
● IPv4 优先:curl 默认尝试 IPv4 地址(如 23.215.0.136:80)。
● IPv6 失败:所有 IPv6 地址均提示 网络不可达,可能原因:
  ○ 本地网络未启用 IPv6。
  ○ 防火墙/路由器阻止了 IPv6 流量。
  ○ 目标服务器 IPv6 地址不可达。

3. 成功建立连接
* Connected to example.com (23.215.0.136) port 80
● 最终选择 IPv4:成功通过 IPv4 地址 23.215.0.136 的 80 端口建立 TCP 连接。

4. 发送 HTTP 请求
> GET / HTTP/1.1
> Host: example.com
> User-Agent: curl/8.5.0
> Accept: */*
● 请求行:GET / HTTP/1.1 表示请求根路径 /,使用 HTTP/1.1 协议。
● 请求头:
  ○ Host: 必需字段,指定目标域名。
  ○ User-Agent: 客户端标识(这里是 curl 版本)。
  ○ Accept: */*: 表示客户端接受任何响应类型。

5. 接收 HTTP 响应
< HTTP/1.1 200 OK
< Content-Type: text/html
< ETag: "84238dfc8092e5d9c0dac8ef93371a07:1736799080.121134"
< Last-Modified: Mon, 13 Jan 2025 20:11:20 GMT
< Cache-Control: max-age=1544
< Date: Sat, 12 Apr 2025 08:00:51 GMT
< Content-Length: 1256
< Connection: keep-alive
● 状态行:HTTP/1.1 200 OK 表示请求成功。
● 响应头:
  ○ Content-Type: text/html: 响应内容是 HTML 文本。
  ○ ETag: 资源标识符,用于缓存验证。
  ○ Last-Modified: 资源最后修改时间(注意:日期为未来的 2025 年,可能是服务器配置错误或测试数据)。
  ○ Cache-Control: max-age=1544: 响应可缓存 1544 秒(约 25 分钟)。
  ○ Connection: keep-alive: 保持 TCP 连接复用。

6. 响应体(HTML 内容)
<!doctype html>
<html>
<head>
    <title>Example Domain</title>
    <!-- 页面元数据和样式 -->
</head>
<body>
<div>
    <h1>Example Domain</h1>
    <p>This domain is for use in illustrative examples...</p>
    <p><a href="https://www.iana.org/domains/example">More information...</a></p>
</div>
</body>
</html>

● 示例页面:这是 IANA(互联网编号分配机构)提供的标准示例页面,用于文档演示。

7. 连接保持
* Connection #0 to host example.com left intact
● Keep-Alive:TCP 连接未关闭,可复用后续请求,减少握手开销。

关键问题总结
1. IPv6 连接失败:本地网络或中间设备可能不支持 IPv6。
2. 未来日期:响应头中的 Last-Modified 和 Date 为 2025 年,可能是服务器时间错误或刻意设置的测试数据。
3. 缓存策略:Cache-Control 和 ETag 帮助客户端高效缓存资源。
通过此过程,可以清晰看到从 DNS 解析到 HTTP 请求/响应的完整生命周期。
  1. 靶场练习
    • 在DVWA中修改Cookie尝试绕过登录(设置security=low)。
  1. 协议分析工具
    • Wireshark抓包分析HTTP/HTTPS流量(过滤条件:http或tls)。

掌握HTTP/HTTPS协议是Web安全的基础,后续学习漏洞利用时,需时刻关注协议层面的细节(如请求参数如何构造、Header如何影响服务端行为)。

相关推荐

JPA实体类注解,看这篇就全会了

基本注解@Entity标注于实体类声明语句之前,指出该Java类为实体类,将映射到指定的数据库表。name(可选):实体名称。缺省为实体类的非限定名称。该名称用于引用查询中的实体。不与@Tab...

Dify教程02 - Dify+Deepseek零代码赋能,普通人也能开发AI应用

开始今天的教程之前,先解决昨天遇到的一个问题,docker安装Dify的时候有个报错,进入Dify面板的时候会出现“InternalServerError”的提示,log日志报错:S3_USE_A...

用离散标记重塑人体姿态:VQ-VAE实现关键点组合关系编码

在人体姿态估计领域,传统方法通常将关键点作为基本处理单元,这些关键点在人体骨架结构上代表关节位置(如肘部、膝盖和头部)的空间坐标。现有模型对这些关键点的预测主要采用两种范式:直接通过坐标回归或间接通过...

B 客户端流RPC (clientstream Client Stream)

客户端编写一系列消息并将其发送到服务器,同样使用提供的流。一旦客户端写完消息,它就等待服务器读取消息并返回响应gRPC再次保证了单个RPC调用中的消息排序在客户端流RPC模式中,客户端会发送多个请...

我的模型我做主02——训练自己的大模型:简易入门指南

模型训练往往需要较高的配置,为了满足友友们的好奇心,这里我们不要内存,不要gpu,用最简单的方式,让大家感受一下什么是模型训练。基于你的硬件配置,我们可以设计一个完全在CPU上运行的简易模型训练方案。...

开源项目MessageNest打造个性化消息推送平台多种通知方式

今天介绍一个开源项目,MessageNest-可以打造个性化消息推送平台,整合邮件、钉钉、企业微信等多种通知方式。定制你的消息,让通知方式更灵活多样。开源地址:https://github.c...

使用投机规则API加快页面加载速度

当今的网络用户要求快速导航,从一个页面移动到另一个页面时应尽量减少延迟。投机规则应用程序接口(SpeculationRulesAPI)的出现改变了网络应用程序接口(WebAPI)领域的游戏规则。...

JSONP安全攻防技术

关于JSONPJSONP全称是JSONwithPadding,是基于JSON格式的为解决跨域请求资源而产生的解决方案。它的基本原理是利用HTML的元素标签,远程调用JSON文件来实现数据传递。如果...

大数据Doris(六):编译 Doris遇到的问题

编译Doris遇到的问题一、js_generator.cc:(.text+0xfc3c):undefinedreferenceto`well_known_types_js’查找Doris...

网页内嵌PDF获取的办法

最近女王大人为了通过某认证考试,交了2000RMB,官方居然没有给线下教材资料,直接给的是在线教材,教材是PDF的但是是内嵌在网页内,可惜却没有给具体的PDF地址,无法下载,看到女王大人一点点的截图保...

印度女孩被邻居家客人性骚扰,父亲上门警告,反被围殴致死

微信的规则进行了调整希望大家看完故事多点“在看”,喜欢的话也点个分享和赞这样事儿君的推送才能继续出现在你的订阅列表里才能继续跟大家分享每个开怀大笑或拍案惊奇的好故事啦~话说只要稍微关注新闻的人,应该...

下周重要财经数据日程一览 (1229-0103)

下周焦点全球制造业PMI美国消费者信心指数美国首申失业救济人数值得注意的是,下周一希腊还将举行第三轮总统选举需要谷歌日历同步及部分智能手机(安卓,iPhone)同步日历功能的朋友请点击此链接,数据公布...

PyTorch 深度学习实战(38):注意力机制全面解析

在上一篇文章中,我们探讨了分布式训练实战。本文将深入解析注意力机制的完整发展历程,从最初的Seq2Seq模型到革命性的Transformer架构。我们将使用PyTorch实现2个关键阶段的注意力机制变...

聊聊Spring AI的EmbeddingModel

序本文主要研究一下SpringAI的EmbeddingModelEmbeddingModelspring-ai-core/src/main/java/org/springframework/ai/e...

前端分享-少年了解过iframe么

iframe就像是HTML的「内嵌画布」,允许在页面中加载独立网页,如同在画布上叠加另一幅动态画卷。核心特性包括:独立上下文:每个iframe都拥有独立的DOM/CSS/JS环境(类似浏...