到底什么是 TCP 连接:从三次握手到四次挥手,从数据结构到状态机

张开发
2026/4/5 23:56:30 15 分钟阅读

分享文章

到底什么是 TCP 连接:从三次握手到四次挥手,从数据结构到状态机
到底什么是 TCP 连接从三次握手到四次挥手从数据结构到状态机01. 前言每天都在用却说不清它是什么02. 一句话定义03. TCP 连接不是物理的而是逻辑的04. TCP 连接的核心标识四元组05. TCP 连接在内核中的数据结构06. TCP 连接的生命周期状态机6.1 状态迁移图文字版6.2 各状态含义速查表07. 三次握手连接的建立08. 四次挥手连接的关闭09. Socket 编程视角连接就是文件描述符10. 连接的“可靠性”是如何实现的11. 常见面试问题与深入理解Q1一个服务器最多能支持多少个 TCP 连接Q2TIME_WAIT 状态是干什么的为什么要等 2MSLQ3连接断开后端口多久可以复用Q4如何查看系统当前的 TCP 连接12. 类比打电话更容易理解13. 总结The Begin点点关注收藏不迷路01. 前言每天都在用却说不清它是什么当你打开浏览器访问网页、用微信发消息、通过 SSH 登录服务器底层都在使用TCP 连接。我们天天说“建立 TCP 连接”“关闭 TCP 连接”但到底什么是 TCP 连接它是一个物理线路是一段内存是一个 IP 端口对还是一个状态机答案是TCP 连接是通信双方操作系统内核中维护的一段数据结构 一个状态机。它不是物理实体而是一个逻辑上的、双向的、可靠的字节流通道。本文从定义、数据结构、状态机、三次握手、四次挥手、Socket 编程等角度彻底讲清“什么是 TCP 连接”。02. 一句话定义TCP 连接是指两台主机之间通过 TCP 协议建立的一个虚拟的、全双工的、可靠的字节流通道。它在双方内核中由一组数据结构Socket、连接表项、发送/接收缓冲区表示并由一个有限状态机管理生命周期。核心特征面向连接通信前必须先建立连接全双工双方可以同时发送和接收数据可靠确认重传、排序、流量控制、拥塞控制字节流没有消息边界像水管里的水流03. TCP 连接不是物理的而是逻辑的物理视角 客户端 ──────────── 网线 ──────────── 路由器 ──────────── 服务器 没有一条“专线”留给 TCP 连接所有数据包都在共享网络上传输 逻辑视角TCP 连接抽象 客户端 ═══════════════════════════════════════════════════ 服务器 一个虚拟的、可靠的、有序的字节流通道TCP 连接并不独占任何物理链路而是通过 IP 地址 端口号 序列号 状态机在无连接的 IP 网络上模拟出一个“可靠的连接”。04. TCP 连接的核心标识四元组一个 TCP 连接由四个值唯一确定┌─────────────────────────────────────────────────────────┐ │ 源IP地址 192.168.1.100 │ │ 源端口 54321 │ │ 目标IP地址 93.184.216.34 │ │ 目标端口 80 │ └─────────────────────────────────────────────────────────┘ 合称四元组 (src_ip, src_port, dst_ip, dst_port)这意味着同一个客户端 IP 同一端口可以连接同一个服务器的不同端口 → 不同连接同一个客户端 IP 不同端口连接同一个服务器的同一个端口 → 不同连接不同客户端 IP即使端口相同也是不同连接示例 连接A: (192.168.1.100, 12345, 93.184.216.34, 80) 连接B: (192.168.1.100, 12346, 93.184.216.34, 80) ← 不同源端口不同连接 连接C: (192.168.1.101, 12345, 93.184.216.34, 80) ← 不同源IP不同连接05. TCP 连接在内核中的数据结构当建立一个 TCP 连接后操作系统内核会为它分配以下数据结构┌─────────────────────────────────────────────────────────────────┐ │ TCP 控制块TCB │ ├─────────────────────────────────────────────────────────────────┤ │ 四元组 : (src_ip, src_port, dst_ip, dst_port) │ │ 状态 : ESTABLISHED / CLOSE_WAIT / ... │ │ 发送序列号 : 下一个要发送的字节序号 │ │ 接收序列号 : 期望收到的下一个字节序号 │ │ 发送窗口 : 还能发多少字节流量控制 │ │ 接收窗口 : 还能收多少字节 │ │ 发送缓冲区 : 待确认的数据 │ │ 接收缓冲区 : 已收到但未读给应用的数据 │ │ 重传定时器 : 超时未确认则重传 │ │ 保活定时器 : Keep-Alive 探测 │ └─────────────────────────────────────────────────────────────────┘简单理解连接就是一个“档案”记录了双方通信的当前进度发送/接收缓冲区是内核为这个连接分配的内存区域应用程序通过 Socket 句柄访问这个连接06. TCP 连接的生命周期状态机TCP 连接的核心是一个有限状态机共有 11 种状态。6.1 状态迁移图文字版客户端 服务器 │ │ CLOSED ──────────────┼────────────────────────────────────┤ CLOSED │ │ │ │ 主动打开 │ │ 被动打开 ▼ │ ▼ SYN_SENT ────────────┼─────────────────────────────────► LISTEN │ │ │ │ │ 收到 SYN发 SYNACK │ │ │◄───────────────────────────────────┤ │ │ │ ▼ ▼ ▼ ESTABLISHED ◄─────────────────────────────────────── SYN_RCVD │ │ │ │ │ 三次握手完成 │ │ │ │ 数据传输阶段 │ │ │ │ │ │ 主动关闭 │ │ 被动关闭 ▼ │ ▼ FIN_WAIT_1 ──────────┼─────────────────────────────────► CLOSE_WAIT │ │ │ ▼ │ ▼ FIN_WAIT_2 │ LAST_ACK │ │ │ │ │◄───────────────────────────────────┤ ▼ ▼ ▼ TIME_WAIT ────────────────────────────────────────────► CLOSED 等待 2MSL │ │ │ ▼ │ CLOSED ──────────────┘6.2 各状态含义速查表状态含义CLOSED没有连接初始状态LISTEN服务器等待客户端连接SYN_SENT客户端已发 SYN等待 SYNACKSYN_RCVD服务器收到 SYN已发 SYNACK等待 ACKESTABLISHED连接已建立可以传输数据FIN_WAIT_1主动关闭方发了 FIN等待 ACKFIN_WAIT_2主动关闭方收到对 FIN 的 ACK等待对方 FINCLOSE_WAIT被动关闭方收到 FIN等待应用调用 closeLAST_ACK被动关闭方发了 FIN等待最后的 ACKTIME_WAIT主动关闭方收到 FINACK等待 2MSL 确保对方收到 ACKCLOSING双方同时关闭罕见07. 三次握手连接的建立三次握手的目的确认双方的收发能力正常并同步初始序列号ISN。客户端主动打开 服务器被动打开LISTEN │ │ │────── 1. SYN (seqx) ──────────────→│ (客户端我要连接我的序列号是x) │ │ │←──── 2. SYNACK (seqy, ackx1) ────│ (服务器收到我也要连接我的序列号是y) │ │ │────── 3. ACK (acky1) ────────────→│ (客户端收到你的确认连接建立) │ │ ▼ ▼ ESTABLISHED ESTABLISHED为什么是三次不是两次两次无法区分“旧连接的历史延迟包”和“新连接的有效包”第三次 ACK 是为了让服务器确认客户端的接收能力正常同时双方同步了初始序列号08. 四次挥手连接的关闭TCP 连接是全双工的每一端都需要单独关闭自己的发送通道。主动关闭方客户端 被动关闭方服务器 │ │ │────── 1. FIN (sequ) ──────────────→│ (客户端我发完了不再发数据) │ │ │←──── 2. ACK (acku1) ──────────────│ (服务器收到你的 FIN) │ │ (此时客户端→服务器方向关闭) │ │ (服务器还可以继续发数据) │ │ │ (可能还有数据要发) │ │ │ │←──── 3. FIN (seqv) ────────────────│ (服务器我也发完了) │ │ │────── 4. ACK (ackv1) ────────────→│ (客户端收到关闭) │ │ ▼ ▼ TIME_WAIT CLOSED (等待 2MSL) │ ▼ CLOSED为什么是四次不能合并成三次因为当主动方发 FIN 时被动方可能还有数据要发ACK 和 FIN 必须分开先 ACK 确认收到 FIN等数据发完再发 FIN09. Socket 编程视角连接就是文件描述符在编程层面TCP 连接被抽象为一个Socket 文件描述符fd。// 伪代码流程以 Linux C 为例 // 服务器端 fd socket(AF_INET, SOCK_STREAM, 0); // 创建 socket bind(fd, ...); // 绑定端口 listen(fd, 128); // 进入 LISTEN 状态 conn_fd accept(fd, ...); // 接受连接返回新 fd read(conn_fd, buffer, size); // 从连接读数据 write(conn_fd, data, len); // 向连接写数据 close(conn_fd); // 关闭连接 // 客户端 fd socket(AF_INET, SOCK_STREAM, 0); connect(fd, server_addr, ...); // 发起三次握手 write(fd, request, len); read(fd, response, size); close(fd);关键点accept()成功后内核为该连接创建新的 socket fd对 fd 的read()/write()就是对连接的收发操作关闭 fd 会触发 FIN 包的发送四次挥手10. 连接的“可靠性”是如何实现的TCP 连接被称为“可靠”连接靠的是以下机制机制作用确认应答每个收到的数据包都要回复 ACK超时重传发送后一段时间没收到 ACK就重传序列号给每个字节编号用于排序和去重累积确认ACK n 表示 n 之前的所有字节都已收到流量控制通过窗口字段告知对方“还能发多少”防止接收方被淹没拥塞控制慢启动、拥塞避免、快重传、快恢复防止网络崩溃11. 常见面试问题与深入理解Q1一个服务器最多能支持多少个 TCP 连接理论上限由文件描述符限制 内存决定但有个关键点客户端连接数上限受限于(本地IP数 × 本地端口数)约 4 万个因为端口只有 16 位服务端连接数上限受限于内存每个连接占用 TCB约几 KB和 fd 限制理论上可达数百万服务端用同一个端口如 80可以接受无数个连接因为四元组中的客户端 IP端口区分了它们。Q2TIME_WAIT 状态是干什么的为什么要等 2MSL确保最后一个 ACK 能到达对方如果丢失对方重发 FINTIME_WAIT 可以重发 ACK防止“延迟的旧数据包”误入新连接2MSL 后所有包都会在网络中消失Q3连接断开后端口多久可以复用TIME_WAIT 默认 60 秒Linux 的 2MSL 通常是 60 秒。可以调整net.ipv4.tcp_tw_reuse允许复用。Q4如何查看系统当前的 TCP 连接# Linux 查看所有 TCP 连接netstat-antpss-antp# 示例输出Proto Recv-Q Send-Q Local Address Foreign Address State tcp000.0.0.0:800.0.0.0:* LISTEN tcp00127.0.0.1:5432193.184.216.34:80 ESTABLISHED12. 类比打电话更容易理解┌─────────────────────────────────────────────────────────────────┐ │ TCP 连接 vs 打电话 │ ├─────────────────────────────────────────────────────────────────┤ │ 拨号 → TCP 三次握手 │ │ 对方接听 → 连接建立ESTABLISHED │ │ 说话你来我往→ 数据传输全双工 │ │ 一方说“我说完了”→ FIN主动关闭发送通道 │ │ 另一方说“知道了”→ ACK │ │ 另一方也说完了 → 另一个 FIN │ │ 挂断 → 连接关闭 │ └─────────────────────────────────────────────────────────────────┘不同的是打电话独占一条物理线路而 TCP 连接是逻辑共享的。13. 总结┌─────────────────────────────────────────────────────────────────┐ │ 什么是 TCP 连接 │ ├─────────────────────────────────────────────────────────────────┤ │ 1. 它是逻辑的不是物理的——没有专属电线 │ │ 2. 它由四元组唯一标识(src_ip, src_port, dst_ip, dst_port) │ │ 3. 它是内核中的数据结构TCB 状态机 │ │ 4. 它是可靠的、全双工的、面向字节流的通道 │ │ 5. 生命周期CLOSED → 三次握手 → ESTABLISHED → 四次挥手 → CLOSED│ │ 6. 编程视角它就是你能 read/write 的 Socket 文件描述符 │ └─────────────────────────────────────────────────────────────────┘一句话记住TCP 连接是操作系统内核中由四元组标识的、一个带有状态机、缓冲区、序列号的数据结构它向应用程序提供了一个可靠的、双向的字节流传输服务。The End点点关注收藏不迷路

更多文章