Skip to content

Commit 3317b90

Browse files
committed
post: docker posts
1 parent 224b3ad commit 3317b90

File tree

27 files changed

+1639
-127
lines changed

27 files changed

+1639
-127
lines changed
Lines changed: 92 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,92 @@
1+
+++
2+
date = '2025-09-03T8:00:00+08:00'
3+
draft = false
4+
title = 'Docker - History'
5+
tags = ['Docker']
6+
+++
7+
8+
## The Docker Story - Part1: Docker History
9+
docCloud - 也就是开发 Docker 的公司, 最初是一家 PaaS(平台即服务)公司, 他们在 PaaS 领域并没有太大的成功, 但他们构建了一个可以无缝管理客户系统与架构的工具: Docker. 2013 年, 他们决定放弃 PaaS 服务, 将全部精力投入到 Docker 这款产品上.
10+
11+
### Containers 容器
12+
Docker 公司并没有发明容器这个概念. 实际上, 容器的概念已经演进了十多年, 很多参与者都做出了贡献, Linux 基金会和 Google 是推动整个生态走向成熟的重要力量.
13+
假如你在运营一家公司, 希望将应用上线, 以前需要做的事大概是:
14+
- 购买一台服务器
15+
- 安装所有必要的应用和依赖
16+
- 配置环境以匹配你的开发设置
17+
- 部署应用
18+
- 把服务器对外开放
19+
20+
看起来很简单, 但实际操作会很复杂:
21+
- 要手动跟踪并更新每个依赖和配置
22+
- 如果出问题, 需要手动去修复
23+
- 基础设施团队需要估算服务器规格(内存、CPU 等) — 为了防止流量高峰崩溃, 通常会配置更高的规格(过度配置)
24+
- 那台高配服务器大多数时间只是闲置着, 做最少量的工作
25+
- 不能轻易扩展或在同一服务器上运行多个应用, 因为每个应用都需要独立的运行环境
26+
27+
总之, 非常混乱
28+
29+
后来出现了虚拟机(VM), 情况有了改善. 使用 VM 可以:
30+
- 在同一台服务器上运行多个隔离的环境
31+
- 为 VM 做快照并在不同服务器间复用
32+
- 不再重复重复地搭建环境,这是一个很大的进步
33+
34+
但 VM 也有缺点:
35+
- 重量级: 每个 VM 需要完整的操作系统,占用大量内存、CPU 和存储
36+
- 性能开销大: 运行多个操作系统实例会带来额外开销, 性能相对较差
37+
- 启动慢: 每个 VM 都需要启动自己的操作系统
38+
- 占用空间多: 完整的操作系统镜像占用大量磁盘空间
39+
40+
于是容器出现了 — 它带来了颠覆性的改变
41+
42+
容器是应用的轻量级、可移植打包. 它包含:
43+
- 你的应用
44+
- 应用的所有依赖(库、二进制文件等)
45+
- 配置文件
46+
- 环境变量
47+
- 运行所需的其他数据
48+
49+
容器非常灵活. 你可以有一个带最精简 Ubuntu 的容器, 另一个容器装 Node.js 应用, 或任何你需要的组合.
50+
容器被设计得尽可能精简, 剔除了诸如 GUI、驱动等不必要项, 从而保持轻量.
51+
真正的关键是: 容器共享宿主机的操作系统内核(host OS kernel).
52+
不同于 VM, 容器不需要自己的完整操作系统, 这节省了大量资源.
53+
举例来说, 如果一台服务器能跑 10 个 VM, 那么同样的机器可能能跑 50 个容器, 这是性能与效率的巨大跃升
54+
55+
### The Open Container Initiative (OCI) 开放容器倡议
56+
OCI 由 Google、Linux 基金会和 Docker, Inc. 的人员发起, 定义了一些关键标准, 包括:
57+
- 镜像规范(Image Specification / Image-Spec): 定义容器镜像如何创建
58+
- 运行时规范(Runtime Specification / Runtime-Spec): 标准化容器如何被执行和管理生命周期
59+
- 分发规范(Distribution Specification / Distribution-Spec): 定义容器镜像如何共享与分发
60+
61+
这些规范保证了任何系统能以一致的方式创建、运行和管理容器
62+
63+
### The Cloud Native Computing Foundation (CNCF) 云原生计算基金会
64+
[CNCF](https://landscape.cncf.io/) 成立于 2015 年, 使命是推动容器技术并让云原生计算成为现实.
65+
它不像 OCI 那样直接制定标准, 而是专注于帮助与容器相关的项目成长并达到可投入生产的成熟度.
66+
67+
CNCF 项目一般经历三个阶段:
68+
- Sandbox 沙箱: 实验性项目的试验场
69+
- Incubation 孵化: 对有前景的项目进行积极开发和完善
70+
- Graduation 毕业: 达到标准并可用于生产环境
71+
72+
当一个项目"毕业"时, 公司会知道它已经可靠到可以在自身基础设施上使用.
73+
一个典型例子是 Kubernetes, 它作为 CNCF 项目成长, 现已成为现代基础设施的基石.
74+
75+
### The Docker Inc, The Docker Platform
76+
正如前面提到的, dotCloud 放弃了 PaaS,把重心放到 Docker, 并更名为 Docker, Inc.
77+
他们把工具集称为 Docker Platform, Docker 平台主要由两大部分组成: 客户端(Client)和引擎(Engine).
78+
Docker 客户端(命令行界面 CLI)是与 Docker 引擎交互的方式.
79+
80+
#### Docker CLI
81+
Docker CLI 是一组命令和指令, 用来与 Docker 引擎交互. 它通过提供一个对复杂内部系统的友好抽象来简化操作, Docker CLI 通过 gRPC API 与 Docker 引擎通信.
82+
基本上, CLI 会把我们的命令(例如 docker ps、docker start、docker stop 等)翻译成 gRPC 请求并发送给 Docker 引擎, 然后再把执行结果以可读的形式显示在终端上.
83+
84+
#### Docker Engine
85+
Docker 引擎是实际执行工作的地方. 它是一个模块化的应用, 包含许多关键组件.
86+
把它想象成汽车发动机: 大多数人不知道引擎内部的具体细节, 但它能无缝工作.
87+
类似地, 作为用户我们通过 CLI 与 Docker 引擎交互, 指示它去执行各种动作, 而不必了解内部所有细节.
88+
然而, 要深入理解 Docker, 了解引擎内部发生了什么是很重要的.
89+
90+
Docker 引擎向客户端暴露了一个 API 层, 客户端使用该 API 把命令转成 gRPC 调用并与服务器交互.
91+
Docker 引擎封装了创建、运行与管理容器所需的全部复杂性.
92+
值得一提的是, Docker 引擎和 Docker CLI 都是用 Golang 语言编写的.
Lines changed: 132 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,132 @@
1+
+++
2+
date = '2025-09-04T8:00:00+08:00'
3+
draft = false
4+
title = 'Docker - Engine'
5+
tags = ['Docker']
6+
+++
7+
8+
Docker 引擎(Docker Engine), 顾名思义,是 Docker 的核心.
9+
它为 Docker 提供动力, 并承担所有繁重的工作.
10+
本文将深入探讨这一关键组件的内部运作, 以便了解 Docker 在内核下是如何工作的.
11+
12+
### The Evolution of the Docker Engine | Docker 引擎的演进
13+
Docker 最初是一个巨大的单体(monolith), 所有代码都塞在同一个项目里.
14+
对于 dotCloud来说, 这种方式一开始是可行的.
15+
实际上, 这个方向运作得非常好, 以至于他们放弃了其他服务、把所有赌注都押在 Docker 上, 甚至把公司重命名为 Docker, Inc.
16+
17+
一开始, Docker 是一个又大又混乱的单体应用.
18+
随着时间推移, Docker, Inc. 发现这种做法不可持续, 他们需要把系统拆分出来:
19+
- 各个部分可以独立成长
20+
- 更容易升级某些部分 - 可以替换旧组件而不影响整体
21+
- 让社区更容易参与贡献 - 更小的组件意味着更多人能参与进来
22+
- 更易跨平台 - 他们想要 Docker 在每个平台上运行, 而不只是 Linux
23+
24+
拆分的第一步是把客户端 client 剥离出来.
25+
把客户端从大应用中抽出, 赋予它新职责: 把用户命令翻译成 Docker 引擎能理解的指令(也就是原来单体里"内核部分"的接口)
26+
27+
此时, Docker 引擎主要有两部分:
28+
- Daemon 守护进程: 处理容器、网络和卷
29+
- LXC: Docker 与 Linux 内核之间的中间层
30+
31+
### Breaking Things for the Better 为了更好的架构而拆分
32+
然而, 这个架构存在问题:
33+
- LXC 仅限于 Linux, 若要支持 Windows 或 macOS 这就难办了
34+
- 守护进程负担过重, 它做的事情太多, 需要"放轻松"
35+
36+
因此, Docker 放弃了 LXC, 缓存更灵活, 冯举平台适应性的 libcontainer.
37+
同时, 他们也减轻了守护进程的职责, 把守护进程做成更简单的 API 接口, 供客户端与之通信.
38+
39+
但这还不是终点. libcontainer 本身仍然太大、太笨重.
40+
于是 Docker 把它进一步拆成更小的部分: `docker-init``runc``containerd``shim`, 每个组件只做一件事, 这带来了:
41+
- 更好的分工协作: 社区可以专注于特定组件
42+
- 自由试验: 开发者可以像搭积木一样替换或组合部件
43+
- 更清晰的设计: 不再是纠结在一起的杂乱代码
44+
45+
![docker-archtecture](https://miro.medium.com/v2/resize:fit:1400/format:webp/1*v7p8ocAyGKabL-_AdI5rvA.png)
46+
47+
### Specs and Standards 规范与标准
48+
Docker 引擎严格遵循开放容器倡议 OCI 的协议和标准, 意味着你用 Docker 引擎构建的镜像, 只要目标平台也遵循 OCI 标准, 就能在别的容器平台上运行.
49+
Docker 引擎帮助你 build 构建、ship 分发和 run 运行符合 OCI 的镜像, 这三个阶段由三大标准引导:
50+
- Image Specification 镜像规范: 该规范定义了容器镜像如何被创建, 相当于容器内部包含内容(依赖、配置等)的详细蓝图
51+
- Distribution Specification 分发规范: 该规范规定了容器镜像如何共享与传输, 相当于定义了一套"运输网络"的规则, 确保镜像能从 A 点到 B 点顺利传输
52+
- Runtime Specification 运行时规范: 该规范描述容器如何被执行和管理, 从启动/停止到与宿主系统交互, 即运行时的行为规则
53+
54+
历史部分就到这, 下面进入重点: 逐块剖析 Docker 的当前架构, 看看它们如何协同
55+
56+
### How a Command is Processed in the Docker System? 一个命令是如何被处理的?
57+
现在来拆解一下, 当运行如下命令时发生是事情:
58+
```bash
59+
docker start my-container
60+
```
61+
这实际上是在和 Docker CLI (client) 打交道, CLI 就像是翻译器, 将输入的命令转换成 Docker daemon 守护进程能懂的东西.
62+
流程大致如下:
63+
- Command Translation 命令翻译: Docker CLI 将命令转换为一个 API 调用, 例如 REST 或 gRPC, CLI 会将输入命令翻译成这两种格式之一
64+
- Sending the Request 发送请求: 翻译完成后 CLI 将请求发送给 Docker daemon, 即守护进程, 是操作中心, 它接受请求、处理请求, 并在幕后完成实际工作
65+
66+
因此, 当输入 `docker start my-container` 的时候, CLI 会告诉守护进程, 守护进程收到后就开始工作, 协调一切将容器启动起来
67+
68+
#### The Daemon 守护进程
69+
守护进程就像 Docker 的前台接待员, 它为客户端 (例如 Docker CLI) 提供一个接口, 通过高级抽象与 Docker 引擎交互.
70+
当守护进程接到请求时, 他会验证并处理该命令, 然后将请求翻译为更低一级的指令, 交给另一个模块 `containerd`
71+
72+
#### containerd
73+
顺带一提: `c` 小写是风格选择; `d` 表示 daemon
74+
Docker 引擎的模块化设计意味着它被拆分为更小的组件, 模块化的好处是灵活与可扩展: 可以替换、更新或者扩展单个部件, 而不是修改整个系统
75+
76+
`containerd` 是一个高层运行时(high-level runtime), 复杂从容器声明周期的整体角度进行管理, 就像项目经理:
77+
- 创建、启动、停止并删除容器
78+
- 管理网络与卷 (volumes)
79+
- 拉取镜像 (pull images)
80+
- 处理容器级别的其他需求
81+
82+
当守护进程将命令发送给 containerd 时, containerd 会准备容器, 但不直接执行容器的实际进程, 它依赖一个更低层次的专用运行时 `runc` 来完成具体工作.
83+
84+
85+
#### runc
86+
`r` 小写是 Unix 风格, `c` 指 container 容器
87+
`runc` 的职责非常单一: 运行 OCI 容器, 这里的 OCI 指的是行业标准的容器和镜像协议, 为了兼容与互操作而存在.
88+
- 创建容器环境
89+
- 启动容器进程
90+
- 确保容器在宿主环境的边界内运行
91+
92+
虽然 runc 很重要, 但 containerd 与它的交互方式引入了额外的一些灵活性, containerd 并不直接与 runc 强耦合: 它通过一个抽象, shim 来与 runc 交互.
93+
94+
#### Shims 桥接进程
95+
在 containerd 的上下文中, shim 是一个轻量级的进程, 位于 containerd 和实际的容器运行时之间. 它的主要作用是将 containerd 与运行时解耦, 保证灵活性与独立性, 这允许 containerd 管理容器, 而无需紧密耦合到特定运行时.
96+
97+
当 containerd 启动一个容器时, 他会启动一个 shim 进程, shim 则调用运行时来设置容器. runc 完成诸如设置命名空间和 cgroups, 挂载文件系统, 启动容器化等"重活". 但一旦容器启动, runc 就会退出, 留下 shim 来管理容器的声明周期交互. shim 功能如下:
98+
- 流程管理: 保持容器进程存活并处理信号
99+
- I/O 流: 保持日志并转发容器与 containerd 之间的输入/输出
100+
- 声明周期事件: 监控并上报诸如容器终止等事件
101+
102+
如果所有底层运行时都遵循 OCI 运行时规范, 为什么 containerd 还需要 shim? 单胺是模块化和关注点分离:
103+
- 解耦: shim 抽象出容器特定的操作, 使 containerd 能专注于管理多个容器以及他们的网络与卷, 而不必处理每个容器的细节
104+
- 灵活性: 有了 shim 就可以比较容易替换掉 runc, 改用同样遵守 OCI 的其他运行时, 架构因此能使用新技术
105+
- 简化: 每个 shim 只处理一个容器, 这种分离确保单个应用容器的问题不会波及到其他容器
106+
107+
#### From Shim to Docker-init
108+
当 shim 接手后, 它继续管理容器的生命周期. 不过, Docker 引擎还需要与容器内的进程交互, 比如确保日志、信号和资源得到适当处理. 这就是 docker-init 的作用, 它在容器内部充当 PID 1 的角色, 管理并清理容器化应用的资源.
109+
110+
#### Docker-init: The Unsung Hero of Containers / 容器中的无明英雄
111+
在每个容器内部, PID 1 是最关键的首个进程. 容器只要 PID 1 运行, 就存活. 所以, PID 1 的容器生命周期的基石.
112+
当 containerd 需要停止或终止容器时, 他会依赖 PID 1 来确保容器内的所有子进程被正确清理.
113+
如果 PID 1 退出, 所有关联的子进程会自动被终止.
114+
115+
docker-init 的关键作用之一是清理僵尸进程 zombie processes, 那些执行完没有被父进程回收的"被遗忘"的子进程.
116+
这类进程若放任不管, 会逐渐占用系统资源. docker-init 会及时回收它们, 保持容器环境整洁与高效.
117+
118+
另一项重要任务是处理系统信号(例如 SIGTERM 或 SIGINT), 许多容器化应用本身并不善于处理这些信号, 可能导致不完整或粗暴的关闭.
119+
docker-init 会捕捉这些信号, 并适当地转发, 保证容器内的应用能优雅地退出.
120+
121+
作为 PID 1, docker-init 也为容器化应用提供了一个可预期且稳定的运行基础. 它的存在简化了容器生命周期的管理, 使容器更加稳定可靠.
122+
123+
总之, docker-init 确保容器保持干净, 响应迅速并得到良好管理. 它不一定显眼, 但正是这些细小的贡献让容器变得可靠且高效.
124+
125+
#### Conclusion 结论
126+
Docker 引擎不仅仅是一款软件, 它是一套精心设计的模块化组件系统, 这些组件协同工作以实现容器的高效、可扩展与可移植.
127+
从 CLI 中敲下命令, 到 runc、shim、docker-init 所处理的底层操作, 每个元素都扮演者明确且重要的角色.
128+
129+
通过遵守严格的 OCI 标准, Docker 确保其生态系统不仅强大, 且具备通用兼容性. 这种遵循标准的做法建立了信任, 为开发者与企业提供了稳定的基础, 模块化架构简化了容器管理, 并鼓励创新, 允许每个组件独立演进与改善.
130+
131+
理解 Docker 引擎不仅是知道容器如何工作, 更是认识其背后经过深思熟虑的工程设计. 正是这种工程让现代软件开发更快、更高效、更容易上手.
132+
Docker 不只是一个工具, 它是一个赋能平台, 开启无限可能.

0 commit comments

Comments
 (0)