使用Dockerfile构建Docker镜像
Dockerfile 是一个文本文件,其内包含了一条条的指令(Instruction),每一条指令构建一层,因此每一条指令的内容,就是描述该层应当如何构建。
我的新书《LangChain编程从入门到实践》 已经开售!推荐正在学习AI应用开发的朋友购买阅读!
Dockerfile 是什么
- Docker 镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等),镜像不包含任何动态数据,其内容在构建之后也不会被改变。
- 镜像的定制实际上就是定制每一层所添加的配置、文件。如果我们可以把每一层修改、安装、构建、操作的命令都写入一个脚本,用这个脚本来构建、定制镜像,那么之前提及的无法重复的问题、镜像构建透明性的问题、体积的问题就都会解决。这个脚本就是 Dockerfile。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16FROM python:3.6-alpine
WORKDIR /app
# Install dependencies.
ADD requirements.txt /app
RUN cd /app && \
pip install -r requirements.txt
# Add actual source code.
ADD blockchain.py /app
EXPOSE 5000
CMD ["python", "blockchain.py", "--port", "5000"]Dockerfile语法说明
FROM: 指定基础镜像。
- 定制镜像的时候都是以一个镜像为基础,在这个基础上面进行定制。FROM在Dockerfile中是必须的指令,而且必须是第一条指令。
- 在Docker Hub上有非常多的官方镜像,比如服务类(nginx/redis)、语言类(node/openjdk/python)、操作系统类(ubuntu/debian/centos)等,我们可以直接拿来使用。
- 除了选择现有的镜像作为基础镜像外,Docker还存在一个特殊的镜像,名为scratch。这个镜像是虚拟的概念,并不实际存在,它表示一个空白的镜像。如果以 scratch 为基础镜像的话,意味着不以任何镜像为基础,接下来所写的指令将作为镜像第一层开始存在。
WORKDIR: 指定工作目录
- 格式为 WORKDIR <工作目录路径>。
- 使用 WORKDIR 指令可以来指定工作目录(或者称为当前目录),以后各层的当前目录就被改为指定的目录,如该目录不存在,WORKDIR 会帮你建立目录。
COPY: 复制文件
- COPY 指令有两种格式,一种类似于命令行,一种类似于函数调用:
- COPY <源路径>… <目标路径>
- COPY [“<源路径1>”,… “<目标路径>”]
- COPY 指令将从构建上下文目录中<源路径>的文件复制到新的一层的镜像内的<目标路径>位置。
ADD: 更高级的复制文件
- ADD 指令和 COPY 的格式和性质基本一致。但是在 COPY 基础上增加了一些功能。如果 <源路径> 为一个 tar 压缩文件的话,ADD 指令将会自动解压缩这个压缩文件到 <目标路径> 去,而使用 COPY 还需要额外的一层 RUN 指令进行解压缩。
- 但在某些情况下,如果我们真的是希望复制个压缩文件进去,而不解压缩,这时就不可以使用 ADD 命令了。在 Docker 官方的 Dockerfile 最佳实践文档中要求,尽可能的使用 COPY,因为 COPY 的语义很明确,就是复制文件而已,而 ADD 则包含了更复杂的功能,其行为也不一定很清晰。最适合使用 ADD 的场合,就是所提及的需要自动解压缩的场合。
- 另外需要注意的是,ADD 指令会令镜像构建缓存失效,从而可能会令镜像构建变得比较缓慢。因此在 COPY 和 ADD 指令中选择的时候,可以遵循这样的原则,所有的文件复制均使用 COPY 指令,仅在需要自动解压缩的场合使用 ADD。
RUN: 执行命令
- RUN 指令是用来执行命令行命令的,由于命令行的强大能力,RUN 指令在定制镜像时是最常用的指令之一。其格式有两种:
- shell格式: RUN 命令,就像直接在命令行中输入的命令一样,如
RUN echo 'hello, world!' > hello.txt
- exec格式:RUN [‘可执行文件’, ‘参数1’, ‘参数2’],类似于函数调用,将可执行文件和参数分开,如
RUN [ "sh", "-c", "echo $HOME" ]
- shell格式: RUN 命令,就像直接在命令行中输入的命令一样,如
- Dockerfile 中每一个指令都会建立一层,RUN也不例外。每一个RUN的行为:新建立一层,在其上执行这些命令,执行结束后,commit这一层的修改,构成新的镜像。所以我们在使用的时候尽可能将指令进行整合(可以使用&&将各个所需命令串联起来)。
EXPOSE: 声明端口
- 格式为
EXPOSE <端口1> [<端口2>...]
。 - EXPOSE指令是声明运行时容器提供服务端口,这只是一个声明,在运行时并不会因为这个声明应用就会开启这个端口的服务。在Dockerfile中写入这样的声明有两个好处:
- 帮助镜像使用者理解这个镜像服务的守护端口,以方便配置映射;
- 在运行时使用随机端口映射时,也就是docker run -P时,会自动随机映射EXPOSE的端口。
- 要将EXPOSE和在运行时使用
-p <宿主端口>:<容器端口>
区分开来。后者是将容器的对应端口服务公开给外界访问,而EXPOSE仅仅是声明容器打算使用什么端口而已,并不会自动在宿主进行端口映射。CMD: 容器启动命令
- CMD 指令的格式和 RUN 相似,也是两种格式:
- shell 格式:CMD <命令>
- exec 格式:
CMD ["可执行文件", "参数1", "参数2"...]
- 在指定了 ENTRYPOINT 指令后,用 CMD 指定具体的参数。参数列表格式:CMD [ “参数1”, “参数2” … ]
ENV: 设置环境变量
- 格式有两种:
ENV <key> <value>
ENV <key1>=<value1> <key2>=<value2>...
- 这个指令很简单,就是设置环境变量而已,无论是后面的其它指令,如RUN,还是运行时的应用,都可以直接使用这里定义的环境变量。
1
2ENV VERSION=1.0 DEBUG=on \
NAME="Happy Feet" - 这个例子中演示了如何换行,以及对含有空格的值用双引号括起来的办法,这和 Shell 下的行为是一致的。
CI/CD系统
CI/CD与Docker集成后,一次应用从源码提交到线上部署的自动化流程:
开发人员提交代码后,代码仓库(git)里的钩子(hook)触发CI系统的应用构建测试和发布流程,将通过测试的应用打包成Docker镜像上传到Docker镜像仓库中,调用管理节点上的应用部署接口,发起部署,整个过程无须人工干预,自动完成创建、打包和部署到计算节点上。参考链接
- 使用 Dockerfile 定制镜像
使用Dockerfile构建Docker镜像