鸟哥私房菜 - 第九章、文件的压缩与打包 - for Fedora Core 4

最近更新时间： 2005/08/29

本文数据主要针对 Fedora Core 4 的系统进行说明， Fedora Core 1 主要是由 Red Hat Linux 9 改版而来，这个 Red Hat Linux 9 并不是当前大家听到的 RHEL 喔！那是在 RHEL 出现之前的产品，基本上是在 2003 年以前的作品了！Fedora Core 4 则是在 2005 年 6 月份发布，使用的内核是 2.6.11 版，当时是很红的一个作品！只是生命周期太短，所以用这个 Fedora 系列来介绍 Server，当时的决定确实有点莫名其妙了...

建议您前往本站查找最新版本的 Linux distribution 文章来阅读，比较不会浪费时间。那为何还需要编辑 Fedora Core 4 的数据呢？鸟哥只想要做个自己曾经撰写过的文档内容保存而已啰！ ^_^！最新文章请前往鸟站首页查阅啰！

在 Linux 底下有相当多的压缩指令可以运作喔！这些压缩指令可以让我们更方便从网络上面下载大型的文件呢！此外，我们知道在 Linux 底下的扩展名是没有什么很特殊的意义的，不过，针对这些压缩指令所做出来的压缩档，为了方便记忆，还是会有一些特殊的命名方式啦！就让我们来看看吧！

1. 压缩文件的用途与技术：
2. Linux 系统常见的压缩指令：
　　2.1 compress
　　2.2 gzip, zcat
　　2.3 bzip2, bzcat
　　2.4 tar
　　2.5 dd
　　2.6 cpio
3. 本章习题练习
4. 针对本文的建议：http://phorum.vbird.org/viewtopic.php?t=23882

压缩文件的用途与技术：

您是否有过文档文件太大，导致无法以一片软碟将他拷贝完成的困扰？又，您是否有过，发现一个软件里面有好多文件，这些文件要将他拷贝与携带都很不方便的问题？还有，您是否有过要备份某些重要数据，偏偏这些数据量太大了，耗掉了你很多的硬盘与磁盘空间呢？这个时候，那个好用的『文件压缩』技术可就派的上用场了！因为这些比较大型的文件通过所谓的文件压缩技术之后，可以将他的磁盘使用量降低，可以达到减低文件容量的效果，此外，有的压缩程序还可以进行容量限制，使一个大型文件可以分割成为数个小型文件，以方便软盘片携带呢！

那么什么是『文件压缩』呢？我们来稍微谈一谈他的原理好了。目前我们使用的电脑系统中都是使用所谓的 bytes 单位来计量的！不过，事实上，电脑最小的计量单位应该是 bits 才对啊，此外，我们也知道 1 byte = 8 bits 。但是如果今天我们只是记忆一个数字，亦即是 1 这个数字呢？他会如何记录？假设一个 byte 可以看成底下的模样：

□□□□□□□□

Tips

由于 1 byte = 8 bits ，所以每个 byte 当中会有 8 个空格，而每个空格可以是 0, 1 ，这里仅是做为一个约略的介绍，读者不必刻意记忆。

而由于我们记录数字是 1 ，考虑电脑所谓的二进位喔，如此一来， 1 会在最右边占据 1 个 bit ，而其他的 7 个 bits 将会自动的被填上 0 啰！你看看，其实在这样的例子中，那 7 个 bits 应该是『空的』才对！不过，为了要满足目前我们的操作系统数据的访问，所以就会将该数据转为 byte 的型态来记录了！而一些聪明的电脑工程师就利用一些复杂的计算方式，将这些没有使用到的空间『丢』出来，以让文件占用的空间变小！这就是压缩的技术啦！

简单的说，你可以将他想成，其实文件里面有相当多的『空间』存在，并不是完全填满的，而『压缩』的技术就是将这些『空间』填满，以让整个文件占用的容量下降！不过，这些『压缩过的文件』并无法直接被我们的操作系统所使用的，因此，若要使用这些被压缩过的文件数据，则必须将他『还原』回来未压缩前的模样，那就是所谓的『解压缩』啰！而至于压缩前与压缩后的文件所占用的磁盘空间大小，就可以被称为是『压缩比』啰！更多的技术文档或许你可以参考一下：

RFC 1952 文档：http://www.faqs.org/rfcs/rfc1952.html
鸟哥站上的备份： https://vbird.org.cn/linux_basic/0240tarcompress/0240tarcompress_gzip.php

这个『压缩』与『解压缩』的动作有什么好处呢？最大的好处就是压缩过的文件容量变小了，所以你的硬盘容量无形之中就可以容纳更多的数据，此外，在一些网络数据的传输中，也会由于数据量的降低，好让网络带宽可以用来作更多的工作！而不是老是卡在一些大型的文件上面呢！目前很多的 WWW 网站也是利用文件压缩的技术来进行数据的发送，好让网站的可利用率上升喔！

Tips

这种技术蛮有趣的！他让您网站上面『看的到的数据』在经过网络传输时，使用的是『压缩过的数据』，等到这些压缩过的数据到达你的电脑主机时，再进行解压缩，由于目前的电脑运算速度相当的快速，因此其实在网页浏览的时候，时间都是花在『数据的传输』上面，而不是 CPU 的运算啦！，如此一来，由于压缩过的数据量降低了，自然发送的速度就会增快不少！

若您是一位软件工程师，那么相信您也会喜欢将你自己的软件压缩之后提供大家下载来使用，毕竟没有人喜欢自己的网站天天都是带宽满载的吧？！举个例子来说， Linux 2.4.19 完整的内核大小约有 200 MB 左右，而由于内核主要多是 ASCII code 的纯文本型态文件，这种文件的『多余空间』最多了。而一个提供下载的压缩过的 2.4.19 内核大约仅有 30MB 左右，差了几倍呢？您可以自己算一算喔！

Linux 系统常见的压缩指令：

如果您常常在网络上面捉 Linux 的数据下来玩的话，大概会晓得的是，这些供人下载的文件通常都是『压缩』过的！为了什么？上面已经稍微提过啦！呵呵！压缩过的文件具有节省带宽、节省磁盘空间等等的优点，并且还方便携带呢！ ^_^ ！而，您应该也会知道，这些被压缩过的文件，通常其扩展名都是『 *.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2 』等等的，为什么要订定这些压缩文件扩展名为这样的模样呢？

这是因为在 Linux 上面压缩的指令相当的多，并且，这些压缩指令可能无法针对每种压缩文件都可以解的开，毕竟目前的压缩技术五花八门，每种压缩计算的方法都不是完全相同的，所以啰，当你捉到某个压缩档时，自然就需要知道压缩他的是那个指令啦，好用来对照着解压缩啊！ ^_^！也就是说，虽然 Linux 文件的属性基本上是与文件名没有绝对关系的，能不能运行与他的文件属性有关而已，与文件名的关系很小！但是，为了帮助我们小小的人类脑袋瓜子，所以适当的文件名称扩展名还是必要的！因此，目前就有一些常常见到的压缩文件的扩展名啦！我们仅列出常见的几样在底下，给大家权做参考之用：

*.Z compress 程序压缩的文件；

*.bz2 bzip2 程序压缩的文件；

*.gz gzip 程序压缩的文件；

*.tar tar 程序打包的数据，并没有压缩过；

*.tar.gz tar 程序打包的文件，其中并且经过 gzip 的压缩

目前常见的压缩程序主要就是如同上面提到的扩展名对应的那些指令啦！最早期的要算是 compress 这个家伙了，不过这个 compress 指令目前已经不再是缺省的压缩软件了～而后，后来的 GNU 计划开发出新一代的压缩指令 gzip ( GNU zip ) 用来取代 compress 这个老牌的压缩指令，再来还有 bzip2 这个压缩比更好的压缩指令呢！不过，这些指令通常仅能针对一个文件来压缩与解压缩，如此一来，每次压缩与解压缩都要一大堆文件，岂不烦人？此时，那个所谓的『打包软件』就显的很重要啦！

在 Unix-Like 当中，有个软件很好玩，他就是 tar 这支程序！这个 tar 可以将很多文件『打包』成为一个文件！甚至是目录也可以这么玩。不过，单纯的 tar 功能仅是『打包』而已，亦即是将很多文件集结成为一个文件，事实上，他并没有提供压缩的功能，后来， GNU 计划中，将整个 tar 与压缩的功能结合在一起，如此一来提供用户更方便并且更强大的压缩与打包功能！底下我们就来谈一谈这些在 Linux 底下基本的压缩指令吧！

compress

[root@linux ~]# compress [-dcr] 文件或目录
参数：
-d  ：用来解压缩的参数
-r  ：可以连同目录下的文件也同时给予压缩呢！
-c  ：将压缩数据输出成为 standard output (输出到屏幕)
范例：
范例一：将 /etc/man.config 拷贝到 /tmp ，并加以压缩
[root@linux ~]# cd /tmp
[root@linux tmp]# cp /etc/man.config .
[root@linux tmp]# compress man.config
[root@linux tmp]# ls -l
-rw-r--r--  1 root root 2605 Jul 27 11:43 man.config.Z

范例二：将刚刚的压缩档解开
[root@linux tmp]# compress -d man.config.Z

范例三：将 man.config 压缩成另外一个文件来备份
[root@linux tmp]# compress -c man.config > man.config.back.Z
[root@linux tmp]# ll man.config*
-rw-r--r--  1 root root 4506 Jul 27 11:43 man.config
-rw-r--r--  1 root root 2605 Jul 27 11:46 man.config.back.Z
# 这个 -c 的参数比较有趣！他会将压缩过程的数据输出到屏幕上，而不是写入成为 
# file.Z 文件。所以，我们可以通过数据流重导向的方法将数据输出成为另一个文件名。
# 关于数据流重导向，我们会在 bash shell 当中详细谈论的啦！

这是用来压缩与解压缩扩展名为 *.Z 的指令！所以看到 *.Z 的文件时，就应该要知道他是经由 compress 这个程序压缩的呦！这是最简单的压缩指令啰！不过，使用的时候需要特别留意的是，当你以 compress 压缩之后，如果没有下达其他的参数，那么原本的文件就会被后来的 *.Z 所取代！以上面的案例来说明：原本压缩的文件为 man.config ，那么当压缩完成之后，将只会剩下 man.config.Z 这个经过压缩的文件啰！那么解压缩呢？呵呵，则是将 man.config.Z 解压缩成 man.config ！使用上很简单啦！解压缩除了可以使用 compress –d 这个参数之外，也可以直接使用 uncompress ！意思相同啦！

另外，如果不想让原本的文件被更名成为 *.Z ，而想制作出另外的一个文件名时，就可以利用数据流重导向，亦即是那个大于 (>) 的符号，将原本应该在屏幕上面出现的数据给他保存到其他文件去。当然，这要加上 -c 的参数才行～关于数据流重导向，我们会在第三篇提到的！此外， compress 已经很少人在使用了，因为这支程序无法解开 *.gz 的文件，而 gzip 则可以解决 *.Z 的文件，所以，如果您的 distribution 上面没有 compress 的话，没有关系的喔！

Tips

compress 使用的频率越来越低了，如果您还是想要练习这个指令的话，在 FC4 里头，他是在 ucompress 这个套件名称的套件内。您可以参考 RPM 的方式来安装！

gzip, zcat

[root@linux ~]# gzip [-cdt#] 文件名
[root@linux ~]# zcat 文件名.gz
参数：
-c  ：将压缩的数据输出到屏幕上，可通过数据流重导向来处理；
-d  ：解压缩的参数；
-t  ：可以用来检验一个压缩档的一致性～看看文件有无错误；
-#  ：压缩等级，-1 最快，但是压缩比最差、-9 最慢，但是压缩比最好！缺省是 -6 ～
范例：
范例一：将 /etc/man.config 拷贝到 /tmp ，并且以 gzip 压缩
[root@linux ~]# cd /tmp 
[root@linux tmp]# cp /etc/man.config . 
[root@linux tmp]# gzip man.config 
# 此时 man.config 会变成 man.config.gz ！

范例二：将范例一的文件内容读出来！
[root@linux tmp]# zcat man.config.gz
# 此时屏幕上会显示 man.config.gz 解压缩之后的文件内容！！

范例三：将范例一的文件解压缩
[root@linux tmp]# gzip -d man.config.gz

范例四：将范例三解开的 man.config 用最佳的压缩比压缩，并保留原本的文件
[root@linux tmp]# gzip -9 -c man.config > man.config.gz

gzip 是用来压缩与解压缩扩展名为 *.gz 的指令！所以看到 *.gz 的文件时，就应该要知道他是经由 gzip 这个程序压缩的呦！另外， gzip 也提供压缩比的服务！ -1 是最差的压缩比，但是压缩速度最快，而 -9 虽然可以达到较佳的压缩比 (经过压缩之后，文件比较小一些！) ，但是却会损失一些速度！缺省是 -6 这个数值！ gzip 也是相当常使用的一个压缩指令呢！

至于 zcat 则是用来读取压缩档数据内容的指令！假如我们刚刚压缩的文件是一个文本档，那么你还记得如何读取文本档吗？！没错！就是使用 cat ，那么读取压缩档呢？呵呵！就是使用 zcat 啰！由于 gzip 这个压缩指令主要想要用来取代 compress 的，所以 compress 的压缩文件也可以使用 gzip 来解开喔！同时， zcat 这个指令可以同时读取 compress 与 gzip 的压缩档呦！

bzip2, bzcat

[root@linux ~]# bzip2 [-cdz] 文件名
[root@linux ~]# bzcat 文件名.bz2
参数：
-c  ：将压缩的过程产生的数据输出到屏幕上！
-d  ：解压缩的参数
-z  ：压缩的参数
-#  ：与 gzip 同样的，都是在计算压缩比的参数， -9 最佳， -1 最快！
范例：
范例一：将刚刚的 /tmp/man.config 以 bzip2 压缩
[root@linux tmp]# bzip2 -z man.config 
# 此时 man.config 会变成 man.config.bz2 ！

范例二：将范例一的文件内容读出来！
[root@linux tmp]# bzcat man.config.bz2
# 此时屏幕上会显示 man.config.bz2 解压缩之后的文件内容！！

范例三：将范例一的文件解压缩
[root@linux tmp]# bzip2 -d man.config.bz2

范例四：将范例三解开的 man.config 用最佳的压缩比压缩，并保留原本的文件
[root@linux tmp]# bzip2 -9 -c man.config > man.config.bz2

使用 compress 扩展名自动创建为 .Z ，使用 gzip 扩展名自动创建为 .gz 。这里的 bzip2 则是自动的将扩展名建置为 .bz2 啰！所以当我们使用具有压缩功能的 bzip2 -z 时，那么刚刚的 man.config 就会自动的变成了 man.config.bz2 这个文件名啰！

好了，那么如果我想要读取这个文件的内容呢？是否一定要解开？当然不需要啰！可以使用简便的 bzcat 这个指令来读取内容即可！例如上面的例子中，我们可以使用 bzcat man.config.bz2 来读取数据而不需要解开！此外，当您要解开一个压缩档时，这个文件的名称为 .bz, .bz2, .tbz, .tbz2 等等，那么就可以尝试使用 bzip2 来解看看啦！当然啰，也可以使用 bunzip2 这个指令来取代 bzip2 -d 啰。

tar

[root@linux ~]# tar [-cxtzjvfpPN] 文件与目录 ....
参数：
-c  ：创建一个压缩文件的参数指令(create 的意思)；
-x  ：解开一个压缩文件的参数指令！ 
-t  ：查看 tarfile 里面的文件！
      特别注意，在参数的下达中， c/x/t 仅能存在一个！不可同时存在！
      因为不可能同时压缩与解压缩。
-z  ：是否同时具有 gzip 的属性？亦即是否需要用 gzip 压缩？
-j  ：是否同时具有 bzip2 的属性？亦即是否需要用 bzip2 压缩？
-v  ：压缩的过程中显示文件！这个常用，但不建议用在背景运行过程！
-f  ：使用文件名，请留意，在 f 之后要立即接文件名喔！不要再加参数！
　　　例如使用『 tar -zcvfP tfile sfile』就是错误的写法，要写成
　　　『 tar -zcvPf tfile sfile』才对喔！
-p  ：使用原文件的原来属性（属性不会依据用户而变） 
-P  ：可以使用绝对路径来压缩！
-N  ：比后面接的日期(yyyy/mm/dd)还要新的才会被打包进新建的文件中！ 
--exclude FILE：在压缩的过程中，不要将 FILE 打包！ 
范例：
范例一：将整个 /etc 目录下的文件全部打包成为 /tmp/etc.tar 
[root@linux ~]# tar -cvf /tmp/etc.tar /etc  <==仅打包，不压缩！
[root@linux ~]# tar -zcvf /tmp/etc.tar.gz /etc  <==打包后，以 gzip 压缩
[root@linux ~]# tar -jcvf /tmp/etc.tar.bz2 /etc  <==打包后，以 bzip2 压缩
# 特别注意，在参数 f 之后的文件文件名是自己取的，我们习惯上都用 .tar 来作为辨识。
# 如果加 z 参数，则以 .tar.gz 或 .tgz 来代表 gzip 压缩过的 tar file ～
# 如果加 j 参数，则以 .tar.bz2 来作为扩展名啊～
# 上述指令在运行的时候，会显示一个警告消息：
# 『tar: Removing leading `/' from member names』那是关于绝对路径的特殊设置。

范例二：查阅上述 /tmp/etc.tar.gz 文件内有哪些文件？
[root@linux ~]# tar -ztvf /tmp/etc.tar.gz 
# 由于我们使用 gzip 压缩，所以要查阅该 tar file 内的文件时，
# 就得要加上 z 这个参数了！这很重要的！

范例三：将 /tmp/etc.tar.gz 文件解压缩在 /usr/local/src 底下
[root@linux ~]# cd /usr/local/src
[root@linux src]# tar -zxvf /tmp/etc.tar.gz
# 在缺省的情况下，我们可以将压缩档在任何地方解开的！以这个范例来说，
# 我先将工作目录变换到 /usr/local/src 底下，并且解开 /tmp/etc.tar.gz ，
# 则解开的目录会在 /usr/local/src/etc 呢！另外，如果您进入 /usr/local/src/etc
# 则会发现，该目录下的文件属性与 /etc/ 可能会有所不同喔！

范例四：在 /tmp 底下，我只想要将 /tmp/etc.tar.gz 内的 etc/passwd 解开而已
[root@linux ~]# cd /tmp
[root@linux tmp]# tar -zxvf /tmp/etc.tar.gz etc/passwd
# 我可以通过 tar -ztvf 来查阅 tarfile 内的文件名称，如果单只要一个文件，
# 就可以通过这个方式来下达！注意到！ etc.tar.gz 内的根目录 / 是被拿掉了！

范例五：将 /etc/ 内的所有文件备份下来，并且保存其权限！
[root@linux ~]# tar -zcvpf /tmp/etc.tar.gz /etc
# 这个 -p 的属性是很重要的，尤其是当您要保留原本文件的属性时！

范例六：在 /home 当中，比 2005/06/01 新的文件才备份
[root@linux ~]# tar -N '2005/06/01' -zcvf home.tar.gz /home

范例七：我要备份 /home, /etc ，但不要 /home/dmtsai 
[root@linux ~]# tar --exclude /home/dmtsai -zcvf myfile.tar.gz /home/* /etc

范例八：将 /etc/ 打包后直接解开在 /tmp 底下，而不产生文件！ 
[root@linux ~]# cd /tmp
[root@linux tmp]# tar -cvf - /etc | tar -xvf -
# 这个动作有点像是 cp -r /etc /tmp 啦～依旧是有其有用途的！
# 要注意的地方在于输出档变成 - 而输入档也变成 - ，又有一个 | 存在～
# 这分别代表 standard output, standard input 与管线命令啦！
# 这部分我们会在 Bash shell 时，再次提到这个指令跟大家再解释啰！

这是一个多用途的压缩指令！刚刚我们提到的 compress 与 gzip 是可以适用在一个文件的压缩上面，但是如果是要将一个目录压缩成一个文件呢？！这时该如何是好？！呵呵！ tar 就派上用场了！ tar 可以将整个目录或者是指定的文件都集成成一个文件！例如上面的范例一，他可以将 /etc 底下的文件全部集成成一个文件！同时， tar 可以配合 gzip (这个 gzip 的功能已经已经附加上 tar 里面去了) ，同时集成并压缩！呵呵！很方便吧！

『 tar 用来作备份是很重要的指令！』而由于 tar 集成过后的文件我们通常会取名为 *.tar ，而如果还含有 gzip 的压缩属性，那么就取名为 *.tar.gz 啰！取这个文件名只是为了方便我们记忆这个文件是什么属性罢了！并没有实际的意义在！

　

绝对路径与权限的问题

另外，需要注意的是，在使用的参数方面，有还有几个有用的参数需要来了解一番，亦即是 -p 与 -P 这两个！在我们的范例一当中，有提到一个警告消息，那就是『 tar: Removing leading `/' from member names』意思是说， tar 将 /etc 目录的那个 / 拿掉了！这是因为担心未来你在解开压缩的时候，会产生一些困扰，因为在 tar 里面的文件如果是具有『绝对路径』的话，那么你解开的文件将会『一定』在该路径下也就是 /etc，而不是相对路径 (这里请用心的想一想！) 。

这样子的最大困扰是，万一有人拿走了你的这个文件，并且将该文件在他的系统上面解开！万一他的系统上面正巧也有 /etc 这个目录 (那当然是一定有的啊！)，哈哈！他的文件就会『正巧』被覆盖了！所以啰，在缺省的情况中，如果是以『绝对路径』来创建打包文件，那么 tar 将会自动的将 / 拿掉！这是为了刚刚说明的『安全』为前提所做的默认值。好了！但是你就是要以绝对路径来创建打包的文件！那么就加入 -P 这个参数吧 (请注意！是大写字符) ！这样就可以啦！

那么 -p 是什么 (小写字符) ？呵呵！那个 -p 是 permission 的意思，也就是『权限』啦！使用 -p 之后，被打包的文件将不会依据用户的身份来改变权限喔！

关于文件的更新日期：

这里还有一个值得注意的参数呦！那就是在备份的情况中很常使用的 -N 的这个参数！你可以参考一下上面的例子就可以知道啦！在这个例子当中，相当重要的就是那个日期啦！在备份的情况当中，我们都希望只要备份较新的文件就好了，为什么呢？因为旧的文件我们已经有备份啰！干嘛还要再备份一次，浪费时间也浪费系统资源！这个时候此一参数就显的相当的重要了啊！

关于 standard input/standard output：

在上面的例子中，最后一个例子很有趣『tar cvf - /etc | tar -xvf - 』！他是直接以管线命令『 pipe 』来进行压缩、解压缩的过程！在上面的例子中，我们想要『将 /etc 底下的数据直接 copy 到目前所在的路径，也就是 /tmp 底下来』，但是又觉得使用 cp -r 有点麻烦，那么就直接以这个打包的方式来打包，其中，指令里面的 - 就是表示那个被打包的文件啦！由于我们不想要让中间文件存在，所以就以这一个方式来进行拷贝的行为啦！

什么是 tarfile 与 tarball？

tar 的功能相当的多，而由于他是经由『打包』之后再处理的一个过程，所以常常我们会听到 tarball 的文件，那就是经由 tar 打包再压缩的文件啦！而如果仅是打包而没有压缩的话，我们就称为 tarfile 啰～此外， tar 也可以用在备份的保存媒体上面，最常见的就是磁带机了！假设我的磁带机代号为 /dev/st0 ，那么我要将我的 /home 底下的数据都给他备份上去时，就是使用 tar /dev/st0 /home 就可以啦！很不错吧！

在 Linux 当中， gzip 已经被集成在 tar 里面了！但是 Sun 或者其他较旧的 Unix 版本中，当中的 tar 并没有集成 gzip ，所以如果你需要解压缩的话，就需要这么做：

第一个步骤会将文件解压缩，第二个步骤才是将数据解出来！与其他压缩程序不太一样的是， bzip2, gzip 与 compress 在没有加入特殊参数的时候，原先的文件会被取代掉，但是使用 tar 则原来的与后来的文件都会存在呦！

dd

我们在上一章当中，在制作出 swap file 时，使用过 dd 这个指令对吧？！不过，这个指令可不只是制作一个文件而已喔～这个 dd 指令最大的功效，鸟哥认为，应该是在于『备份』啊！因为 dd 可以读取设备的内容，然后将整个设备备份成一个文件呢！真的是相当的好用啊～ dd 的用途有很多啦～但是我们仅讲一些比较重要的参数，如下：

[root@linux ~]# dd if="input_file" of="output_file" bs="block_size" \
count="number"
参数：
if   ：就是 input file 啰～也可以是设备喔！
of   ：就是 output file 喔～也可以是设备；
bs   ：规划的一个 block 的大小，如果没有设置时，缺省是 512 bytes
count：多少个 bs 的意思。
范例：

范例一：将 /etc/passwd 备份到 /tmp/passwd.back 当中
[root@linux ~]# dd if=/etc/passwd of=/tmp/passwd.back
3+1 records in
3+1 records out
[root@linux ~]# ll /etc/passwd /tmp/passwd.back
-rw-r--r--  1 root root 1746 Aug 25 14:16 /etc/passwd
-rw-r--r--  1 root root 1746 Aug 29 16:57 /tmp/passwd.back
# 仔细的看一下，我的 /etc/passwd 文件大小为 1746 bytes，因为我没有设置 bs ，
# 所以缺省是 512 bytes 为一个单位，因此，上面那个 3+1 表示有 3 个完整的 
# 512 bytes，以及未满 512 bytes 的另一个 block 的意思啦！
# 事实上，感觉好像是 cp 这个指令啦～

范例二：备份 /dev/hda 的 MBR 
[root@linux ~]# dd if=/dev/hda of=/tmp/mbr.back bs=512 count=1
1+0 records in
1+0 records out
# 这就得好好了解一下啰～我们知道整颗硬盘的 MBR 为 512 bytes，
# 就是放在硬盘的第一个 sector 啦，因此，我可以利用这个方式来将
# MBR 内的所有数据都纪录下来，真的很厉害吧！ ^_^

范例三：将整个 /dev/hda1 partition 备份下来。
[root@linux ~]# dd if=/dev/hda1 of=/some/path/filename
# 这个指令很厉害啊！将整个 partition 的内容全部备份下来～
# 后面接的 of 必须要不是在 /dev/hda1 的目录内啊～否则，怎么读也读不完～
# 这个动作是很有效用的，如果改天你必须要完整的将整个 partition 的内容填回去，
# 则可以利用 dd if=/some/file of=/dev/hda1 来将数据写入到硬盘当中。
# 如果想要整个硬盘备份的话，就类似 Norton 的 ghost 软件一般，
# 由 disk 到 disk ，嘿嘿～利用 dd 就可以啦～厉害厉害！

你可以说， tar 可以用来备份关键数据，而 dd 则可以用来备份整颗 partition 或整颗 disk ，很不错啊～不过，如果要将数据填回到 filesystem 当中，可能需要考虑到原本的 filesystem 才能成功啊！

cpio

这个指令可有趣了！他是通过数据流重导向的方法来将文件进行输出/输入的一个方式～因为我们尚未提到数据流重导向，所以，您可以先略过这的指令的练习。等到后续的章节读完后，再来这个章节瞧一瞧！

[root@linux ~]# cpio -covB  > [file|device] <==备份
[root@linux ~]# cpio -icduv < [file|device] <==还原
参数：
-o ：将数据 copy 输出到文件或设备上 
-i ：将数据自文件或设备 copy 出来系统当中 
-t ：查看 cpio 创建的文件或设备的内容 
-c ：一种较新的 portable format 方式保存 
-v ：让保存的过程中文件名称可以在屏幕上显示 
-B ：让缺省的 Blocks 可以增加至 5120 bytes ，缺省是 512 bytes ！ 
　　 这样的好处是可以让大文件的保存速度加快(请参考 i-nodes 的观念) 
-d ：自动创建目录！由于 cpio 的内容可能不是在同一个目录内，
     如此的话在反备份的过程会有问题！ 这个时候加上 -d 的话，
     就可以自动的将需要的目录创建起来了！ 
-u ：自动的将较新的文件覆盖较旧的文件！
范例：
范例一：将所有系统上的数据通通写入磁带机内！
[root@linux ~]# find / -print | cpio -covB > /dev/st0
# 一般来说，使用 SCSI 接口的磁带机，代号是 /dev/st0 喔！

范例二：检查磁带机上面有什么文件？
[root@linux ~]# cpio -icdvt < /dev/st0
[root@linux ~]# cpio -icdvt < /dev/st0 > /tmp/content
# 第一个动作当中，会将磁带机内的文件名列出到屏幕上面，而我们可以通过第二个动作，
# 将所有的文件名通通纪录到 /tmp/content 文件去！

范例三：将磁带上的数据还原回来～
[root@linux ~]# cpio -icduv < /dev/st0
# 一般来说，使用 SCSI 接口的磁带机，代号是 /dev/st0 喔！

范例四：将 /etc 底下的所有『文件』都备份到 /root/etc.cpio 中！
[root@linux ~]# find /etc -type f | cpio -o > /root/etc.cpio
# 这样就能够备份啰～您也可以将数据以 cpio -i < /root/etc.cpio 
# 来将数据捉出来！！！！

这个 cpio 还蛮神奇的呢！他最适用于备份的时候使用的一个指令了！为什么呢？因为他并不像 cp 一样，可以直接的将文件给他 copy 过去，例如 cp * /tmp 就可以将所在目录的所有文件 copy 到 /tmp 底下，在 cpio 这个指令的用法中，由于 cpio 无法直接读取文件，而是需要『每一个文件或目录的路径连同文件名一起』才可以被记录下来！因此， cpio 最常跟 find 这个指令一起使用了！

这个 cpio 好像不怎么好用呦！但是，嘿嘿！他可是备份的时候的一项利器呢！因为他可以备份任何的文件，包括 /dev 底下的任何设备文件！呵呵！所以他可是相当重要的呢！！您说是吧！而由于 cpio 必需要配合其他的程序，例如 find 来创建文件名，所以， cpio 与管线命令及数据流重导向的相关性就相当的重要了！

本章习题练习

(要看答案请将鼠标移动到『答：』底下的空白处，按下左键圈选空白处即可察看)

修改历史：

2003/02/09：第一次完成
2003/05/05：修改 tar 的部分内容，尤其是 -P 这个参数的配合用法
2005/07/26：将旧有的文章移动到这里
2005/07/27：大略修改了一些风格，另外，动作较大的是在范例的部分！
2005/08/29：加入了 dd 这个有趣的指令喔！
2006/05/02：将原本『tar -zxvpf /tmp/etc.tar.gz /etc』修改为『tar -zcvpf /tmp/etc.tar.gz /etc』感谢讨论区网友 chinu 提供的信息。