包括了 crontab 与 at 这两支程序啦!
学习了基础篇也一阵子了,你会发现到为什么系统常常会主动的进行一些任务?这些任务到底是谁在设置工作的? 如果你想要让自己设计的备份程序可以自动的在系统底下运行,而不需要手动来启动他,又该如何处置? 这些例行的工作可能又分为『单一』工作与『循环』工作,在系统内又是哪些服务在负责? 还有还有,如果你想要每年在老婆的生日前一天就发出一封信件提醒自己不要忘记,可以办的到吗? 嘿嘿!这些种种要如何处理,就看看这一章先!
每个人或多或少都有一些约会或者是工作,有的工作是例行性的, 例如每年一次的加薪、每个月一次的工作报告、每周一次的午餐会报、每天需要的打卡等等; 有的工作则是临时发生的,例如刚好总公司有高官来访,需要你准备演讲器材等等! 用在生活上面,例如每年的爱人的生日、每天的起床时间等等、还有突发性的 3C 用品大降价 (啊!真希望天天都有!) 等等啰。
像上面这些例行性工作,通常你得要记录在行事历上面才能避免忘记!不过,由于我们常常在电脑前面的缘故, 如果电脑系统能够主动的通知我们的话,那么不就轻松多了!嘿嘿!这个时候 Linux 的例行性工作调度就可以派上场了! 在不考虑硬件与我们服务器的链接状态下,我们的 Linux 可以帮你提醒很多任务,例如:每一天早上 8:00 钟要服务器连接上音响,并启动音乐来唤你起床;而中午 12:00 希望 Linux 可以发一封信到你的邮件信箱,提醒你可以去吃午餐了; 另外,在每年的你爱人生日的前一天,先发封信提醒你,以免忘记这么重要的一天。
那么 Linux 的例行性工作是如何进行调度的呢?所谓的调度就是将这些工作安排运行的流程之意! 咱们的 Linux 调度就是通过 crontab 与 at 这两个东西!这两个玩意儿有啥异同?就让我们来瞧瞧先!
从上面的说明当中,我们可以很清楚的发现两种工作调度的方式:
那么在 Linux 底下如何达到这两个功能呢?那就得使用 at 与 crontab 这两个好东西啰!
底下我们先来谈一谈 Linux 的系统到底在做什么事情,怎么有若干多的工作调度在进行呢?然后再回来谈一谈 at 与 crontab 这两个好东西!
如果你曾经使用过 Linux 一阵子了,那么你大概会发现到 Linux 会主动的帮我们进行一些工作呢! 比方说自动的进行在线更新 (on-line update)、自动的进行 updatedb (第六章谈到的 locate 指令) 更新文件名数据库、自动的作注册表分析 (所以 root 常常会收到标题为 logwatch 的信件) 等等。这是由于系统要正常运作的话, 某些在背景底下的工作必须要定时进行的缘故。基本上 Linux 系统常见的例行性任务有:
其实你的系统会进行的例行性工作与你安装的软件多寡有关,如果你安装过多的软件,某些服务功能的软件都会附上分析工具, 那么你的系统就会多出一些例行性工作啰!像鸟哥的主机还多加了很多自己撰写的分析工具,以及其他第三方协力软件的分析软件, 嘿嘿!俺的 Linux 工作量可是非常大的哩!因为有这么多的工作需要进行,所以我们当然得要了解例行性工作的处理方式啰!
首先,我们先来谈谈单一工作调度的运作,那就是 at 这个指令的运作!
要使用单一工作调度时,我们的 Linux 系统上面必须要有负责这个调度的服务,那就是 atd 这个玩意儿。 不过并非所有的 Linux distributions 都缺省会把他打开的,所以呢,某些时刻我们必须要手动将他激活才行。 激活的方法很简单,就是这样:
[root@study ~]# systemctl restart atd # 重新启动 atd 这个服务 [root@study ~]# systemctl enable atd # 让这个服务开机就自动启动 [root@study ~]# systemctl status atd # 查阅一下 atd 目前的状态 atd.service - Job spooling tools Loaded: loaded (/usr/lib/systemd/system/atd.service; enabled) # 是否开机启动 Active: active (running) since Thu 2015-07-30 19:21:21 CST; 23s ago # 是否正在运作中 Main PID: 26503 (atd) CGroup: /system.slice/atd.service └─26503 /usr/sbin/atd -f Jul 30 19:21:21 study.centos.vbird systemd[1]: Starting Job spooling tools... Jul 30 19:21:21 study.centos.vbird systemd[1]: Started Job spooling tools.
重点就是要看到上表中的特殊字体,包括『 enabled 』以及『 running 』时,这才是 atd 真的有在运作的意思喔!这部份我们在第十七章会谈及。
既然是工作调度,那么应该会有产生工作的方式,并且将这些工作排进行程表中啰!OK!那么产生工作的方式是怎么进行的? 事实上,我们使用 at 这个指令来产生所要运作的工作,并将这个工作以文本档的方式写入 /var/spool/at/ 目录内,该工作便能等待 atd 这个服务的取用与运行了。就这么简单。
不过,并不是所有的人都可以进行 at 工作调度喔!为什么?因为安全的理由啊~ 很多主机被所谓的『绑架』后,最常发现的就是他们的系统当中多了很多的怪客程序 (cracker program), 这些程序非常可能运用工作调度来运行或搜集系统信息,并定时的回报给怪客团体! 所以啰,除非是你认可的帐号,否则先不要让他们使用 at 吧!那怎么达到使用 at 的列管呢?
我们可以利用 /etc/at.allow 与 /etc/at.deny 这两个文件来进行 at 的使用限制呢! 加上这两个文件后, at 的工作情况其实是这样的:
通过这个说明,我们知道 /etc/at.allow 是管理较为严格的方式,而 /etc/at.deny 则较为松散 (因为帐号没有在该文件中,就能够运行 at 了)。在一般的 distributions 当中,由于假设系统上的所有用户都是可信任的, 因此系统通常会保留一个空的 /etc/at.deny 文件,意思是允许所有人使用 at 指令的意思 (您可以自行检查一下该文件)。 不过,万一你不希望有某些用户使用 at 的话,将那个用户的帐号写入 /etc/at.deny 即可! 一个帐号写一行。
单一工作调度的进行就使用 at 这个指令啰!这个指令的运作非常简单!将 at 加上一个时间即可!基本的语法如下:
[root@study ~]# at [-mldv] TIME [root@study ~]# at -c 工作号码 选项与参数: -m :当 at 的工作完成后,即使没有输出消息,亦以 email 通知用户该工作已完成。 -l :at -l 相当于 atq,列出目前系统上面的所有该用户的 at 调度; -d :at -d 相当于 atrm ,可以取消一个在 at 调度中的工作; -v :可以使用较明显的时间格式列出 at 调度中的任务栏表; -c :可以列出后面接的该项工作的实际指令内容。 TIME:时间格式,这里可以定义出『什么时候要进行 at 这项工作』的时间,格式有: HH:MM ex> 04:00 在今日的 HH:MM 时刻进行,若该时刻已超过,则明天的 HH:MM 进行此工作。 HH:MM YYYY-MM-DD ex> 04:00 2015-07-30 强制规定在某年某月的某一天的特殊时刻进行该工作! HH:MM[am|pm] [Month] [Date] ex> 04pm July 30 也是一样,强制在某年某月某日的某时刻进行! HH:MM[am|pm] + number [minutes|hours|days|weeks] ex> now + 5 minutes ex> 04pm + 3 days 就是说,在某个时间点『再加几个时间后』才进行。
老实说,这个 at 指令的下达最重要的地方在于『时间』的指定了!鸟哥喜欢使用『 now + ... 』 的方式来定义现在过多少时间再进行工作,但有时也需要定义特定的时间点来进行!底下的范例先看看啰!
范例一:再过五分钟后,将 /root/.bashrc 寄给 root 自己 [root@study ~]# at now + 5 minutes <==记得单位要加 s 喔! at> /bin/mail -s "testing at job" root < /root/.bashrc at> <EOT> <==这里输入 [ctrl] + d 就会出现 <EOF> 的字样!代表结束! job 2 at Thu Jul 30 19:35:00 2015 # 上面这行信息在说明,第 2 个 at 工作将在 2015/07/30 的 19:35 进行! # 而运行 at 会进入所谓的 at shell 环境,让你下达多重指令等待运作! 范例二:将上述的第 2 项工作内容列出来查阅 [root@study ~]# at -c 2 #!/bin/sh <==就是通过 bash shell 的啦! # atrun uid=0 gid=0 # mail root 0 umask 22 ....(中间省略许多的环境变量项目).... cd /etc/cron\.d || { echo 'Execution directory inaccessible' >&2 exit 1 } ${SHELL:-/bin/sh} << 'marcinDELIMITER410efc26' /bin/mail -s "testing at job" root < /root/.bashrc # 这一行最重要! marcinDELIMITER410efc26 # 你可以看到指令运行的目录 (/root),还有多个环境变量与实际的指令内容啦! 范例三:由于机房预计于 2015/08/05 停电,我想要在 2015/08/04 23:00 关机? [root@study ~]# at 23:00 2015-08-04 at> /bin/sync at> /bin/sync at> /sbin/shutdown -h now at> <EOT> job 3 at Tue Aug 4 23:00:00 2015 # 您瞧瞧! at 还可以在一个工作内输入多个指令呢!不错吧!
事实上,当我们使用 at 时会进入一个 at shell 的环境来让用户下达工作指令,此时,建议你最好使用绝对路径来下达你的指令,比较不会有问题喔!由于指令的下达与 PATH 变量有关, 同时与当时的工作目录也有关连 (如果有牵涉到文件的话),因此使用绝对路径来下达指令,会是比较一劳永逸的方法。 为什么呢?举例来说,你在 /tmp 下达『 at now 』然后输入『 mail -s "test" root < .bashrc 』, 问一下,那个 .bashrc 的文件会是在哪里?答案是『 /tmp/.bashrc 』!因为 at 在运作时,会跑到当时下达 at 指令的那个工作目录的缘故啊!
有些朋友会希望『我要在某某时刻,在我的终端机显示出 Hello 的字样』,然后就在 at 里面下达这样的信息『 echo "Hello" 』。等到时间到了,却发现没有任何消息在屏幕上显示,这是啥原因啊?这是因为 at 的运行与终端机环境无关,而所有 standard output/standard error output 都会发送到运行者的 mailbox 去啦!所以在终端机当然看不到任何信息。那怎办?没关系, 可以通过终端机的设备来处理!假如你在 tty1 登录,则可以使用『 echo "Hello" > /dev/tty1 』来取代。
at 有另外一个很棒的优点,那就是『背景运行』的功能了!什么是背景运行啊?很难了解吗?其实与 bash 的 nohup (第十六章) 类似啦! 鸟哥提我自己的几个例子来给您听听,您就瞭了!
由于 at 工作调度的使用上,系统会将该项 at 工作独立出你的 bash 环境中, 直接交给系统的 atd 程序来接管,因此,当你下达了 at 的工作之后就可以立刻脱机了, 剩下的工作就完全交给 Linux 管理即可!所以啰,如果有长时间的网络工作时,嘿嘿! 使用 at 可以让你免除网络断线后的困扰喔! ^_^
那么万一我下达了 at 之后,才发现指令输入错误,该如何是好?就将他移除啊!利用 atq 与 atrm 吧!
[root@study ~]# atq [root@study ~]# atrm (jobnumber) 范例一:查找目前主机上面有多少的 at 工作调度? [root@study ~]# atq 3 Tue Aug 4 23:00:00 2015 a root # 上面说的是:『在 2015/08/04 的 23:00 有一项工作,该项工作指令下达者为 # root』而且,该项工作的工作号码 (jobnumber) 为 3 号喔! 范例二:将上述的第 3 个工作移除! [root@study ~]# atrm 3 [root@study ~]# atq # 没有任何信息,表示该工作被移除了!
如此一来,你可以利用 atq 来查找,利用 atrm 来删调试误的指令,利用 at 来直接下达单一工作调度!很简单吧! 不过,有个问题需要处理一下。如果你是在一个非常忙碌的系统下运作 at , 能不能指定你的工作在系统较闲的时候才进行呢?可以的,那就使用 batch 指令吧!
其实 batch 是利用 at 来进行指令的下达啦!只是加入一些控制参数而已。这个 batch 神奇的地方在于:他会在 CPU 的工作负载小于 0.8 的时候,才进行你所下达的工作任务啦! 那什么是工作负载 0.8 呢?这个工作负载的意思是: CPU 在单一时间点所负责的工作数量。不是 CPU 的使用率喔! 举例来说,如果我有一只程序他需要一直使用 CPU 的运算功能,那么此时 CPU 的使用率可能到达 100% , 但是 CPU 的工作负载则是趋近于『 1 』,因为 CPU 仅负责一个工作嘛!如果同时运行这样的程序两支呢? CPU 的使用率还是 100% ,但是工作负载则变成 2 了!了解乎?
所以也就是说,当 CPU 的工作负载越大,代表 CPU 必须要在不同的工作之间进行频繁的工作切换。 这样的 CPU 运作情况我们在第零章有谈过,忘记的话请回去瞧瞧!因为一直切换工作,所以会导致系统忙碌啊! 系统如果很忙碌,还要额外进行 at ,不太合理!所以才有 batch 指令的产生!
在 CentOS 7 底下的 batch 已经不再支持时间参数了,因此 batch 可以拿来作为判断是否要立刻运行背景程序的依据! 我们底下来实验一下 batch 好了!为了产生 CPU 较高的工作负载,因此我们用了 12 章里面计算 pi 的脚本,连续运行 4 次这只程序, 来仿真高负载,然后来玩一玩 batch 的工作现象:
范例一:请运行 pi 的计算,然后在系统闲置时,运行 updatdb 的任务 [root@study ~]# echo "scale=100000; 4*a(1)" | bc -lq & [root@study ~]# echo "scale=100000; 4*a(1)" | bc -lq & [root@study ~]# echo "scale=100000; 4*a(1)" | bc -lq & [root@study ~]# echo "scale=100000; 4*a(1)" | bc -lq & # 然后等待个大约数十秒的时间,之后再来确认一下工作负载的情况! [root@study ~]# uptime 19:56:45 up 2 days, 19:54, 2 users, load average: 3.93, 2.23, 0.96 [root@study ~]# batch at> /usr/bin/updatedb at> <EOT> job 4 at Thu Jul 30 19:57:00 2015 [root@study ~]# date;atq Thu Jul 30 19:57:47 CST 2015 4 Thu Jul 30 19:57:00 2015 b root # 可以看得到,明明时间已经超过了,却没有实际运行 at 的任务! [root@study ~]# jobs [1] Running echo "scale=100000; 4*a(1)" | bc -lq & [2] Running echo "scale=100000; 4*a(1)" | bc -lq & [3]- Running echo "scale=100000; 4*a(1)" | bc -lq & [4]+ Running echo "scale=100000; 4*a(1)" | bc -lq & [root@study ~]# kill -9 %1 %2 %3 %4 # 这时先用 jobs 找出背景工作,再使用 kill 删除掉四个背景工作后,慢慢等待工作负载的下降 [root@study ~]# uptime; atq 20:01:33 up 2 days, 19:59, 2 users, load average: 0.89, 2.29, 1.40 4 Thu Jul 30 19:57:00 2015 b root [root@study ~]# uptime; atq 20:02:52 up 2 days, 20:01, 2 users, load average: 0.23, 1.75, 1.28 # 在 19:59 时,由于 loading 还是高于 0.8,因此 atq 可以看得到 at job 还是持续再等待当中喔! # 但是到了 20:01 时, loading 降低到 0.8 以下了,所以 atq 就运行完毕啰!
使用 uptime 可以观察到 1, 5, 15 分钟的『平均工作负载』量,因为是平均值,所以当我们如上表删除掉四个工作后,工作负载不会立即降低, 需要一小段时间让这个 1 分钟平均值慢慢回复到接近 0 啊!当小于 0.8 之后的『整分钟时间』时,atd 就会将 batch 的工作运行掉了!
什么是『整分钟时间』呢?不论是 at 还是底下要介绍的 crontab,他们最小的时间单位是『分钟』,所以,基本上,他们的工作是『每分钟检查一次』来处理的! 就是整分 (秒为 0 的时候),这样了解乎?同时,你会发现其实 batch 也是使用 atq/atrm 来管理的!
相对于 at 是仅运行一次的工作,循环运行的例行性工作调度则是由 cron (crond) 这个系统服务来控制的。刚刚谈过 Linux 系统上面原本就有非常多的例行性工作,因此这个系统服务是缺省启动的。另外, 由于用户自己也可以进行例行性工作调度,所以啰, Linux 也提供用户控制例行性工作调度的指令 (crontab)。 底下我们分别来聊一聊啰!
用户想要创建循环型工作调度时,使用的是 crontab 这个指令啦~不过,为了安全性的问题, 与 at 同样的,我们可以限制使用 crontab 的用户帐号喔!使用的限制数据有:
与 at 很像吧!同样的,以优先级来说, /etc/cron.allow 比 /etc/cron.deny 要优先, 而判断上面,这两个文件只选择一个来限制而已,因此,建议你只要保留一个即可, 免得影响自己在设置上面的判断!一般来说,系统缺省是保留 /etc/cron.deny , 你可以将不想让他运行 crontab 的那个用户写入 /etc/cron.deny 当中,一个帐号一行!
当用户使用 crontab 这个指令来创建工作调度之后,该项工作就会被纪录到 /var/spool/cron/ 里面去了,而且是以帐号来作为判别的喔!举例来说, dmtsai 使用 crontab 后, 他的工作会被纪录到 /var/spool/cron/dmtsai 里头去!但请注意,不要使用 vi 直接编辑该文件, 因为可能由于输入语法错误,会导致无法运行 cron 喔!另外, cron 运行的每一项工作都会被纪录到 /var/log/cron 这个注册表中,所以啰,如果你的 Linux 不知道有否被植入木马时,也可以搜索一下 /var/log/cron 这个注册表呢!
好了,那么我们就来聊一聊 crontab 的语法吧!
[root@study ~]# crontab [-u username] [-l|-e|-r] 选项与参数: -u :只有 root 才能进行这个任务,亦即帮其他用户创建/移除 crontab 工作调度; -e :编辑 crontab 的工作内容 -l :查阅 crontab 的工作内容 -r :移除所有的 crontab 的工作内容,若仅要移除一项,请用 -e 去编辑。 范例一:用 dmtsai 的身份在每天的 12:00 发信给自己 [dmtsai@study ~]$ crontab -e # 此时会进入 vi 的编辑画面让您编辑工作!注意到,每项工作都是一行。 0 12 * * * mail -s "at 12:00" dmtsai < /home/dmtsai/.bashrc #分 时 日 月 周 |<==============指令串========================>|
缺省情况下,任何用户只要不被列入 /etc/cron.deny 当中,那么他就可以直接下达『 crontab -e 』去编辑自己的例行性命令了!整个过程就如同上面提到的,会进入 vi 的编辑画面, 然后以一个工作一行来编辑,编辑完毕之后输入『 :wq 』保存后离开 vi 就可以了! 而每项工作 (每行) 的格式都是具有六个字段,这六个字段的意义为:
代表意义 | 分钟 | 小时 | 日期 | 月份 | 周 | 指令 |
数字范围 | 0-59 | 0-23 | 1-31 | 1-12 | 0-7 | 呀就指令啊 |
比较有趣的是那个『周』喔!周的数字为 0 或 7 时,都代表『星期天』的意思!另外,还有一些辅助的字符,大概有底下这些:
特殊字符 | 代表意义 |
*(星号) | 代表任何时刻都接受的意思!举例来说,范例一内那个日、月、周都是 * , 就代表着『不论何月、何日的礼拜几的 12:00 都运行后续指令』的意思! |
,(逗号) | 代表分隔时段的意思。举例来说,如果要下达的工作是 3:00 与 6:00 时,就会是:
0 3,6 * * * command时间参数还是有五栏,不过第二栏是 3,6 ,代表 3 与 6 都适用! |
-(减号) | 代表一段时间范围内,举例来说, 8 点到 12 点之间的每小时的 20 分都进行一项工作:
20 8-12 * * * command仔细看到第二栏变成 8-12 喔!代表 8,9,10,11,12 都适用的意思! |
/n(斜线) | 那个 n 代表数字,亦即是『每隔 n 单位间隔』的意思,例如每五分钟进行一次,则:*/5 * * * * command很简单吧!用 * 与 /5 来搭配,也可以写成 0-59/5 ,相同意思! |
我们就来搭配几个例子练习看看吧!底下的案例请实际用 dmtsai 这个身份作看看喔!后续的动作才能够搭配起来!
例题:
假若你的女朋友生日是 5 月 2 日,你想要在 5 月 1 日的 23:59 发一封信给他,这封信的内容已经写在
/home/dmtsai/lover.txt 内了,该如何进行?
答:
直接下达 crontab -e 之后,编辑成为:
59 23 1 5 * mail kiki < /home/dmtsai/lover.txt那样的话,每年 kiki 都会收到你的这封信喔!(当然啰,信的内容就要每年变一变啦!) |
例题:
假如每五分钟需要运行 /home/dmtsai/test.sh 一次,又该如何?
答:
同样使用 crontab -e 进入编辑:
*/5 * * * * /home/dmtsai/test.sh |
那个 crontab 每个人都只有一个文件存在,就是在 /var/spool/cron 里面啊! 还有建议您:『指令下达时,最好使用绝对路径,这样比较不会找不到运行档喔!』
例题:
假如你每星期六都与朋友有约,那么想要每个星期五下午 4:30 告诉你朋友星期六的约会不要忘记,则:
答:
还是使用 crontab -e 啊!
30 16 * * 5 mail friend@his.server.name < /home/dmtsai/friend.txt |
真的是很简单吧!呵呵!那么,该如何查找用户目前的 crontab 内容呢?我们可以这样来看看:
[dmtsai@study ~]$ crontab -l 0 12 * * * mail -s "at 12:00" dmtsai < /home/dmtsai/.bashrc 59 23 1 5 * mail kiki < /home/dmtsai/lover.txt */5 * * * * /home/dmtsai/test.sh 30 16 * * 5 mail friend@his.server.name < /home/dmtsai/friend.txt # 注意,若仅想要移除一项工作而已的话,必须要用 crontab -e 去编辑~ # 如果想要全部的工作都移除,才使用 crontab -r 喔! [dmtsai@study ~]$ crontab -r [dmtsai@study ~]$ crontab -l no crontab for dmtsai
看到了吗? crontab 『整个内容都不见了!』所以请注意:『如果只是要删除某个 crontab 的工作项目,那么请使用 crontab -e 来重新编辑即可!』如果使用 -r 的参数,是会将所有的 crontab 数据内容都删掉的!千万注意了!
这个『 crontab -e 』是针对用户的 cron 来设计的,如果是『系统的例行性任务』时, 该怎么办呢?是否还是需要以 crontab -e 来管理你的例行性工作调度呢?当然不需要,你只要编辑 /etc/crontab 这个文件就可以啦!有一点需要特别注意喔!那就是 crontab -e 这个 crontab 其实是 /usr/bin/crontab 这个运行档,但是 /etc/crontab 可是一个『纯文本档』喔!你可以 root 的身份编辑一下这个文件哩!
基本上, cron 这个服务的最低侦测限制是『分钟』,所以『 cron 会每分钟去读取一次 /etc/crontab 与 /var/spool/cron 里面的数据内容 』,因此,只要你编辑完 /etc/crontab 这个文件,并且将他保存之后,那么 cron 的设置就自动的会来运行了!
废话少说,我们就来看一下这个 /etc/crontab 的内容吧!
[root@study ~]# cat /etc/crontab SHELL=/bin/bash <==使用哪种 shell 接口 PATH=/sbin:/bin:/usr/sbin:/usr/bin <==运行档搜索路径 MAILTO=root <==若有额外STDOUT,以 email将数据送给谁 # Example of job definition: # .---------------- minute (0 - 59) # | .------------- hour (0 - 23) # | | .---------- day of month (1 - 31) # | | | .------- month (1 - 12) OR jan,feb,mar,apr ... # | | | | .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat # | | | | | # * * * * * user-name command to be executed
看到这个文件的内容你大概就了解了吧!呵呵,没错!这个文件与将刚刚我们下达 crontab -e 的内容几乎完全一模一样!只是有几个地方不太相同:
这个项目是说,当 /etc/crontab 这个文件中的例行性工作的指令发生错误时,或者是该工作的运行结果有 STDOUT/STDERR 时,会将错误消息或者是屏幕显示的消息传给谁?缺省当然是由系统直接寄发一封 mail 给 root 啦!不过, 由于 root 并无法在用户端中以 POP3 之类的软件收信,因此,鸟哥通常都将这个 e-mail 改成自己的帐号,好让我随时了解系统的状况!例如: MAILTO=dmtsai@my.host.name
还记得我们在第十章的 BASH 当中一直提到的运行档路径问题吧! 没错啦!这里就是输入运行档的搜索路径!使用缺省的路径设置就已经很足够了!
这个 /etc/crontab 里面可以设置的基本语法与 crontab -e 不太相同喔!前面同样是分、时、日、月、周五个字段, 但是在五个字段后面接的并不是指令,而是一个新的字段,那就是『运行后面那串指令的身份』为何!这与用户的 crontab -e 不相同。由于用户自己的 crontab 并不需要指定身份,但 /etc/crontab 里面当然要指定身份啦!以上表的内容来说,系统缺省的例行性工作是以 root 的身份来进行的。
一般来说,crond 缺省有三个地方会有运行脚本设置档,他们分别是:
这三个地方中,跟系统的运作比较有关系的两个设置档是放在 /etc/crontab 文件内以及 /etc/cron.d/* 目录内的文件, 另外一个是跟用户自己的工作比较有关的设置档,就是放在 /var/spool/cron/ 里面的文件群。 现在我们已经知道了 /var/spool/cron 以及 /etc/crontab 的内容,那现在来瞧瞧 /etc/cron.d 里面的东西吧!
[root@study ~]# ls -l /etc/cron.d -rw-r--r--. 1 root root 128 Jul 30 2014 0hourly -rw-r--r--. 1 root root 108 Mar 6 10:12 raid-check -rw-------. 1 root root 235 Mar 6 13:45 sysstat -rw-r--r--. 1 root root 187 Jan 28 2014 unbound-anchor # 其实说真的,除了 /etc/crontab 之外,crond 的设置档还不少耶!上面就有四个设置! # 先让我们来瞧瞧 0hourly 这个设置档的内容吧! [root@study ~]# cat /etc/cron.d/0hourly # Run the hourly jobs SHELL=/bin/bash PATH=/sbin:/bin:/usr/sbin:/usr/bin MAILTO=root 01 * * * * root run-parts /etc/cron.hourly # 瞧一瞧,内容跟 /etc/crontab 几乎一模一样!但实际上是有设置值喔!就是最后一行!
如果你想要自己开发新的软件,该软件要拥有自己的 crontab 定时指令时,就可以将『分、时、日、月、周、身份、指令』的设置档放置到 /etc/cron.d/ 目录下! 在此目录下的文件是『crontab 的设置档脚本』。
另外,请注意一下上面表格中提到的最后一行,每个整点的一分会运行『 run-parts /etc/cron.hourly 』这个指令~咦!那什么是 run-parts 呢? 如果你有去分析一下这个运行档,会发现他就是 shell script,run-parts 脚本会在大约 5 分钟内随机选一个时间来运行 /etc/cron.hourly 目录内的所有运行档!因此,放在 /etc/cron.hourly/ 的文件,必须是能被直接运行的指令脚本, 而不是分、时、日、月、周的设置值喔!注意注意!
也就是说,除了自己指定分、时、日、月、周加上指令路径的 crond 设置档之外,你也可以直接将指令放置到(或链接到)/etc/cron.hourly/ 目录下, 则该指令就会被 crond 在每小时的 1 分开始后的 5 分钟内,随机取一个时间点来运行啰!你无须手动去指定分、时、日、月、周就是了。
但是眼尖的朋友可能还会发现,除了可以直接将指令放到 /etc/cron.hourly/ 让系统每小时定时运行之外,在 /etc/ 底下其实还有 /etc/cron.daily/, /etc/cron.weekly/, /etc/cron.monthly/,那三个目录是代表每日、每周、每月各运行一次的意思吗?嘿嘿! 厉害喔!没错~是这样~不过,跟 /etc/cron.hourly/ 不太一样的是,那三个目录是由 anacron 所运行的,而 anacron 的运行方式则是放在 /etc/cron.hourly/0anacron 里面耶~跟前几代 anacron 是单独的 service 不太一样喔!这部份留待下个小节再来讨论。
最后,让我们总结一下吧:
有的时候,我们以系统的 cron 来进行例行性工作的创建时,要注意一些使用方面的特性。 举例来说,如果我们有四个工作都是五分钟要进行一次的,那么是否这四个动作全部都在同一个时间点进行? 如果同时进行,该四个动作又很耗系统资源,如此一来,每五分钟的某个时刻不是会让系统忙得要死? 呵呵!此时好好的分配一些运行时间就 OK 啦!所以,注意一下:
当大量使用 crontab 的时候,总是会有问题发生的,最严重的问题就是『系统资源分配不均』的问题, 以鸟哥的系统为例,我有侦测主机流量的信息,包括:
如果每个流程都在同一个时间启动的话,那么在某个时段时,我的系统会变的相当的繁忙,所以,这个时候就必须要分别设置啦!我可以这样做:
[root@study ~]# vim /etc/crontab
1,6,11,16,21,26,31,36,41,46,51,56 * * * * root CMD1
2,7,12,17,22,27,32,37,42,47,52,57 * * * * root CMD2
3,8,13,18,23,28,33,38,43,48,53,58 * * * * root CMD3
4,9,14,19,24,29,34,39,44,49,54,59 * * * * root CMD4
看到了没?那个『 , 』分隔的时候,请注意,不要有空白字符!(连续的意思)如此一来, 则可以将每五分钟工作的流程分别在不同的时刻来工作!则可以让系统的运行较为顺畅呦!
另外一个困扰发生在『 当有运行成果或者是运行的项目中有输出的数据时,该数据将会 mail 给 MAILTO 设置的帐号 』,好啦,那么当有一个调度一直出错(例如 DNS 的侦测系统当中,若 DNS 上层主机挂掉,那么你就会一直收到错误消息!)怎么办?呵呵!还记得第十章谈到的数据流重导向吧? 直接以『数据流重导向』将输出的结果输出到 /dev/null 这个垃圾桶当中就好了!
很多时候被植入木马都是以例行命令的方式植入的,所以可以借由检查 /var/log/cron 的内容来视察是否有『非您设置的 cron 被运行了?』这个时候就需要小心一点啰!
另一个需要注意的地方在于:『你可以分别以周或者是日月为单位作为循环,但你不可使用「几月几号且为星期几」的模式工作』。 这个意思是说,你不可以这样编写一个工作调度:
30 12 11 9 5 root echo "just test" <==这是错误的写法
本来你以为九月十一号且为星期五才会进行这项工作,无奈的是,系统可能会判定每个星期五作一次,或每年的 9 月 11 号分别进行,如此一来与你当初的规划就不一样了~所以啰,得要注意这个地方!
想像一个环境,你的 Linux 服务器有一个工作是需要在每周的星期天凌晨 2 点进行,但是很不巧的,星期六停电了~所以你得要星期一才能进公司去启动服务器。 那么请问,这个星期天的工作调度还要不要进行?因为你开机的时候已经是星期一,所以星期天的工作当然不会被进行,对吧!
问题是,若是该工作非常重要 (例如例行备份), 所以其实妳还是希望在下个星期天之前的某天还是进行一下比较好~那你该怎办?自己手动运行?如果你跟鸟哥一样是个记忆力超差的家伙,那么肯定『记不起来某个重要工作要进行』的啦! 这时候就得要靠 anacron 这个指令的功能了!这家伙可以主动帮你进行时间到了但却没有运行的调度喔!
anacron 并不是用来取代 crontab 的,anacron 存在的目的就在于我们上头提到的,在处理非 24 小时一直启动的 Linux 系统的 crontab 的运行! 以及因为某些原因导致的超过时间而没有被运行的调度工作。
其实 anacron 也是每个小时被 crond 运行一次,然后 anacron 再去检测相关的调度任务有没有被运行,如果有超过期限的工作在, 就运行该调度任务,运行完毕或无须运行任何调度时,anacron 就停止了。
由于 anacron 缺省会以一天、七天、一个月为期去侦测系统未进行的 crontab 任务,因此对于某些特殊的使用环境非常有帮助。 举例来说,如果你的 Linux 主机是放在公司给同仁使用的,因为周末假日大家都不在所以也没有必要打开, 因此你的 Linux 是周末都会关机两天的。但是 crontab 大多在每天的凌晨以及周日的早上进行各项任务, 偏偏你又关机了,此时系统很多 crontab 的任务就无法进行。 anacron 刚好可以解决这个问题!
那么 anacron 又是怎么知道我们的系统啥时关机的呢?这就得要使用 anacron 读取的时间记录档 (timestamps) 了! anacron 会去分析现在的时间与时间记录档所记载的上次运行 anacron 的时间,两者比较后若发现有差异, 那就是在某些时刻没有进行 crontab 啰!此时 anacron 就会开始运行未进行的 crontab 任务了!
anacron 其实是一支程序并非一个服务!这支程序在 CentOS 当中已经进入 crontab 的调度喔!同时 anacron 会每个小时被主动运行一次喔! 咦!每个小时?所以 anacron 的设置档应该放置在 /etc/cron.hourly 吗?嘿嘿!您真内行~赶紧来瞧一瞧:
[root@study ~]# cat /etc/cron.hourly/0anacron #!/bin/sh # Check whether 0anacron was run today already if test -r /var/spool/anacron/cron.daily; then day=`cat /var/spool/anacron/cron.daily` fi if [ `date +%Y%m%d` = "$day" ]; then exit 0; fi # 上面的语法在检验前一次运行 anacron 时的时间戳记! # Do not run jobs when on battery power if test -x /usr/bin/on_ac_power; then /usr/bin/on_ac_power >/dev/null 2>&1 if test $? -eq 1; then exit 0 fi fi /usr/sbin/anacron -s # 所以其实也仅是运行 anacron -s 的指令!因此我们得来谈谈这支程序!
基本上, anacron 的语法如下:
[root@study ~]# anacron [-sfn] [job].. [root@study ~]# anacron -u [job].. 选项与参数: -s :开始一连续的运行各项工作 (job),会依据时间记录档的数据判断是否进行; -f :强制进行,而不去判断时间记录档的时间戳记; -n :立刻进行未进行的任务,而不延迟 (delay) 等待时间; -u :仅更新时间记录档的时间戳记,不进行任何工作。 job :由 /etc/anacrontab 定义的各项工作名称。
在我们的 CentOS 中,anacron 的进行其实是在每个小时都会被抓出来运行一次, 但是为了担心 anacron 误判时间参数,因此 /etc/cron.hourly/ 里面的 anacron 才会在文件名之前加个 0 (0anacron),让 anacron 最先进行!就是为了让时间戳记先更新!以避免 anacron 误判 crontab 尚未进行任何工作的意思。
接下来我们看一下 anacron 的设置档: /etc/anacrontab 的内容好了:
[root@study ~]# cat /etc/anacrontab SHELL=/bin/sh PATH=/sbin:/bin:/usr/sbin:/usr/bin MAILTO=root RANDOM_DELAY=45 # 随机给予最大延迟时间,单位是分钟 START_HOURS_RANGE=3-22 # 延迟多少个小时内应该要运行的任务时间 1 5 cron.daily nice run-parts /etc/cron.daily 7 25 cron.weekly nice run-parts /etc/cron.weekly @monthly 45 cron.monthly nice run-parts /etc/cron.monthly 天数 延迟时间 工作名称定义 实际要进行的指令串 # 天数单位为天;延迟时间单位为分钟;工作名称定义可自订,指令串则通常与 crontab 的设置相同! [root@study ~]# more /var/spool/anacron/* :::::::::::::: /var/spool/anacron/cron.daily :::::::::::::: 20150731 :::::::::::::: /var/spool/anacron/cron.monthly :::::::::::::: 20150703 :::::::::::::: /var/spool/anacron/cron.weekly :::::::::::::: 20150727 # 上面则是三个工作名称的时间记录档以及记录的时间戳记
我们拿 /etc/cron.daily/ 那一行的设置来说明好了。那四个字段的意义分别是:
根据上面的设置档内容,我们大概知道 anacron 的运行流程应该是这样的 (以 cron.daily 为例):
如此一来,放置在 /etc/cron.daily/ 内的任务就会在一天后一定会被运行的!因为 anacron 是每个小时被运行一次嘛! 所以,现在你知道为什么隔了一阵子才将 CentOS 开机,开机过后约 1 小时左右系统会有一小段时间的忙碌!而且硬盘会跑个不停!那就是因为 anacron 正在运行过去 /etc/cron.daily/, /etc/cron.weekly/, /etc/cron.monthly/ 里头的未进行的各项工作调度啦!这样对 anacron 有没有概念了呢? ^_^
最后,我们来总结一下本章谈到的许多设置档与目录的关系吧!这样我们才能了解 crond 与 anacron 的关系:
也就是说,如果你每个周日的需要运行的动作是放置于 /etc/crontab 的话,那么该动作只要过期了就过期了,并不会被抓回来重新运行。但如果是放置在 /etc/cron.weekly/ 目录下,那么该工作就会定期,几乎一定会在一周内运行一次~如果你关机超过一周,那么一开机后的数个小时内,该工作就会主动的被运行喔! 真的吗?对啦!因为 /etc/anacrontab 的定义啦!
*/3 * * * * root /usr/local/ping.sh > /dev/null 2>&1