Linux下的任务调度分为两类,系统任务调度和用户任务调度。

系统任务调度:系统周期性所要实行的事情,比如写缓存数据到硬盘、日志清理等。
用户任务调度:用户定期要实行的事情,比如用户数据备份、定时邮件提醒等。
用户可以利用 crontab 工具来定制自己的操持任务。
所有用户定义的crontab 文件都被保存在 /var/spool/cron目录中。
其文件名与用户名同等。

关于crontab的用场,在企业实际运用中非常广泛,常见的有定时数据备份、定时系统检测、定时数据网络、定时更新配置、定时天生报表等等。

二、crontab运用实例

1、crontab利用格式

crontab不执行php关于Linux下的crontab你不知道的那些常识点 SQL

crontab常用的利用格式有如下两种:

crontab [-u user] [file]crontab [-u user] [-e|-l|-r |-i]

选项含义如下:

-u user:用来设定某个用户的crontab做事,例如,“-u ixdba”表示设定ixdba用户的crontab做事,此参数一样平常有root用户来运行。
file:file是命令文件的名字,表示将file做为crontab的任务列表文件并载入crontab。
如果在命令行中没有指定这个文件,crontab命令将接管标准输入(键盘)上键入的命令,并将它们载入crontab。
-e:编辑某个用户的crontab文件内容。
如果不指定用户,则表示编辑当前用户的crontab文件。
-l:显示某个用户的crontab文件内容,如果不指定用户,则表示显示当前用户的crontab文件内容。
-r:从/var/spool/cron目录中删除某个用户的crontab文件,如果不指定用户,则默认删除当前用户的crontab文件。
-i:在删除用户的crontab文件时给确认提示。

2、crontab文件语法

用户所建立的crontab文件中,每一行都代表一项任务,每行的每个字段代表一项设置,它的格式共分为六个字段,前五段是韶光设定段,第六段是要实行的命令段,格式如下:

minute hour day month week command

个中:

? minute: 表示分钟,可以是从0到59之间的任何整数。

? hour:表示小时,可以是从0到23之间的任何整数。

? day:表示日期,可以是从1到31之间的任何整数。

? month:表示月份,可以是从1到12之间的任何整数。

? week:表示星期几,可以是从0到7之间的任何整数,这里的0或7代表星期日。

? command:要实行的命令,可以是系统命令,也可以是自己编写的脚本文件。

在以上各个字段中,还可以利用以下分外字符:

? 星号():代表所有可能的值,例如month字段如果是星号,则表示在知足其它字段的制约条件后每月都实行该命令操作。

? 逗号(,):可以用逗号隔开的值指定一个列表范围,例如,“1,2,5,7,8,9”

? 中杠(-):可以用整数之间的中杠表示一个整数范围,例如“2-6”表示“2,3,4,5,6”

? 正斜线(/):可以用正斜线指定时间的间隔频率,例如“0-23/2”表示每两小时实行一次。
同时正斜线可以和星号一起利用,例如/10,如果用在minute字段,表示每十分钟实行一次。

3、几个crontab例子

0 /3 /usr/local/apache2/apachectl restart

表示每隔3个小时重启apache做事一次。

30 3 6 /webdata/bin/backup.sh

表示每周六的3点30分实行/webdata/bin/backup.sh脚本的操作。

0 0 1,20 fsck /dev/sdb8

表示每个月的1号和20号检讨/dev/sdb8磁盘设备。

10 5 /5 echo "">/usr/local/apache2/log/access_log

表示每个月的5号、10号、15号、20号、25号、30号的5点10分实行清理apache日志操作。

三、系统级任务调度/etc/crontab

在/etc目录下有一个crontab文件,这个便是系统任务调度的配置文件。

/etc/crontab文件包括下面几行:

SHELL=/bin/bashPATH=/sbin:/bin:/usr/sbin:/usr/binMAILTO=rootHOME=/# run-parts01 root run-parts /etc/cron.hourly02 4 root run-parts /etc/cron.daily22 4 0 root run-parts /etc/cron.weekly42 4 1 root run-parts /etc/cron.monthly

从上面的示例文件可看出,crontab的任务列表紧张由两部分组成:环境变量配置与定时任务配置。
可能大家在事情中更多是只用到了任务配置部分。

前四行是用来配置crond任务运行的环境变量,第一行SHELL变量指定了系统要利用哪个shell,这里是bash,第二行PATH变量指定了系统实行命令的路径,第三行MAILTO变量指定了crond的任务实行信息将通过电子邮件发送给root用户,如果MAILTO变量的值为空,则表示不发送任务实行信息给用户,第四行的HOME变量指定了在实行命令或者脚本时利用的主目录。
第六至九行便是crontab实行格式的详细写法。

四、crontab调试解析神器

常日在利用crontab添加任务时,我们会依赖自己已有知识编写定时语句。
当须要测试语句是否精确时,还须要在做事器上不断调试,,这种办法太不高效了。
有没有一款工具,只要我们给出语句,就能见告详细实行韶光以及对错呢?还真有,下面先容一款老外开拓的crontab在线解析工具。

工具地址:https://crontab.guru

给出这个工具的截图如下:

好用不好用,你试试就知道。

五、crontab利用的各种坑

1、环境变量问题

当我们刚利用crontab时,运维老鸟们一样平常会奉告所有命令只管即便都利用绝对路径,以防缺点。
这是为什么?这就和我们下面要谈的环境变量有关了。

首先,获取shell终端环境变量,内容如下:

[root@SparkWorker1 dylogs]# envXDG_SESSION_ID=1629HOSTNAME=SparkWorker1TERM=linuxSHELL=/bin/bashHISTSIZE=1000SSH_CLIENT=172.16.213.132 50080 22HADOOP_PREFIX=/opt/hadoop/currentCATALINA_BASE=/opt/hadoop/current/share/hadoop/httpfs/tomcatSSH_TTY=/dev/pts/1QT_GRAPHICSSYSTEM_CHECKED=1USER=rootMAIL=/var/spool/mail/rootPATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/java/default/bin:/opt/hadoop/current/bin:/opt/hadoop/current/sbin:/root/binPWD=/data/dylogsLANG=zh_CN.UTF-8HOME=/root

要获取crontab环境变量信息,可以设置如下操持任务:

/usr/bin/env > /tmp/env.txt

等待少焉,env.txt输出内容如下:

[root@SparkWorker1 dylogs]# cat /tmp/env.txtXDG_SESSION_ID=1729SHELL=/bin/shUSER=rootPATH=/usr/bin:/binPWD=/rootLANG=zh_CN.UTF-8SHLVL=1HOME=/rootLOGNAME=rootXDG_RUNTIME_DIR=/run/user/0_=/usr/bin/env

从上面输出结果可知,shell命令行的PATH值为

PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/java/default/bin:/opt/hadoop/current/bin:/opt/hadoop/current/sbin:/root/bin

而crontab中的PATH值为:

PATH=/usr/bin:/bin

比拟crontab环境变量与shell终端环境变量的输出,可以创造两者的差异很大。
大家可能碰着过,在shell命令行实行脚本都没有问题,而放到crontab后却实行非常,或者实行失落败,此时,我们就须要考虑是否命令涉及的环境变量在crontab和shell命令行间存在差异。

例如,我们在crontab中实行了如下定时任务:

20 16 php autosave.php

而如果我们的php是安装在/usr/local/bin/目录下的话,那么上面这个定时任务由于无法找到php命令,会运行失落败。

那么,知道了环境变量问题,可能导致操持任务无法正常实行,怎么才能避免这个问题呢,这个交给大家一个终极大招,可以在crontab中加入如下配置,担保你的操持任务实行不会涌现环境变量问题:

source /$HOME/.bash_profile && command

这个实在是在实行操持任务命令之前,先加载了用户环境变量信息,由此可担保所有环境变量都可正常加载。

2、定时韶光配置误区

韶光是crontab的核心,轻微配置不当,就会涌现问题,先看在整点韶光设置时可能涌现的缺点,例如,设定每天2点实行一次任务,很多朋友可能这么写过:

2 command

很明显,这个韶光写法是缺点的,当我们听到每天2点实行一次某任务时,很多人会把重点放在2点,而忽略了实行一次的需求。
上面这个定时任务他会在2点开始实行,每分钟实行一次,统共实行60次。

精确的写法该当是这样的:

0 2 command

这个才表示每天2点0分实行command对应的任务。

3、分外符号%问题

%在crontab中是分外符号,详细含义如下:

第一个%表示标准输入的开始,别的%表示换行符,看下面两个例子:

cat >> /tmp/cat.txt 2>&1 % stdin out

查看/tmp/cat.txt的内容为:

stdin out

再看下面这个例子:

cat >> /tmp/cat1.txt 2>&1 % stdin out 1 % stdin out 2 % stdin out 3

查看 /tmp/cat1.txt的内容如下:

stdin out 1stdin out 2stdin out 3

有输出内容可知,第一个%表示标准输入的开始,别的%表示换行符。

既然"%"是分外字符,那么在crontab中利用时,就要特殊把稳,怎么利用这些分外字符呢,很明显,利用转移字符即可,例如:

cat >> /tmp/cat2.txt 2>&1 % Special character escape \%.

查看输出/tmp/cat2.txt 输出内容如下:

Special character escape %.

可以看到,实行成功了,并成功避开这个坑了。

4、关于crontab的输出重定向

在crontab实行的操持任务中,有些任务如果不做输出重定向,那么原来会输出到屏幕的信息,会以邮件的形式输出到某个文件中,例如,实行下面这个操持任务:

/bin/date

这个操持任务是没有做输出重定向的,他的紧张用场是输出韶光,由于没有配置输出重定向,那么这个韶光信息默认将以邮件的形式输出到/var/spool/mail/$USER(这个$USER对应的是系统用户,这里是root用户)文件中,大致内容如下:

From root@SparkWorker1.localdomain Fri Sep 21 12:58:02 2022Return-Path: <root@SparkWorker1.localdomain>X-Original-To: rootDelivered-To: root@SparkWorker1.localdomainReceived: by SparkWorker1.localdomain (Postfix, from userid 0)id F2745192AE; Fri, 21 Sep 2022 12:58:01 +0800 (CST)From: "(Cron Daemon)" <root@SparkWorker1.localdomain>To: root@SparkWorker1.localdomainSubject: Cron <root@SparkWorker1> /bin/dateContent-Type: text/plain; charset=UTF-8Auto-Submitted: auto-generatedPrecedence: bulkX-Cron-Env: <XDG_SESSION_ID=1820>X-Cron-Env: <XDG_RUNTIME_DIR=/run/user/0>X-Cron-Env: <LANG=zh_CN.UTF-8>X-Cron-Env: <SHELL=/bin/sh>X-Cron-Env: <HOME=/root>X-Cron-Env: <PATH=/usr/bin:/bin>X-Cron-Env: <LOGNAME=root>X-Cron-Env: <USER=root>Message-Id: <20220921045801.F2745192AE@SparkWorker1.localdomain>Date: Fri, 21 Sep 2022 12:58:01 +0800 (CST)2022年 09月 21日 星期五 12:58:01 CST

由此可见,输出内容还是很多的,如碰着任务有大量输出的话,会占用大量磁盘空间,显然,这个邮件输出最好关闭,怎么关闭呢,只需设置MAILTO环境变量为空即可,上面的操持任务,可做如下修正:

MAILTO="" /bin/date

这样,就不会发邮件信息到/var/spool/mail/$USER下了,但是问题并没有彻底办理,关闭mail功能后,输出内容将连续写入到/var/spool/clientmqueue中,长期下去,可能占满分区的inode资源,导致任务无法实行。

为了避免此类问题发生,建议任务都加上输出重定向,例如,可以在crontab文件中设置如下形式,忽略日志输出:

0 /3 /usr/local/apache2/apachectl restart >/dev/null 2>&1

个中,“/dev/null 2>&1”表示先将标准输出重定向到/dev/null,然后将标准缺点重定向到标准输出,由于标准输出已经重定向到了/dev/null,因此标准缺点也会重定向到/dev/null,这样日志输出问题就办理了。

5、调试crontab问题的一样平常思路

要办理crontab干系非常问题,可按照如下思路进行调试:

(1)、通过/var/log/cron日志确认任务是否实行

(2)、如未实行则剖析定时语句,是否是环境变量问题、分外字符问题、韶光配置问题、权限问题等。

(3)、确认crond做事开启,如果定时语句也精确,检讨crond做事是否开启。

Systemd办法(centos7及以上)

[root@SparkWorker1 spool]# systemctl status crond.service

SysVinit办法(centos7以下)

[root@SparkWorker1 spool]# service crond status

(4)确认定时任务中命令是否实行成功

这个问题可通过输出获取缺点信息进行调试,方法便是利用重定向获取输出,然后进行剖析。
举例如下:

python /usr/local/dyserver/dypos.py >> /tmp/dypos.log 2>&1

通过加上“/tmp/dypos.log 2>&1”,就可以很快定位问题,由于这个dypos.py脚本在实行的时候会把缺点信息都输出到dypos.log 中,接着查看dypos.log文件,问题一览无余:

[root@SparkWorker1 spool]# cat /tmp/dypos.log/bin/sh: python: 未找到命令/bin/sh: python: 未找到命令

显示python命令没有找到,很明显的就可以确定是环境变量的问题。
这种办法定位问题非常有效。