整个 Linux 系统下的开关机流程介绍,以及开机管理软件的介绍
系统开机其实是一项非常复杂的进程,因为内核得要侦测硬件并加载适当的驱动程序后, 接下来则必须要调用进程来准备好系统运作的环境,以让用户能够顺利的操作整部主机系统。 如果你能够理解开机的原理,那么将有助于你在系统出问题时能够很快速的修复系统喔! 而且还能够顺利的配置多重操作系统的多重开机问题。为了多重开机的问题,你就不能不学学 grub 这个 Linux 底下优秀的开机管理程序 (boot loader)。 而在系统运作期间,你也得要学会管理内核模块呢!
开机不是只要按一下电源钮而关机只要关掉电源钮就可以了吗?有何大学问?话是这样没错啦,但是由于 Linux 是一套多人多任务的操作系统,你难保你在关机时没有人在在线,如果你关机的时候碰巧一大群人在在线工作, 那会让当时在在线工作的人马上断线的!那不是害死人了!一些数据可是无价之宝哩!
另外 Linux 在运行的时候,虽然你在画面上只会看到黑压压的一片,完全没有任何画面, 但其实他是有很多的进程在背景底下运行的,例如注册表管控程序、前面提到的例行性工作调度等, 当然还有一大堆网络服务,如邮件服务器、WWW 服务器等等。你如果随便关机的话, 是很容易伤害硬盘及数据传输的动作的!所以在 Linux 下关机可是一门大学问喔。
既然开机是很严肃的一件事,那我们就来了解一下整个开机的过程吧! 好让大家比较容易发现开机过程里面可能会发生问题的地方,以及出现问题后的解决之道! 不过,由于开机的过程中,那个开机管理程序 (Boot Loader) 使用的软件可能不一样,例如目前各大 Linux distributions 的主流为 grub,但早期 Linux 缺省是使用 LILO ,台湾地区则很多朋友喜欢使用 spfdisk 。 但无论如何,我们总是得要了解整个 boot loader 的工作情况,才能了解为何进行多重开机的设置时, 老是听人家讲要先安装 Windows 再安装 Linux 的原因~
假设以个人电脑架设的 Linux 主机为例 (先回到第零章计算机概论看看相关的硬件常识喔), 当你按下电源按键后电脑硬件会主动的读取 BIOS 来加载硬件信息及进行硬件系统的自我测试, 之后系统会主动的去读取第一个可开机的设备 (由 BIOS 设置的) ,此时就可以读入开机管理程序了。
开机管理程序可以指定使用哪个内核文件来开机,并实际加载内核到内存当中解压缩与运行, 此时内核就能够开始在内存内活动,并侦测所有硬件信息与加载适当的驱动程序来使整部主机开始运作, 等到内核侦测硬件与加载驱动程序完毕后,一个最阳春的操作系统就开始在你的 PC 上面跑了。
主机系统开始运作后,此时 Linux 才会调用外部程序开始准备软件运行的环境, 并且实际的加载所有系统运作所需要的软件程序哩!最后系统就会开始等待你的登录与操作啦! 简单来说,系统开机的经过可以汇整成底下的流程的:
大概的流程就是上面写的那个样子啦,你会发现 init 这个家伙占的比重非常重! 所以我们才会在第十七章的 pstree 指令中谈到这家伙。 那每一个进程的内容主要是在干嘛呢?底下就分别来谈一谈吧!
我们在第三章曾经谈过简单的开机流程与 MBR 的功能, 当时为了多重开机而进行的简短的介绍。现在你已经有足够的 Linux 基础了,所以底下让我们来加强说明啦!
我们在第零章的计算机概论就曾谈过电脑主机架构, 在个人电脑架构下,你想要启动整部系统首先就得要让系统去加载 BIOS (Basic Input Output System),并通过 BIOS 程序去加载 CMOS 的信息,并且借由 CMOS 内的设置值取得主机的各项硬件设置, 例如 CPU 与周边设备的沟通时脉啊、开机设备的搜索顺序啊、硬盘的大小与类型啊、 系统时间啊、各周边总线的是否启动 Plug and Play (PnP, 随插即用设备) 啊、 各周边设备的 I/O 地址啊、以及与 CPU 沟通的 IRQ 岔断等等的信息。
在取得这些信息后,BIOS 还会进行开机自我测试 (Power-on Self Test, POST) (注1)。 然后开始运行硬件侦测的初始化,并设置 PnP 设备,之后再定义出可开机的设备顺序, 接下来就会开始进行开机设备的数据读取了 (MBR 相关的任务开始)。
由于我们的系统软件大多放置到硬盘中嘛!所以 BIOS 会指定开机的设备好让我们可以读取磁盘中的操作系统内核文件。 但由于不同的操作系统他的文件系统格式不相同,因此我们必须要以一个开机管理程序来处理内核文件加载 (load) 的问题, 因此这个开机管理程序就被称为 Boot Loader 了。那这个 Boot Loader 程序安装在哪里呢?就在开机设备的第一个磁区 (sector) 内,也就是我们一直谈到的 MBR (Master Boot Record, 主要开机记录区)。
那你会不会觉得很奇怪啊?既然内核文件需要 loader 来读取,那每个操作系统的 loader 都不相同, 这样的话 BIOS 又是如何读取 MBR 内的 loader 呢?很有趣的问题吧!其实 BIOS 是通过硬件的 INT 13 中断功能来读取 MBR 的,也就是说,只要 BIOS 能够侦测的到你的磁盘 (不论该磁盘是 SATA 还是 IDE 接口),那他就有办法通过 INT 13 这条信道来读取该磁盘的第一个磁区内的 MBR 啦!(注2) 这样 boot loader 也就能够被运行啰!
刚刚说到 Loader 的最主要功能是要认识操作系统的文件格式并据以加载内核到主内存中去运行。 由于不同操作系统的文件格式不一致,因此每种操作系统都有自己的 boot loader 啦!用自己的 loader 才有办法加载内核文件嘛!那问题就来啦,你应该有听说过多重操作系统吧?也就是在一部主机上面安装多种不同的操作系统。 既然你 (1)必须要使用自己的 loader 才能够加载属于自己的操作系统内核,而 (2)系统的 MBR 只有一个,那你怎么会有办法同时在一部主机上面安装 Windows 与 Linux 呢?
这就得要回到第八章的磁盘文件系统去回忆一下文件系统功能了。 其实每个文件系统 (filesystem, 或者是 partition) 都会保留一块开机磁区 (boot sector) 提供操作系统安装 boot loader , 而通常操作系统缺省都会安装一份 loader 到他根目录所在的文件系统的 boot sector 上。如果我们在一部主机上面安装 Windows 与 Linux 后,该 boot sector, boot loader 与 MBR 的相关性会有点像下图:
如上图所示,每个操作系统缺省是会安装一套 boot loader 到他自己的文件系统中 (就是每个 filesystem 左下角的方框),而在 Linux 系统安装时,你可以选择将 boot loader 安装到 MBR 去,也可以选择不安装。 如果选择安装到 MBR 的话,那理论上你在 MBR 与 boot sector 都会保有一份 boot loader 程序的。 至于 Windows 安装时,他缺省会主动的将 MBR 与 boot sector 都装上一份 boot loader!所以啦, 你会发现安装多重操作系统时,你的 MBR 常常会被不同的操作系统的 boot loader 所覆盖啦! ^_^
我们刚刚提到的两个问题还是没有解决啊!虽然各个操作系统都可以安装一份 boot loader 到他们的 boot sector 中, 这样操作系统可以通过自己的 boot loader 来加载内核了。问题是系统的 MBR 只有一个哩! 你要怎么运行 boot sector 里面的 loader 啊?这个我们得要回忆一下第三章约略提过的 boot loader 的功能了。boot loader 主要的功能如下:
由于具有菜单功能,因此我们可以选择不同的内核来开机。而由于具有控制权转交的功能,因此我们可以加载其他 boot sector 内的 loader 啦!不过 Windows 的 loader 缺省不具有控制权转交的功能,因此你不能使用 Windows 的 loader 来加载 Linux 的 loader 喔!这也是为啥第三章谈到 MBR 与多重开机时,会特别强调先装 Windows 再装 Linux 的缘故。 我们将上述的三个功能以底下的图标来解释你就看的懂了!(与第三章的图标也非常类似啦!)
如上图所示,我的 MBR 使用 Linux 的 grub 这个开机管理程序,并且里面假设已经有了三个菜单, 第一个菜单可以直接指向 Linux 的内核文件并且直接加载内核来开机;第二个菜单可以将开机管理程序控制权交给 Windows 来管理,此时 Windows 的 loader 会接管开机流程,这个时候他就能够启动 windows 了。第三个菜单则是使用 Linux 在 boot sector 内的开机管理程序,此时就会跳出另一个 grub 的菜单啦!了解了吗?
而最终 boot loader 的功能就是『加载 kernel 文件』啦!
当我们借由 boot loader 的管理而开始读取内核文件后,接下来, Linux 就会将内核解压缩到主内存当中, 并且利用内核的功能,开始测试与驱动各个周边设备,包括保存设备、CPU、网络卡、声卡等等。 此时 Linux 内核会以自己的功能重新侦测一次硬件,而不一定会使用 BIOS 侦测到的硬件信息喔!也就是说,内核此时才开始接管 BIOS 后的工作了。 那么内核文件在哪里啊?一般来说,他会被放置到 /boot 里面,并且取名为 /boot/vmlinuz 才对!
[root@www ~]# ls --format=single-column -F /boot config-2.6.18-92.el5 <==此版本内核被编译时选择的功能与模块设置档 grub/ <==就是开机管理程序 grub 相关数据目录 initrd-2.6.18-92.el5.img <==虚拟文件系统档! System.map-2.6.18-92.el5 <==内核功能放置到内存地址的对应表 vmlinuz-2.6.18-92.el5 <==就是内核文件啦!最重要者!
从上表我们也可以知道此版本的 Linux 内核为 2.6.18-92.el5 这个版本!为了硬件开发商与其他内核功能开发者的便利, 因此 Linux 内核是可以通过动态加载内核模块的 (就请想成驱动程序即可),这些内核模块就放置在 /lib/modules/ 目录内。 由于模块放置到磁盘根目录内 (要记得 /lib 不可以与 / 分别放在不同的 partition !), 因此在开机的过程中内核必须要挂载根目录,这样才能够读取内核模块提供加载驱动程序的功能。 而且为了担心影响到磁盘内的文件系统,因此开机过程中根目录是以唯读的方式来挂载的喔。
一般来说,非必要的功能且可以编译成为模块的内核功能,目前的 Linux distributions 都会将他编译成为模块。 因此 USB, SATA, SCSI... 等磁盘设备的驱动程序通常都是以模块的方式来存在的。 现在来思考一种情况,假设你的 linux 是安装在 SATA 磁盘上面的,你可以通过 BIOS 的 INT 13 取得 boot loader 与 kernel 文件来开机,然后 kernel 会开始接管系统并且侦测硬件及尝试挂载根目录来取得额外的驱动程序。
问题是,内核根本不认识 SATA 磁盘,所以需要加载 SATA 磁盘的驱动程序, 否则根本就无法挂载根目录。但是 SATA 的驱动程序在 /lib/modules 内,你根本无法挂载根目录又怎么读取到 /lib/modules/ 内的驱动程序?是吧!非常的两难吧!在这个情况之下,你的 Linux 是无法顺利开机的! 那怎办?没关系,我们可以通过虚拟文件系统来处理这个问题。
虚拟文件系统 (Initial RAM Disk) 一般使用的文件名为 /boot/initrd ,这个文件的特色是,他也能够通过 boot loader 来加载到内存中, 然后这个文件会被解压缩并且在内存当中仿真成一个根目录, 且此仿真在内存当中的文件系统能够提供一支可运行的程序,通过该程序来加载开机过程中所最需要的内核模块, 通常这些模块就是 USB, RAID, LVM, SCSI 等文件系统与磁盘接口的驱动程序啦!等加载完成后, 会帮助内核重新调用 /sbin/init 来开始后续的正常开机流程。
如上图所示,boot loader 可以加载 kernel 与 initrd ,然后在内存中让 initrd 解压缩成为根目录, kernel 就能够借此加载适当的驱动程序,最终释放虚拟文件系统,并挂载实际的根目录文件系统, 就能够开始后续的正常开机流程。更详细的 initrd 说明,你可以自行使用 man initrd 去查阅看看。 底下让我们来了解一下 CentOS 5.x 的 initrd 文件内容有什么吧! ^_^
# 1. 先将 /boot/initrd 拷贝到 /tmp/initrd 目录中,等待解压缩: [root@www ~]# mkdir /tmp/initrd [root@www ~]# cp /boot/initrd-2.6.18-92.el5.img /tmp/initrd/ [root@www ~]# cd /tmp/initrd [root@www initrd]# file initrd-2.6.18-92.el5.img initrd-2.6.18-92.el5.img: gzip compressed data, ... # 原来是 gzip 的压缩档!因为是 gzip ,所以扩展名给他改成 .gz 吧! # 2. 将上述的文件解压缩: [root@www initrd]# mv initrd-2.6.18-92.el5.img initrd-2.6.18-92.el5.gz [root@www initrd]# gzip -d initrd-2.6.18-92.el5.gz [root@www initrd]# file initrd-2.6.18-92.el5 initrd-2.6.18-92.el5: ASCII cpio archive (SVR4 with no CRC) # 搞了老半天,原来还是 cpio 的指令压缩成的文件啊!解压缩看看! # 3. 用 cpio 解压缩 [root@www initrd]# cpio -ivcdu < initrd-2.6.18-92.el5 [root@www initrd]# ll drwx------ 2 root root 4096 Apr 10 02:05 bin drwx------ 3 root root 4096 Apr 10 02:05 dev drwx------ 2 root root 4096 Apr 10 02:05 etc -rwx------ 1 root root 1888 Apr 10 02:05 init -rw------- 1 root root 5408768 Apr 10 02:00 initrd-2.6.18-92.el5 drwx------ 3 root root 4096 Apr 10 02:05 lib drwx------ 2 root root 4096 Apr 10 02:05 proc lrwxrwxrwx 1 root root 3 Apr 10 02:05 sbin -> bin drwx------ 2 root root 4096 Apr 10 02:05 sys drwx------ 2 root root 4096 Apr 10 02:05 sysroot # 看!是否很像根目录!尤其也是有 init 这个运行档!务必看一下权限! # 接下来看看 init 这个文件内有啥咚咚? # 4. 观察 init 文件内较重要的运行项目 [root@www initrd]# cat init #!/bin/nash <==使用类似 bash 的 shell 来运行 mount -t proc /proc /proc <==挂载内存的虚拟文件系统 ....(中间省略).... echo Creating initial device nodes mknod /dev/null c 1 3 <==创建系统所需要的各项设备! ....(中间省略).... echo "Loading ehci-hcd.ko module" insmod /lib/ehci-hcd.ko <==加载各项内核模块,就是驱动程序! ....(中间省略).... echo Creating root device. mkrootdev -t ext3 -o defaults,ro hdc2 <==尝试挂载根目录啦! ....(底下省略)....
嘿嘿!通过上述运行档的内容,我们可以知道 initrd 有加载模块并且尝试挂载了虚拟文件系统。 接下来就能够顺利的运作啦!那么是否一定需要 initrd 呢?
例题:
是否没有 initrd 就无法顺利开机?
答:
不见得的!需要 initrd 最重要的原因是,当开机时无法挂载根目录的情况下,
此时就一定需要 initrd ,例如你的根目录在特殊的磁盘接口 (USB, SATA, SCSI) ,
或者是你的文件系统较为特殊 (LVM, RAID) 等等,才会需要 initrd。
如果你的 Linux 是安装在 IDE 接口的磁盘上,并且使用缺省的 ext2/ext3 文件系统, 那么不需要 initrd 也能够顺利的开机进入 Linux 的! |
在内核完整的加载后,您的主机应该就开始正确的运作了,接下来,就是要开始运行系统的第一支程序: /sbin/init。
在内核加载完毕、进行完硬件侦测与驱动程序加载后,此时你的主机硬件应该已经准备就绪了 (ready) , 此时内核会主动的调用第一支程序,那就是 /sbin/init 啰。这也是为啥第十七章的 pstree 指令介绍时,你会发现 init 的 PID 号码是一号啦。 /sbin/init 最主要的功能就是准备软件运行的环境,包括系统的主机名称、网络设置、语系处理、文件系统格式及其他服务的启动等。 而所有的动作都会通过 init 的设置档,亦即是 /etc/inittab 来规划,而 inittab 内还有一个很重要的设置项目,那就是缺省的 runlevel (开机运行等级) 啦!
那么什么是 run level 呢?他有什么功用啊?其实很简单啦, Linux 就是借由设置 run level 来规定系统使用不同的服务来启动,让 Linux 的使用环境不同。基本上,依据有无网络与有无 X Window 而将 run level 分为 7 个等级,分别是:
由于 run level 0, 4, 6 不是关机、重新开机就是系统保留的,所以:『 您当然不能将缺省的 run level 设置为这三个值 』, 否则系统就会不断的自动关机或自动重新开机.... 好了,那么我们开机时,到底是如何取得系统的 run level 的?当然是 /etc/inittab 所设置的啰! 那么 /etc/inittab 到底有什么信息呢?我们先来看看这个文件的内容好了:
[root@www ~]# vim /etc/inittab id:5:initdefault: <==缺省的 runlevel 设置, 此 runlevel 为 5 si::sysinit:/etc/rc.d/rc.sysinit <==准备系统软件运行的环境的脚本运行档 # 7 个不同 run level 的,需要启动的服务的 scripts 放置路径: l0:0:wait:/etc/rc.d/rc 0 <==runlevel 0 在 /etc/rc.d/rc0.d/ l1:1:wait:/etc/rc.d/rc 1 <==runlevel 1 在 /etc/rc.d/rc1.d/ l2:2:wait:/etc/rc.d/rc 2 <==runlevel 2 在 /etc/rc.d/rc2.d/ l3:3:wait:/etc/rc.d/rc 3 <==runlevel 3 在 /etc/rc.d/rc3.d/ l4:4:wait:/etc/rc.d/rc 4 <==runlevel 4 在 /etc/rc.d/rc4.d/ l5:5:wait:/etc/rc.d/rc 5 <==runlevel 5 在 /etc/rc.d/rc5.d/ l6:6:wait:/etc/rc.d/rc 6 <==runlevel 6 在 /etc/rc.d/rc6.d/ # 是否允许按下 [ctrl]+[alt]+[del] 就重新开机的设置项目: ca::ctrlaltdel:/sbin/shutdown -t3 -r now # 底下两个设置则是关于不断电系统的 (UPS),一个是没电力时的关机,一个是复电的处理 pf::powerfail:/sbin/shutdown -f -h +2 "Power Failure; System Shutting Down" pr:12345:powerokwait:/sbin/shutdown -c "Power Restored; Shutdown Cancelled" 1:2345:respawn:/sbin/mingetty tty1 <==其实 tty1~tty6 是由底下这六行决定的。 2:2345:respawn:/sbin/mingetty tty2 3:2345:respawn:/sbin/mingetty tty3 4:2345:respawn:/sbin/mingetty tty4 5:2345:respawn:/sbin/mingetty tty5 6:2345:respawn:/sbin/mingetty tty6 x:5:respawn:/etc/X11/prefdm -nodaemon <==X window 则是这行决定的!
让我们解析一下这个文件吧!首先,这个文件的语法是利用冒号 (:) 将设置分隔成为四个字段,每个字段的意义与说明如下:
[设置项目]:[run level]:[init 的动作行为]:[指令项目]
inittab 设置值 | 意义说明 |
initdefault | 代表缺省的 run level 设置值 |
sysinit | 代表系统初始化的动作项目 |
ctrlaltdel | 代表 [ctrl]+[alt]+[del] 三个按键是否可以重新开机的设置 |
wait | 代表后面字段设置的指令项目必须要运行完毕才能继续底下其他的动作 |
respawn | 代表后面字段的指令可以无限制的再生 (重新启动)。举例来说, tty1 的 mingetty 产生的可登录画面, 在你注销而结束后,系统会再开一个新的可登录画面等待下一个登录。 |
事实上 /etc/inittab 的设置也有点类似 shell script 啦,因为该文件内容的设置也是一行一行的从上往下处理的, 因此我们可以知道 CentOS 的 init 依据 inittab 设置的处理流程会是:
现在你可以知道为啥 [ctrl]+[alt]+[del] 可以重新开机而我们缺省提供 6 个虚拟终端机 (tty1~tty6) 给你使用了吧!由于整个设置都是依据 /etc/inittab 来决定的,因此如果你想要修改任何细节的话, 可以这样做喔:
所以说,你现在会自行修改登录时的缺省 run level 设置值了吗?够简单的吧? 一般来说,我们缺省都是 3 或者是 5 来作为缺省的 run level 的。但有时后可能需要进入 run level 1, 也就是单人维护模式的环境当中。这个 run level 1 有点像是 Windows 系统当中的『安全模式』啦, 专门用来处理当系统有问题时的操作环境。此外,当系统发现有问题时,举例来说,不正常关机造成 filesystem 的不一致现象时,系统会主动的进入单人维护模式呢!
好了, init 在取得 run level 之后,接下来要干嘛? 上面 /etc/inittab 文件内容不是有提到 sysinit 吗?准备初始化系统了吧!
还记得上面提到 /etc/inittab 里头有这一句『 si::sysinit:/etc/rc.d/rc.sysinit 』吧? 这表示:『我开始加载各项系统服务之前,得先做好整个系统环境,我主要利用 /etc/rc.d/rc.sysinit 这个 shell script 来设置好我的系统环境的。』够清楚了吧? 所以,我想要知道到底 CentOS 开机的过程当中帮我进行了什么动作,就得要仔细的分析 /etc/rc.d/rc.sysinit 啰。
如果你使用 vim 去查阅过 /etc/rc.d/rc.sysinit 的话,那么可以发现他主要的工作大抵有这几项:
在 /etc/rc.d/rc.sysinit 将基本的系统设置数据都写好了,也将系统的数据设置完整! 而如果你想要知道到底开机的过程中发生了什么事情呢?那么就运行『 dmesg 』吧。 另外,基本上,在这个文件当中所进行的很多任务作的缺省设置档,其实都在 /etc/sysconfig/ 当中呢! 所以,请记得将 /etc/sysconfig/ 内的文件好好的瞧一瞧喔! ^_^
在这个过程当中,比较值得注意的是自订模块的加载!在 CentOS 当中,如果我们想要加载内核模块的话, 可以将整个模块写入到 /etc/sysconfig/modules/*.modules 当中,在该目录下, 只要记得文件名最后是以 .modules 结尾即可。 这个过程是非必要的,因为我们目前的缺省模块实在已经很够用了,除非是您的主机硬件实在太新了, 非要自己加载新的模块不可,否则,在经过 /etc/rc.d/rc.sysinit 的处理后, 你的主机系统应该是已经跑得很顺畅了啦!就等着你将系统相关的服务与网络服务启动啰!
加载内核让整个系统准备接受指令来工作,再经过 /etc/rc.d/rc.sysinit 的系统模块与相关硬件信息的初始化后,你的 CentOS 系统应该已经顺利工作了。 只是,我们还得要启动系统所需要的各项『服务』啊!这样主机才能提供我们相关的网络或者是主机功能嘛! 这个时候,依据我们在 /etc/inittab 里面提到的 run level 设置值,就可以来决定启动的服务项目了。 举例来说,使用 run level 3 当然就不需要启动 X Window 的相关服务啰,您说是吧?
那么各个不同的 run level 服务启动的各个 shell script 放在哪?还记得 /etc/inittab 里面提到的:
l0:0:wait:/etc/rc.d/rc 0 l1:1:wait:/etc/rc.d/rc 1 l2:2:wait:/etc/rc.d/rc 2 l3:3:wait:/etc/rc.d/rc 3 l4:4:wait:/etc/rc.d/rc 4 l5:5:wait:/etc/rc.d/rc 5 <==本例中,以此项目来解释 l6:6:wait:/etc/rc.d/rc 6
上面提到的就是各个 run level 要运行的各项脚本放置处啦!主要是通过 /etc/rc.d/rc 这个指令来处理相关任务! 由于鸟哥使用缺省的 runlevel 5 ,因此我们主要针对上述特殊字体那行来解释好了: /etc/rc.d/rc 5 的意义是这样的 (建议您自行使用 vim 去观察一下 /etc/rc.d/rc 这个文件,你会更有概念!):
通过上面的说明我们可以知道所有的项目都与 /etc/rc5.d/ 有关,那么我们就来瞧瞧这个目录下有些什么玩意儿吧!
[root@www ~]# ll /etc/rc5.d/ lrwxrwxrwx 1 root root 16 Sep 4 2008 K02dhcdbd -> ../init.d/dhcdbd ....(中间省略).... lrwxrwxrwx 1 root root 14 Sep 4 2008 K91capi -> ../init.d/capi lrwxrwxrwx 1 root root 23 Sep 4 2008 S00microcode_ctl -> ../init.d/microcode_ctl lrwxrwxrwx 1 root root 22 Sep 4 2008 S02lvm2-monitor -> ../init.d/lvm2-monitor ....(中间省略).... lrwxrwxrwx 1 root root 17 Sep 4 2008 S10network -> ../init.d/network ....(中间省略).... lrwxrwxrwx 1 root root 11 Sep 4 2008 S99local -> ../rc.local lrwxrwxrwx 1 root root 16 Sep 4 2008 S99smartd -> ../init.d/smartd ....(底下省略)....
在这个目录下的文件很有趣,主要具有几个特点:
我们在第十八章谈过服务的启动主要是以『/etc/init.d/服务文件名 {start,stop}』来启动与关闭的,那么通过刚刚 /etc/rc.d/rc 程序的解说,我们可以清楚的了解到了 /etc/rc5.d/[SK]xx 其实就是跑到 /etc/init.d/ 去找到相对应的服务脚本, 然后分别进行 start (Sxx) 或 stop (Kxx) 的动作而已啦!举例来说,以上述的表格内的 K91capi 及 S10network 为例好了, 通过 /etc/rc.d/rc 5 的运行,这两个文件会这样进行:
所以说,你有想要启动该 runlevel 时就运行的服务,那么利用 Sxx 并指向 /etc/init.d/ 的特定服务启动脚本后, 该服务就能够在开机时启动啦!就这么简单!问题是,你需要自行处理这个 K, S 开头的链接档吗? 并不需要的,第十八章谈到的 chkconfig 就是在负责处理这个链接档啦!这样有没有跟第十八章的观念串在一起了呢? ^_^
那么为什么 K 与 S 后面要有数字呢?因为各不同的服务其实还是互有关系的。举例来说,如果要启动 WWW 服务,总是得要有网络吧?所以 /etc/init.d/network 就会比较先被启动啦!那么您就会知道在 S 或者是 K 后面接的数字是啥意思了吧?嘿嘿,那就是运行的顺序啦!那么哪个文件被最后运行呢? 看到最后一个被运行的项目是啥?没错,就是 S99local ,亦即是: /etc/rc.d/rc.local 这个文件啦!
在完成缺省 runlevel 指定的各项服务的启动后,如果我还有其他的动作想要完成时,举例来说, 我还想要寄一封 mail 给某个系统管理帐号,通知他,系统刚刚重新开机完毕,那么是否应该要制作一个 shell script 放置在 /etc/init.d/ 里面,然后再以链接方式链接到 /etc/rc5.d/ 里面呢?呵呵!当然不需要!还记得上一小节提到的 /etc/rc.d/rc.local 吧? 这个文件就可以运行您自己想要运行的系统指令了。
也就是说,我有任何想要在开机时就进行的工作时,直接将他写入 /etc/rc.d/rc.local , 那么该工作就会在开机的时候自动被加载喔!而不必等我们登录系统去启动呢! 是否很方便啊!一般来说,鸟哥就很喜欢把自己制作的 shell script 完整文件名写入 /etc/rc.d/rc.local ,如此一来,开机就会将我的 shell script 运行过,真是好棒那!
在完成了系统所有服务的启动后,接下来 Linux 就会启动终端机或者是 X Window 来等待用户登录啦! 实际参考的项目是 /etc/inittab 内的这一段:
1:2345:respawn:/sbin/mingetty tty1 2:2345:respawn:/sbin/mingetty tty2 3:2345:respawn:/sbin/mingetty tty3 4:2345:respawn:/sbin/mingetty tty4 5:2345:respawn:/sbin/mingetty tty5 6:2345:respawn:/sbin/mingetty tty6 x:5:respawn:/etc/X11/prefdm -nodaemon
这一段代表,在 run level 2, 3, 4, 5 时,都会运行 /sbin/mingetty 这个咚咚, 而且运行六个,这也是为何我们 Linux 会提供『六个纯文本终端机』的设置所在啊! 因为 mingetty 就是在启动终端机的指令说。
要注意的是那个 respawn 的 init 动作项目,他代表『当后面的指令被终止 (terminal) 时, init 会主动的重新启动该项目。』这也是为何我们登录 tty1 终端机接口后,以 exit 离开后, 系统还是会重新显示等待用户输入的画面的原因啊!
如果改天您不想要有六个终端机时,可以取消某些终端机接口吗?当然可以啊! 就将上面表格当中的某些项目注解掉即可!例如不想要 tty5 与 tty6 ,就将那两行注解, 则下次重新开机后,您的 Linux 就只剩下『 F1 ~ F4 』有效而已,这样说,可以了解吧!!^_^
至于如果我们使用的是 run level 5 呢?那么除了这六个终端机之外, init 还会运行 /etc/X11/prefdm -nodaemon 那个指令喔!该指令我们会在第二十四章、X Window 再来详谈! 他主要的功能就是在启动 X Window 啦!
我们在 /sbin/init 的运作过程中有谈到许多运行脚本,包括 /etc/rc.d/rc.sysinit 以及 /etc/rc.d/rc 等等, 其实这些脚本都会使用到相当多的系统设置档,这些开机过程会用到的设置档则大多放置在 /etc/sysconfig/ 目录下。 同时,由于内核还是需要加载一些驱动程序 (内核模块),此时系统自订的设备与模块对应档 (/etc/modprobe.conf) 就显的挺重要了喔!
还记得我们在 /etc/rc.d/rc.sysinit 当中谈到的加载用户自订模块的地方吗?就是在 /etc/sysconfig/modules/ 目录下啊! 虽然内核提供的缺省模块已经很足够我们使用了,但是,某些条件下我们还是得对模块进行一些参数的规划, 此时就得要使用到 /etc/modprobe.conf 啰!举例来说,鸟哥的 CentOS 主机的 modprobe.conf 有点像这样:
[root@www ~]# cat /etc/modprobe.conf alias eth0 8139too <==让 eth0 使用 8139too 的模块 alias scsi_hostadapter pata_sis alias snd-card-0 snd-trident options snd-card-0 index=0 <==额外指定 snd-card-0 的参数功能 options snd-trident index=0
这个文件大多在指定系统内的硬件所使用的模块啦!这个文件通常系统是可以自行产生的,所以你不必手动去订正他! 不过,如果系统捉到错误的驱动程序,或者是你想要使用更新的驱动程序来对应相关的硬件配备时, 你就得要自行手动的处理一下这个文件了。
以上表的第一行为例,鸟哥使用螃蟹卡 (Realtek 的芯片组) 来作为我的网络卡,那螃蟹卡使用的模块就是 8139too 啦!这样看的懂了吧?当我要启动网络卡时,系统会跑到这个文件来查阅一下,然后加载 8139too 驱动程序来驱动网络卡啰!更多的相关说明,请 man modprobe.conf 喔!
不说您也知道,整个开机的过程当中,老是读取的一些服务的相关设置档都是记录在 /etc/sysconfig 目录下的!那么该目录底下有些啥玩意儿?我们找几个重要的文件来谈谈:
总而言之一句话,这个目录下的文件很重要的啦!开机过程里面常常会读取到的!
在我们完成上面的所有信息后,其实整个 Linux 主机就已经在等待我们用户的登录啦! 但是,相信您应该还是会有一点疑问的地方,那就是:『我该如何切换 run level 呢?』会不会很难啊?不会啦!很简单~但是依据运行的时间而有不同的方式啊!
事实上,与 run level 有关的启动其实是在 /etc/rc.d/rc.sysinit 运行完毕之后。也就是说,其实 run level 的不同仅是 /etc/rc[0-6].d 里面启动的服务不同而已。不过,依据开机是否自动进入不同 run level 的设置,我们可以说:
假设原本我们是以 run level 5 登录系统的,但是因为某些因素,想要切换成为 run level 3 时, 该怎么办呢?很简单啊,运行『 init 3 』即可切换。但是 init 3 这个动作到底做了什么呢? 我们不是说了吗?事实上,不同的 run level 只是加载的服务不同罢了, 亦即是 /etc/rc5.d/ 还有 /etc/rc3.d 内的 Sxxname 与 Kxxname 有差异而已。 所以说,当运行 init 3 时,系统会:
也就是说,两个 run level 都存在的服务就不会被关闭啦!如此一来,就很容易切换 run level 了, 而且还不需要重新开机呢!真方便。那我怎么知道目前的 run level 是多少呢? 直接在 bash 当中输入 runlevel 即可啊!
[root@www ~]# runlevel N 5 # 左边代表前一个 runlevel ,右边代表目前的 runlevel。 # 由于之前并没有切换过 runlevel ,因此前一个 runlevel 不存在 (N)
# 将目前的 runlevel 切换成为 3 (注意, tty7 的数据会消失!) [root@www ~]# init 3 NIT: Sending processes the TERM signal Applying Intel CPU microcode update: [ OK ] Starting background readahead: [ OK ] Starting irqbalance: [ OK ] Starting httpd: [ OK ] Starting anacron: [ OK ] # 这代表,新的 runlevel 亦即是 runlevel3 比前一个 runlevel 多出了上述 5 个服务 [root@www ~]# runlevel 5 3 # 看吧!前一个是 runlevel 5 ,目前的是 runlevel 3 啦!
那么你能不能利用 init 来进行关机与重新开机呢?可以的啦!利用『 init 0 』就能够关机, 而『 init 6 』就能够重新开机!为什么?往前翻一下 runlevel 的定义即可了解吧!
谈完了整个开机的流程,您应该会知道,在整个开机的过程当中,是否能够成功的驱动我们主机的硬件配备, 是内核 (kernel) 的工作!而内核一般都是压缩档,因此在使用内核之前,就得要将他解压缩后, 才能加载主内存当中。
另外,为了应付日新月异的硬件,目前的内核都是具有『可读取模块化驱动程序』的功能, 亦即是所谓的『 modules (模块化)』的功能啦!所谓的模块化可以将他想成是一个『插件程序』, 该插件程序可能由硬件开发厂商提供,也有可能我们的内核本来就支持~不过,较新的硬件, 通常都需要硬件开发商提供驱动程序模块啦!
那么内核与内核模块放在哪?
如果该内核被顺利的加载系统当中了,那么就会有几个信息纪录下来:
问题来啦,如果我有个新的硬件,偏偏我的操作系统不支持,该怎么办?很简单啊!
上面第一点还很好理解,反正就是重新编译内核就是了。不过,内核编译很不容易啊! 我们会在后续章节约略介绍内核编译的整个进程。比较有趣的则是将该硬件的驱动程序编译成为模块啦! 关于编译的方法,可以参考后续的第二十二章、原代码与 tarball的介绍。 我们这个章节仅是说明一下,如果想要加载一个已经存在的模块时,该如何是好?
既然要处理内核模块,自然就得要了解了解我们内核提供的模块之间的相关性啦! 基本上,内核模块的放置处是在 /lib/modules/$(uname -r)/kernel 当中,里面主要还分成几个目录:
arch :与硬件平台有关的项目,例如 CPU 的等级等等; crypto :内核所支持的加密的技术,例如 md5 或者是 des 等等; drivers :一些硬件的驱动程序,例如显卡、网络卡、PCI 相关硬件等等; fs :内核所支持的 filesystems ,例如 vfat, reiserfs, nfs 等等; lib :一些函数库; net :与网络有关的各项协定数据,还有防火墙模块 (net/ipv4/netfilter/*) 等等; sound :与音效有关的各项模块;
如果要我们一个一个的去检查这些模块的主要信息,然后定义出他们的相依性, 我们可能会疯掉吧!所以说,我们的 Linux 当然会提供一些模块相依性的解决方案啰~ 对啦!那就是检查 /lib/modules/$(uname -r)/modules.dep 这个文件啦!他记录了在内核支持的模块的各项相依性。
那么这个文件如何创建呢?挺简单!利用 depmod 这个指令就可以达到创建该文件的需求了!
[root@www ~]# depmod [-Ane] 选项与参数: -A :不加任何参数时, depmod 会主动的去分析目前内核的模块,并且重新写入 /lib/modules/$(uname -r)/modules.dep 当中。若加入 -A 参数时,则 depmod 会去搜索比 modules.dep 内还要新的模块,如果真找到新模块,才会更新。 -n :不写入 modules.dep ,而是将结果输出到屏幕上(standard out); -e :显示出目前已加载的不可运行的模块名称 范例一:若我做好一个网络卡驱动程序,文件名为 a.ko,该如何更新内核相依性? [root@www ~]# cp a.ko /lib/modules/$(uname -r)/kernel/drivers/net [root@www ~]# depmod
以上面的范例一为例,我们的 Linux kernel 2.6.x 版本的内核模块扩展名一定是 .ko 结尾的, 当你使用 depmod 之后,该程序会跑到模块标准放置目录 /lib/modules/$(uname -r)/kernel , 并依据相关目录的定义将全部的模块捉出来分析,最终才将分析的结果写入 modules.dep 文件中的呐! 这个文件很重要喔!因为他会影响到本章稍后会介绍的 modprobe 指令的应用!
那你到底晓不晓得目前内核加载了多少的模块呢?粉简单啦!利用 lsmod 即可!
[root@www ~]# lsmod Module Size Used by autofs4 24517 2 hidp 23105 2 ....(中间省略).... 8139too 28737 0 8139cp 26305 0 mii 9409 2 8139too,8139cp <==mii 还被 8139cp, 8139too 使用 ....(中间省略).... uhci_hcd 25421 0 <==底下三个是 USB 相关的模块! ohci_hcd 23261 0 ehci_hcd 33357 0
使用 lsmod 之后,系统会显示出目前已经存在于内核当中的模块,显示的内容包括有:
也就是说,模块其实真的有相依性喔!举上表为例, mii 这个模块会被 8139too 所使用。 简单的说,就是『当你要加载 8139too 时,需要先加载 mii 这个模块才可以顺利的加载 8139too』的意思。 那么除了显示出目前的模块外,我还可以查阅每个模块的信息吗?举例来说,我们知道 8139too 是螃蟹卡的驱动程序,那么 mii 是什么咚咚?就用 modinfo 来观察吧!
[root@www ~]# modinfo [-adln] [module_name|filename] 选项与参数: -a :仅列出作者名称; -d :仅列出该 modules 的说明 (description); -l :仅列出授权 (license); -n :仅列出该模块的详细路径。 范例一:由上个表格当中,请列出 mii 这个模块的相关信息: [root@www ~]# modinfo mii filename: /lib/modules/2.6.18-92.el5/kernel/drivers/net/mii.ko license: GPL description: MII hardware support library author: Jeff Garzik <jgarzik@pobox.com> srcversion: 16DCEDEE4B5629C222C352D depends: vermagic: 2.6.18-92.el5 SMP mod_unload 686 REGPARM 4KSTACKS gcc-4.1 # 可以看到这个模块的来源,以及该模块的简易说明!(是硬件支持函数库) 范例二:我有一个模块名称为 a.ko ,请问该模块的信息为? [root@www ~]# modinfo a.ko ....(省略)....
事实上,这个 modinfo 除了可以『查阅在内核内的模块』之外,还可以检查『某个模块文件』, 因此,如果你想要知道某个文件代表的意义为何,利用 modinfo 加上完整文件名吧! 看看就晓得是啥玩意儿啰! ^_^
好了,如果我想要自行手动加载模块,又该如何是好?有很多方法啦,最简单而且建议的,是使用 modprobe 这个指令来加载模块, 这是因为 modprobe 会主动的去搜索 modules.dep 的内容,先克服了模块的相依性后, 才决定需要加载的模块有哪些,很方便。至于 insmod 则完全由用户自行加载一个完整文件名的模块, 并不会主动的分析模块相依性啊!
[root@www ~]# insmod [/full/path/module_name] [parameters] 范例一:请尝试加载 cifs.ko 这个『文件系统』模块 [root@www ~]# insmod /lib/modules/$(uname -r)/kernel/fs/cifs/cifs.ko [root@www ~]# lsmod | grep cifs cifs 212789 0
他立刻就将该模块加载啰~但是 insmod 后面接的模块必须要是完整的『文件名』才行!那如何移除这个模块呢?
[root@www ~]# rmmod [-fw] module_name 选项与参数: -f :强制将该模块移除掉,不论是否正被使用; -w :若该模块正被使用,则 rmmod 会等待该模块被使用完毕后,才移除他! 范例一:将刚刚加载的 cifs 模块移除! [root@www ~]# rmmod cifs 范例二:请加载 vfat 这个『文件系统』模块 [root@www ~]# insmod /lib/modules/$(uname -r)/kernel/fs/vfat/vfat.ko insmod: error inserting '/lib/modules/2.6.18-92.el5/kernel/fs/vfat/vfat.ko': -1 Unknown symbol in module # 无法加载 vfat 这个模块啊!伤脑筋!
使用 insmod 与 rmmod 的问题就是,你必须要自行找到模块的完整文件名才行,而且如同上述范例二的结果, 万一模块有相依属性的问题时,你将无法直接加载或移除该模块呢!所以近年来我们都建议直接使用 modprobe 来处理模块加载的问题,这个指令的用法是:
[root@www ~]# modprobe [-lcfr] module_name 选项与参数: -c :列出目前系统所有的模块!(更详细的代号对应表) -l :列出目前在 /lib/modules/`uname -r`/kernel 当中的所有模块完整文件名; -f :强制加载该模块; -r :类似 rmmod ,就是移除某个模块啰~ 范例一:加载 cifs 模块 [root@www ~]# modprobe cifs # 很方便吧!不需要知道完整的模块文件名,这是因为该完整文件名已经记录到 # /lib/modules/`uname -r`/modules.dep 当中的缘故啊!如果要移除的话: [root@www ~]# modprobe -r cifs
使用 modprobe 真的是要比 insmod 方便很多!因为他是直接去搜索 modules.dep 的纪录, 所以啰,当然可以克服模块的相依性问题,而且还不需要知道该模块的详细路径呢! 好方便! ^_^
例题:
尝试使用 modprobe 加载 vfat 这个模块,并且观察该模块的相关模块是哪个?
答:
我们使用 modprobe 来加载,再以 lsmod 来观察与 grep 截取关键字看看:
[root@www ~]# modprobe vfat [root@www ~]# lsmod | grep vfat vfat 15809 0 fat 51165 1 vfat <==原来就是 fat 这个模块啊! [root@www ~]# modprobe -r vfat <==测试完移除此模块 |
这个文件我们之前已经谈过了,这里只是再强调一下而已,如果您想要修改某些模块的额外参数设置, 就在这个文件内设置吧!我们假设一个案例好了,假设我的网络卡 eth0 是使用 ne , 但是 eth1 同样也使用 ne ,为了避免同一个模块会导致网络卡的错乱, 因此,我可以先找到 eth0 与 eth1 的 I/O 与 IRQ ,假设:
则:
[root@www ~]# vi /etc/modprobe.conf
alias eth0 ne
alias eth1 ne
options eth0 io=0x300 irq=5
options eth1 io=0x320 irq=7
嘿嘿!如此一来,我的 Linux 就不会捉错网络卡的对应啰!因为被我强制指定某个 I/O 咯嘛! ^_^
在看完了前面的整个开机流程,以及内核模块的整理之后,你应该会发现到一件事情, 那就是『 boot loader 是加载内核的重要工具』啊!没有 boot loader 的话,那么 kernel 根本就没有办法被系统加载的呢!所以,底下我们会先谈一谈 boot loader 的功能, 然后再讲一讲现阶段 Linux 里头最主流的 grub 这个 boot loader 吧!
我们在第一小节开机流程的地方曾经讲过,在 BIOS 读完信息后,接下来就是会到第一个开机设备的 MBR 去读取 boot loader 了。这个 boot loader 可以具有菜单功能、直接加载内核文件以及控制权移交的功能等, 系统必须要有 loader 才有办法加载该操作系统的内核就是了。但是我们都知道, MBR 是整个硬盘的第一个 sector 内的一个区块,充其量整个大小也才 446 bytes 而已。 我们的 loader 功能这么强,光是代码与设置数据不可能只占不到 446 bytes 的容量吧?那如何安装?
为了解决这个问题,所以 Linux 将 boot loader 的代码运行与设置值加载分成两个阶段 (stage) 来运行:
那么这些设置档是放在哪里啊?这些与 grub 有关的文件都放置到 /boot/grub 中,那我们就来看看有哪些文件吧!
[root@www ~]# ls -l /boot/grub -rw-r--r-- device.map <==grub 的设备对应档(底下会谈到) -rw-r--r-- e2fs_stage1_5 <==ext2/ext3 文件系统之定义档 -rw-r--r-- fat_stage1_5 <==FAT 文件系统之定义档 -rw-r--r-- ffs_stage1_5 <==FFS 文件系统之定义档 -rw------- grub.conf <==grub 在 Red Hat 的设置档 -rw-r--r-- iso9660_stage1_5 <==光驱文件系统定义档 -rw-r--r-- jfs_stage1_5 <==jfs 文件系统定义档 lrwxrwxrwx menu.lst -> ./grub.conf <==其实 menu.lst 才是设置档! -rw-r--r-- minix_stage1_5 <==minix 文件系统定义档 -rw-r--r-- reiserfs_stage1_5 <==reiserfs 文件系统定义档 -rw-r--r-- splash.xpm.gz <==开机时在 grub 底下的背景图标 -rw-r--r-- stage1 <==stage 1 的相关说明 -rw-r--r-- stage2 <==stage 2 的相关说明 -rw-r--r-- ufs2_stage1_5 <==UFS 的文件系统定义档 -rw-r--r-- vstafs_stage1_5 <==vstafs 文件系统定义档 -rw-r--r-- xfs_stage1_5 <==xfs 文件系统定义档
从上面的说明你可以知道 /boot/grub/ 目录下最重要的就是设置档 (menu.lst) 以及各种文件系统的定义! 我们的 loader 读取了这种文件系统定义数据后,就能够认识文件系统并读取在该文件系统内的内核文件啰。 至于 grub 的设置档文件名,其实应该是 menu.lst 的,只是在 Red Hat 里面被定义成为 /boot/grub.conf 而已。 鸟哥建议您还是记忆 menu.lst 比较好喔!
所以从上面的文件来看, grub 认识的文件系统真的非常多喔!正因为如此,所以 grub 才会取代 Lilo 这个老牌的 boot loader 嘛!好了,接下来就来瞧瞧设置档内有啥设置值吧!
grub 是目前使用最广泛的 Linux 开机管理程序,旧的 Lilo 这个开机管理程序现在已经很少见了, 所以本章才会将 Lilo 的介绍舍弃的说。grub 的优点挺多的,包括有:
上面第三点其实就是 Stage 1, Stage 2 分别安装在 MBR (主程序) 与文件系统当中 (设置档与定义档) 的原因啦! 好了,接下来,让我们好好了解一下 grub 的设置档: /boot/grub/menu.lst 这玩意儿吧! 要注意喔,那个 lst 是 LST 的小写,不要搞错啰!
安装在 MBR 的 grub 主程序,最重要的任务之一就是从磁盘当中加载内核文件, 以让内核能够顺利的驱动整个系统的硬件。所以啰, grub 必须要认识硬盘才行啊!那么 grub 到底是如何认识硬盘的呢? 嘿嘿! grub 对硬盘的代号设置与传统的 Linux 磁盘代号可完全是不同的!grub 对硬盘的识别使用的是如下的代号:
(hd0,0)
够神了吧?跟 /dev/hda1 风马牛不相干~怎么办啊?其实只要注意几个东西即可,那就是:
所以说,第一颗『搜索到的硬盘』代号为:『(hd0)』,而该颗硬盘的第一号分区为『(hd0,0)』,这样说了解了吧? 反正你要记得,在 grub 里面,他开始的数字是 0 而不是 1 就是了!
所以说,整个硬盘代号为:
硬盘搜索顺序 | 在 Grub 当中的代号 |
第一颗 | (hd0) (hd0,0) (hd0,1) (hd0,4).... |
第二颗 | (hd1) (hd1,0) (hd1,1) (hd1,4).... |
第三颗 | (hd2) (hd2,0) (hd2,1) (hd2,4).... |
这样应该比较好看出来了吧?第一颗硬盘的 MBR 安装处的硬盘代号就是『(hd0)』, 而第一颗硬盘的第一个分区的 boot sector 代号就是『(hd0,0)』第一颗硬盘的第一个逻辑分区的 boot sector 代号为『(hd0,4)』瞭了吧!
例题:
假设你的系统仅有一颗 SATA 硬盘,请说明该硬盘的第一个逻辑分区在 Linux 与 grub 当中的文件名与代号:
答:
因为是 SATA 磁盘,加上使用逻辑分区,因此 Linux 当中的文件名为 /dev/sda5 才对 (1~4 保留给 primary 与 extended 使用)。
至于 grub 当中的磁盘代号则由于仅有一颗磁盘,因此代号会是『 (hd0,4) 』才对。
|
了解了 grub 当中最麻烦的硬盘代号后,接下来,我们就可以瞧一瞧设置档的内容了。先看一下鸟哥的 CentOS 内的 /boot/grub/menu.lst 好了:
[root@www ~]# vim /boot/grub/menu.lst default=0 <==缺省开机选项,使用第 1 个开机菜单 (title) timeout=5 <==若 5 秒内未动键盘,使用缺省菜单开机 splashimage=(hd0,0)/grub/splash.xpm.gz <==背景图标所在的文件 hiddenmenu <==读秒期间是否显示出完整的菜单画面(缺省隐藏) title CentOS (2.6.18-92.el5) <==第一个菜单的内容 root (hd0,0) kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet initrd /initrd-2.6.18-92.el5.img
在 title 以前的四行,都是属于 grub 的整体设置,包括缺省的等待时间与缺省的开机项目, 还有显示的画面特性等等。至于 title 后面才是指定开机的内核文件或者是 boot loader 控制权。 在整体设置方面的项目主要常见的有:
整体设置的地方大概是这样,而底下那个 title 则是显示开机的设置项目。如同前一小节提到的,开机时可以选择 (1)直接指定内核文件开机或 (2)将 boot loader 控制权转移到下个 loader (此过程称为 chain-loader)。每个 title 后面接的是『该开机项目名称的显示』,亦即是在菜单出现时,菜单上面的名称而已。 那么这两种方式的设置有啥不同呢?
1. 先指定内核文件放置的 partition,再读取文件 (目录树), 最后才加入文件的实际文件名与路径 (kernel 与 initrd); 鸟哥的 /boot 为 /dev/hda1 ,因此内核文件的设置则成为: root (hd0,0) <==代表内核文件放在那个 partition 当中 kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet initrd /initrd-2.6.18-92.el5.img上面的 root, kernel, initrd 后面接的参数的意义说明如下:
2. 直接指定 partition 与文件名,不需要额外指定内核文件所在设备代号
kernel (hd0,0)/vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet
initrd (hd0,0)/initrd-2.6.18-92.el5.img
老实说,鸟哥比较喜欢这种样式的文件名写法,因为这样我们就能够知道内核文件是在哪个设备内的某个文件名,
而不会去想到我们的根目录 (/, root) 啦!让我们来想想 /boot 有独立分割与无独立分割的情况吧!
例题:
我的系统分割是: /dev/hda1 (/), /dev/hda2 (swap) 而已,且我的内核文件为 /boot/vmlinuz,请问 grub 的 menu.lst
内该如何撰写内核文件位置?
答:
我们使用叠代的方式来了解一下好了。由于内核文件名为 /boot/vmlinuz,转成设备文件名与代号会成为如下的过程:
源文件案: /boot/vmlinuz ↓ Linux 设备:(/dev/hda1)/boot/vmlinuz ↓ grub 设备:(hd0,0)/boot/vmlinuz所以最终的 kernel 写法会变成: kernel (hd0,0)/boot/vmlinuz root=/dev/hda1 ... |
例题:
同上,只是我的分割情况变成: /dev/sda1 (/boot), /dev/sda5 (/) 时?
答:
由于 /boot 被独立出来了,所以情况会不一样喔!如下所示:
源文件案: /boot/vmlinuz ↓ Linux 设备:(/dev/sda1)/vmlinuz ↓ grub 设备:(hd0,0)/vmlinuz所以最终的 kernel 写法会变成: kernel (hd0,0)/vmlinuz root=/dev/sda5 ... |
[root@www ~]# vi /boot/grub/menu.lst ....前略.... title Windows partition root (hd0,0) <==设置使用此分区 chainloader +1 <== +1 可以想成第一个磁区,亦即是 boot sector上面的范例中,我们可以很简单的这样想:那个 (hd0,0) 就是 Windows 的 C 槽所在磁盘, 而 chainloader +1 就是让系统加载该分区当中的第一个磁区 (就是 boot sector) 内的开机管理程序。 不过,由于 Windows 的开机碟需要设置为活化 (active) 状态,且我们的 grub 缺省会去检验该分区的文件系统。 因此我们可以重新将上面的范例改写成这样:
[root@www ~]# vi /boot/grub/menu.lst ....前略.... title Windows partition rootnoverify (hd0,0) <==不检验此分区 chainloader +1 makeactive <==设置此分区为开机碟(active)grub 的功能还不止此,他还能够隐藏某些分区。举例来说,我的 /dev/hda5 是安装 Linux 的分区, 我不想让 Windows 能够认识这个分区时,你可以这样做:
[root@www ~]# vi /boot/grub/menu.lst ....前略.... title Windows partition hide (hd0,4) <==隐藏 (hd0,4) 这个分区 rootnoverify (hd0,0) chainloader +1 makeactive
我们在本章稍早之前『 boot loader 与 kernel 加载』的地方已经提到过 initrd 这玩意儿,他的目的在于提供开机过程中所需要的最重要内核模块,以让系统开机过程可以顺利完成。 会需要 initrd 的原因,是因为内核模块放置于 /lib/modules/$(uname -r)/kernel/ 当中, 这些模块必须要根目录 (/) 被挂载时才能够被读取。但是如果内核本身不具备磁盘的驱动程序时, 当然无法挂载根目录,也就没有办法取得驱动程序,因此造成两难的地步。
initrd 可以将 /lib/modules/.... 内的『开机过程当中一定需要的模块』包成一个文件 (文件名就是 initrd), 然后在开机时通过主机的 INT 13 硬件功能将该文件读出来解压缩,并且 initrd 在内存内会仿真成为根目录, 由于此虚拟文件系统 (Initial RAM Disk) 主要包含磁盘与文件系统的模块,因此我们的内核最后就能够认识实际的磁盘, 那就能够进行实际根目录的挂载啦!所以说:『initrd 内所包含的模块大多是与开机过程有关,而主要以文件系统及硬盘模块 (如 usb, SCSI 等) 为主』的啦!
一般来说,需要 initrd 的时刻为:
一般来说,各 distribution 提供的内核都会附上 initrd 文件,但如果妳有特殊需要所以想重制 initrd 文件的话, 可以使用 mkinitrd 来处理的。这个文件的处理方式很简单, man mkinitrd 就知道了! ^_^。 我们还是简单的介绍一下去!
[root@www ~]# mkinitrd [-v] [--with=模块名称] initrd文件名 内核版本 选项与参数: -v :显示 mkinitrd 的运作过程 --with=模块名称:模块名称指的是模块的名字而已,不需要填写文件名。举例来说, 目前内核版本的 ext3 文件系统模块为底下的文件名: /lib/modules/$(uname -r)/kernel/fs/ext3/ext3.ko 那妳应该要写成: --with=ext3 就好了 (省略 .ko) initrd文件名:妳所要创建的 initrd 文件名,尽量取有意义又好记的名字。 内核版本 :某一个内核的版本,如果是目前的内核则是『 $(uname -r) 』 范例一:以 mkinitrd 的缺省功能创建一个 initrd 虚拟磁盘文件 [root@www ~]# mkinitrd -v initrd_$(uname -r) $(uname -r) Creating initramfs Looking for deps of module ehci-hcd Looking for deps of module ohci-hcd ....(中间省略).... Adding module ehci-hcd <==最终加入 initrd 的就是底下的模块 Adding module ohci-hcd Adding module uhci-hcd Adding module jbd Adding module ext3 Adding module scsi_mod Adding module sd_mod Adding module libata Adding module pata_sis [root@www ~]# ll initrd_* -rw------- 1 root root 2406443 Apr 30 02:55 initrd_2.6.18-92.el5 # 由于目前的内核版本可使用 uname -r 取得,因此鸟哥使用较简单的指令来处理啰~ # 此时 initrd 会被创建起来,妳可以将他移动到 /boot 等待使用。 范例二:增加 8139too 这个模块的 initrd 文件 [root@www ~]# mkinitrd -v --with=8139too initrd_vbirdtest $(uname -r) ....(前面省略).... Adding module mii Adding module 8139too <==看到没!这样就加入了!
initrd 创建完成之后,同时内核也处理完毕后,我们就可以使用 grub 来创建菜单了!底下继续瞧一瞧吧!
如果你的 Linux 主机本来就是使用 grub 作为 loader 的话,那么你就不需要重新安装 grub 了, 因为 grub 本来就会主动去读取设置档啊!您说是吧!但如果你的 Linux 原来使用的并非 grub , 那么就需要来安装啦!如何安装呢?首先,你必须要使用 grub-install 将一些必要的文件拷贝到 /boot/grub 里面去,你应该这样做的:
[root@www ~]# grub-install [--root-directory=DIR] INSTALL_DEVICE 选项与参数: --root-directory=DIR 那个 DIR 为实际的目录,使用 grub-install 缺省会将 grub 所有的文件都拷贝到 /boot/grub/* ,如果想要拷贝到其他目录与设备去, 就得要用这个参数。 INSTALL_DEVICE 安装的设备代号啦! 范例一:将 grub 安装在目前系统的 MBR 底下,我的系统为 /dev/hda: [root@www ~]# grub-install /dev/hda # 因为原本 /dev/hda 就是使用 grub ,所以似乎不会出现什么特别的消息。 # 如果去查阅一下 /boot/grub 的内容,会发现所有的文件都更新了,因为我们重装了! 范例二:我的 /home 为独立的 /dev/hda3 ,如何安装 grub 到 /dev/hda3 (boot sector) [root@www ~]# grub-install --root-directory=/home /dev/hda3 Probing devices to guess BIOS drives. This may take a long time. Installation finished. No error reported. This is the contents of the device map /home/boot/grub/device.map. Check if this is correct or not. If any of the lines is incorrect, fix it and re-run the script `grub-install'. (fd0) /dev/fd0 (hd0) /dev/hda <==会给予设备代号的对应表! [root@www ~]# ll /home/boot/grub/ -rw-r--r-- 1 root root 30 Apr 30 11:12 device.map -rw-r--r-- 1 root root 7584 Apr 30 11:12 e2fs_stage1_5 ....(底下省略).... # 看!文件都安装进来了!但是注意到,我们并没有设置档喔!那要自己创建!
所以说, grub-install 是安装 grub 相关的文件 (例如文件系统定义档) 到你的设备上面去等待在开机时被读取,但还需要设置好设置档 (menu.lst) 后,再以 grub shell 来安装 grub 主程序到 MBR 或者是 boot sector 上面去喔!好了,那我们来思考一下想要安装的数据。
例题:
我预计开机时要直接显示菜单,且菜单倒数为 30 秒。另外,在原本的 menu.lst 当中添加三个开机菜单,分别如下说明:
答:
第一点很简单,就利用上一小节的说明来处理即可。至于第二点,MBR 的读取读的是整颗硬盘的第一个磁区,
因此 root (hd0) 才是对的。第三点则与内核的后续参数有关。整个文件可以被改写成这样:
[root@www ~]# vim /boot/grub/menu.lst default=0 timeout=30 splashimage=(hd0,0)/grub/splash.xpm.gz #hiddenmenu title CentOS (2.6.18-92.el5) root (hd0,0) kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet initrd /initrd-2.6.18-92.el5.img title /dev/hda1 boot sector <==本例中的第一个添加菜单 root (hd0,0) chainloader +1 title MBR loader <==添加的第二个菜单 root (hd0) <==MBR 为整颗磁盘的第一个磁区,所以用整颗磁盘的代号 chainloader +1 title single user mode <==添加的第三个菜单(其实由原本的title拷贝来的) root (hd0,0) kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet single initrd /initrd-2.6.18-92.el5.img下次开机时,你就会发现有四个菜单可以选择,而缺省会以第一个菜单来开机喔! |
我们已经将设置档处理完毕,但是你要知道的是,我们并不知道 /dev/hda1 到底有没有包含 grub 的主程序, 因此我们想要将 grub 主程序再次的安装到 /dev/hda1 的 boot sector ,也想要重新安装 grub 到 MBR 上面去。 此时我们就得要使用 grub shell 啰!整个安装与 grub shell 的动作其实很简单, 如果您有兴趣研究的话,可以使用 info grub 去查阅~鸟哥这里仅介绍几个有用的指令而已。
由于我们最需要安装的就是那个 stage1 啦!那才是 grub 的主程序嘛!而且设置档通常与主程序摆在同一个目录下。 因此我们需要使用 root (hd0,0) 去找到 /boot/grub/stage1 喔!接下来,请用 grub 来进入 grub shell 吧!进入 grub 后,会出现一个『 grub> 』的提示字符啊!
[root@www ~]# grub # 1. 先设置一下含有 grub 目录的那个 partition 啊! grub> root (hd0,0) Filesystem type is ext2fs, partition type 0x83 # 鸟哥主机的分割中,/boot/grub 在 /boot 的分区,亦即是 /dev/hda1 内喔! # 另外, grub 也能够分辨出该分区的文件系统 (ext2)。 # 2. 搜索一下,是否存在 stage1 这个信息文件? grub> find /boot/grub/stage1 (hd0,2) # 见鬼!怎么会只有一个!我们明明有 /boot/grub 与 /home/boot/grub 啊! # 因为 /boot 是独立的,因此要找到该文件名就得要用如下的方式: grub> find /grub/stage1 (hd0,0) # 这样就能够找到啰!要特别注意 grub 找到不是目录树,而是设备内的文件。 # 3. 搜索一下是否可以找到内核? /boot/vmlinuz-2.6.18-92.el5 ? grub> find /boot/vmlinuz-2.6.18-92.el5 Error 15: File not found grub> find /vmlinuz-2.6.18-92.el5 (hd0,0) # 再次强调,因为 /boot/ 是独立的,因此就会变成上头的模样啰! # 4. 将主程序安装上去吧!安装到 MBR 看看! grub> setup (hd0) Checking if "/boot/grub/stage1" exists... no <==因为 /boot 是独立的 Checking if "/grub/stage1" exists... yes <==所以这个文件名才是对的! Checking if "/grub/stage2" exists... yes Checking if "/grub/e2fs_stage1_5" exists... yes Running "embed /grub/e2fs_stage1_5 (hd0)"... 15 sectors are embedded. succeeded Running "install /grub/stage1 (hd0) (hd0)1+15 p (hd0,0)/grub/stage2 /grub/grub.conf"... succeeded <==将 stage1 程序安装妥当啰! Done. # 很好!确实有装起来~这样 grub 就在 MBR 当中了! # 5. 那么重复安装到我的 /dev/hda1 呢?亦即是 boot sector 当中? grub> setup (hd0,0) Checking if "/boot/grub/stage1" exists... no Checking if "/grub/stage1" exists... yes Checking if "/grub/stage2" exists... yes Checking if "/grub/e2fs_stage1_5" exists... yes Running "embed /grub/e2fs_stage1_5 (hd0,0)"... failed (this is not fatal) Running "embed /grub/e2fs_stage1_5 (hd0,0)"... failed (this is not fatal) Running "install /grub/stage1 (hd0,0) /grub/stage2 p /grub/grub.conf "... succeeded Done. # 虽然无法将 stage1_5 安装到 boot sector 去,不过,还不会有问题, # 重点是最后面那个 stage1 要安装后,显示 succeeded 字样就可以了! grub> quit
如此一来,就已经将 grub 安装到 MBR 及 /dev/hda1 的 boot sector 里面去了! 而且读取的是 (hd0,0) 里面的 /grub/menu.lst 那个文件喔!真是很重要啊!重要到不行!
最后总结一下:
事实上,上一个小节设置好之后,你的 grub 就已经在你的 Linux 系统上面了,而且同时存在于 MBR 与 boot sector 当中呢!所以,我们已经可以重新开机来查阅看看啦! 另外,如果你正在进行开机,那么请注意,我们可以在缺省菜单 (鸟哥的范例当中是 30 秒) 按下任意键, 还可以进行 grub 的『在线编修』功能喔!真是棒啊!先来看看开机画面吧!
由于鸟哥将隐藏菜单的功能取消了,因此你会直接看到这四个菜单,同时会有读秒的咚咚在倒数。 菜单部分的画面其实就是 title 后面的文本啦!你现在知道如何修改 title 后面的文本了吧! ^_^。 如果你使用上下键去选择第二 (/dev/hda1 boot sector) 或第三 (MBR loader) 时,会发现同样的画面重复出现! 这是因为那两个是 loader 移交而已嘛!而我们都使用相同的 grub 与相同的 menu.lst 设置档! 因此这个画面就会重复出现了!这样了解乎?
另外,如果你再仔细看的话,会发现到上图中底部还有一些细部的选项,似乎有个 'e' edit 的样子! 没错~ grub 支持在线编修指令喔!这是个很有用的功能!假如刚刚你将 menu.lst 的内容写错了,导致出现无法开机的问题时, 我们可以查阅该 title 菜单的内容并加以修改喔!举例来说,我想要知道第一个菜单的实际内容时,将反白光棒移动到第一个菜单, 再按下 'e' 会进入如下画面:
哈哈!这不就是我们在 menu.lst 里面设置的东西吗?没错!此时你还可以继续进一步修改喔! 注意看到上图最底下的说明,你还可以使用:
我们说过, grub 是可以直接使用内核文件来开机的,所以,如果您很清楚的知道你的根目录 (/) 在那个 partition ,而且知道你的内核文件文件名 (通常都会有个 /boot/vmlinuz 链接到正确的文件名), 那么直接在图三的画面当中,以上述的 o, d, e 三个按键来编修,成为类似底下这样:
按下 [Enter] 按键后,然后输入 b 来 boot ,就可以开机啦!所以说,万一你的 /boot/grub/menu.lst 设置错误,或者是因为安装的缘故,或者是因为内核文件的缘故,导致无法顺利开机时,记得啊,可以在 grub 的菜单部分, 使用 grub shell 的方式去查找 (find) 或者是直接指定内核文件,就能够开机啦! ^_^
另外,很多时候我们的 grub 可能会发生错误,导致『连 grub 都无法启动』,那么根本就无法使用 grub 的在线编修功能嘛!怎么办?没关系啊!我们可以利用具有 grub 开机的 CD 来开机, 然后再以 CD 的 grub 的在线编修,嘿嘿!同样可以使用硬盘上面的内核文件来开机啦!很好玩吧! ^_^
事实上,你的 tty1~tty6 除了 80x24 的分辨率外,还能够有其他分辨率的支持喔!但前提之下是你的内核必须支持 FRAMEBUFFER_CONSOLE 这个内核功能选项才行。如何确定有没有支持呢?你可以查阅 /boot/config-2.6.18-92.el5 这个文件,然后这样搜索:
[root@www ~]# grep 'FRAMEBUFFER_CONSOLE' /boot/config-2.6.18-92.el5 CONFIG_FRAMEBUFFER_CONSOLE=y # 这个项目如果出现 y 那就是有支持啦!如果被注解或是 n ,那就是没支持啦!
那么如何调整 tty1 ~ tty6 终端机的分辨率呢?先参考底下的表格再说 (此为十进位数值):
彩度\分辨率 | 640x480 | 800x600 | 1024x768 | 1280x1024 | bit |
256 | 769 | 771 | 773 | 775 | 8 bit |
32768 | 784 | 787 | 790 | 793 | 15 bit |
65536 | 785 | 788 | 791 | 794 | 16 bit |
16.8M | 786 | 789 | 792 | 795 | 32 bit |
假设你想要将你的终端机屏幕分辨率调整到 1024x768 ,且色彩深度为 15bit 色的时候,就得要指定 vga=790 那个数字! 举例来说,鸟哥的 tty1 就想要这样的分辨率时,你可以这样做:
[root@www ~]# vim /boot/grub/menu.lst ....(前面省略).... title CentOS (2.6.18-92.el5) root (hd0,0) kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet vga=790 initrd /initrd-2.6.18-92.el5.img ....(后面省略)....
重新开机并选择此菜单进入 Linux,你跑到 tty1 去看看,嘿嘿!就已经是 1024x768 的分辨率啰! 只是字会变的很小,但是画面的范围会加大就是了。不过,某些版本支持的是 16 进制,所以还需要修改一下格式呢! 一般使用上表当中的值应该就可以了。不过,由于不同的操作系统与硬件可能会有不一样的情况,因此, 上面的值不见得一定可以在您的机器上面测试成功,建议您可以分别设置看看哩~以找出可以使用的值! ^_^
现今的硬盘容量越来越大,如果你使用旧的主板来安插大容量硬盘时,可能由于系统 BIOS 或者是其他问题, 导致 BIOS 无法判断该硬盘的容量,此时你的系统读取可能会有问题。为什么呢?
我们在本章一开始的开机流程讲过,当进入 Linux 内核功能后,他会主动的再去侦测一下整个系统, 因此 BIOS 捉不到的硬件在 Linux 内核反而可能会可以捉到而正常使用。举例来说,过去很多朋友常常会发现, 『我的系统使用 DVD 开机安装时,可以顺利的安装好 Linux ,但是第一次开机时, 屏幕只出现黑压压的一片,且出现 grub> 的字样,而无法进入 Linux 系统中』,这又是怎么一回事?
更多 grub 错误的代码查找可以到底下的链接查阅:
现在你知道问题所在啦!那就是 BIOS 无法读取大容量磁盘内的 kernel 与 initrd 文件。 那如何解决呢?很简单啦!就让 kernel 与 initrd 文件放置在大硬盘的最前头,由于 BIOS 至少可以读到大磁盘的 1024 磁柱内的数据,因此就能够读取内核与虚拟文件系统的文件啰。那如何让 kernel 与 initrd 放置到整颗硬盘的最前面呢?简单的要命吧!就创建 /boot 独立分区,并将 /boot 放置到最前面即可!更多其他的解决方案可参考文后的延伸阅读(注4)
万一你已经安装了 Linux 且发生了上述的问题,那该怎办?你可以这样作的:
不过,鸟哥还是建议您可以重新安装,并且制作出 /boot 这个 partition 啦! ^_^!这也是为啥这次更版中, 鸟哥特别强调要分割出 /boot 这个分区的原因啊!
想像一个环境,如果你管理的是一间电脑教室,这间电脑教室因为可对外开放,但是你又担心某些 partition 被学生不小心的弄乱,因此你可能会想要将某些开机菜单作个保护。这个时候,为每个菜单作个加密的密码就是个可行的方案啦! 那如何在开机的过程里面提供密码保护呢?首先,你必须要创建密码,而且还需要是加密过后的喔! 否则人家跑到 /boot/grub/menu.lst 不就可以探查到你的开机密码了?那如何创建加密的密码呢? 我们可以通过 grub 提供的 md5 编码来处理的,如下所示:
[root@www ~]# grub-md5-crypt Password: <==输入密码 Retype password: <==再输入一次 $1$kvlI0/$byrbNgkt/.REKPQdfg287. <==这就是产生的 md5 密码!
上面产生的最后一行,由 $ 开始到 . 结束的那行,就是你的密码经过 md5 编码过后的咚咚! 将这个密码拷贝下来吧!假设我们要将第一个选项加入这个密码,而第四个选项加入另外的密码, 那你应该要这样做:
[root@www ~]# vim /boot/grub/menu.lst ....(前面省略).... title CentOS (2.6.18-92.el5) password --md5 $1$kvlI0/$byrbNgkt/.REKPQdfg287. root (hd0,0) kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet vga=790 initrd /initrd-2.6.18-92.el5.img ....(中间省略).... title single user mode password --md5 $1$GFnI0/$UuiZc/7snugLtVN4J/WyM/ root (hd0,0) kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet single initrd /initrd-2.6.18-92.el5.img
上表的案例中,我们两个菜单进入的密码并不相同,可以进行同学的分类啦!不过这样也造成一个问题, 那就是一定要输入密码才能够进入开机流程,如果你在远程使用 reboot 重新开机,并且主机前面并没有任何人的话.... 你的主机并不会主动进入开机进程喔! ^_^
你必须要注意的是:password 这个项目一定要在 title 底下的第一行。 不过,此项功能还是可能被破解的,因为用户可以通过编辑模式 (e) 进入菜单,并删除密码字段并按下 b 就能够进行开机流程了!真糟糕!那怎办?只好通过整体的 password (放在所有的 title 之前) , 然后在 title 底下的第一行设置 lock ,那用户想要编辑时,也得要输入密码才行啊!设置有点像这样:
[root@www ~]# vim /boot/grub/menu.lst default=0 timeout=30 password --md5 $1$kvlI0/$byrbNgkt/.REKPQdfg287. <==放在整体设置处 splashimage=(hd0,0)/grub/splash.xpm.gz #hiddenmenu title CentOS (2.6.18-92.el5) lock <==多了锁死的功能 root (hd0,0) kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/1 rhgb quiet vga=790 initrd /initrd-2.6.18-92.el5.img
那么重新开机后,画面会像这样:
你可以看到最下方仅出现 p 的功能,由于 2, 3, 4 菜单并没有使用 lock ,因此这三个菜单用户还是可以运行开机进程, 但是第一个菜单由于有 lock 项目,因此除非你输入正确的密码,否则第一个菜单是无法被加载运行的。 另外,这个项目也能够避免你的 menu.lst 在开机的过程中被乱改,是具有保密 menu.lst 的功能啦! 与刚刚的菜单密码功能不同。
很多时候,我们可能因为做了某些设置,或者是因为不正常关机 (例如未经通知的停电等等) 而导致系统的 filesystem 错乱,此时,Linux 可能无法顺利开机成功,那怎么办呢?难道要重装?当然不需要啦! 进入 run level 1 (单人维护模式) 去处理处理,应该就 OK 的啦!底下我们就来谈一谈如何处理几个常见的问题!
大家都知道鸟哥的记忆力不佳,容易忘东忘西的,那如果连 root 的密码都忘记了,怎么办? 其实在 Linux 环境中 root 密码忘记时还是可以救回来的!只要能够进入并且挂载 / , 然后重新设置一下 root 的密码,就救回来啦!这是因为开机流程中,若强制内核进入 runlevel 1 时, 缺省是不需要密码即可取得一个 root 的 shell 来救援的。整个动作有点像这样:
grub edit> kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/ rhgb quiet single
重点就是那个特殊字体的咚咚啦!按下 [enter] 再按下 b 就能够开机进入单人维护模式了。前一个 root 密码挽救的方法其实可以用在很多地方,唯一一个无法挽救的情况,那就是 /etc/inittab 这个文件设置错误导致的无法开机!根据开机流程,我们知道 runlevel 0~6 都会读取 /etc/inittab 设置档, 因此你使用 single mode (runlevel 1) 当然也是要读取 /etc/inittab 来进行开机的。那既然无法进入单人维护模式, 就表示这题无解啰?非也非也,既然缺省的 init 无法运行,那我们就告诉内核不要运行 init ,改调用 bash 啊! 可以略过 init 吗?可以的,同样在开机进入 grub 后,同样在 grub edit 的情况下这样做:
grub edit> kernel /vmlinuz-2.6.18-92.el5 ro root=LABEL=/ rhgb quiet init=/bin/bash
因为我们指定了内核调用的第一支程序 (init) 变成 /bin/bash,因此 /sbin/init 就不会被运行。 又根据开机流程的说明,我们知道此时虽然可以利用 root 取得 bash 来工作,但此时 (1)除了根目录外,其他的目录都没有被挂载; (2)根目录被挂载成为唯读状态。因此我们还需要进行一些动作才行!如下所示:
鸟哥仅下达两个指令,『 mount -o remount,rw / 』用途是将根目录重新挂载成为可读写,至于『 mount -a 』则是参考 /etc/fstab 的内容重新挂载文件系统! 此时你又可以开机进行救援的工作了!只是救援完毕后,你得要使用『 reboot 』重新开机一次才行!
由于目前硬盘很便宜啊,所以很多朋友就想说:『那我能不能将 Windows 安装在 /dev/hda 而 Linux 安装在 /dev/hdb , 然后调整 BIOS 的开机设备顺序,如此则两套系统各有各的 loader 安装在个别硬盘的 MBR 当中了!』。 这个想法非常好,如此一来两者就不会互相干扰,因为每颗磁盘的 MBR 个别有不同操作系统的 loader 嘛! 问题是,grub 对磁盘的设备代号使用的是侦测到的顺序啊! 也就是说,你调整了 BIOS 磁盘开机顺序后,你的 menu.lst 内的设备代号就可能会对应到错误的磁盘上了!啊!真想哭!
没关系的,我们可以通过 /boot/grub/device.map 这个文件来写死每个设备对 grub 磁盘代号的对应喔! 举例来说,鸟哥的这个文件内容如下:
[root@www ~]# cat /boot/grub/device.map
(fd0) /dev/fd0
(hd0) /dev/hda
如果你不清楚如何处理的话,也可以利用 grub-install 的功能喔!例如:
[root@www ~]# grub-install --recheck /dev/hda1
这样 device.map 就会主动的被更新了!这样了解乎?
如果因为设置错误导致无法开机时,要怎么办啊?这就更简单了!最容易出错的设置而导致无法顺利开机的步骤,通常就是 /etc/fstab 这个文件了,尤其是用户在实作 Quota 时,最容易写错参数, 又没有经过 mount -a 来测试挂载,就立刻直接重新开机,真要命!无法开机成功怎么办? 这种情况的问题大多如下面的画面所示:
看到最后两行,他说可以输入 root 的密码继续加以救援喔!那请输入 root 的密码来取得 bash 并以 mount -o remount,rw / 将根目录挂载成可读写后,继续处理吧!其实会造成上述画面可能的原因除了 /etc/fstab 编辑错误之外,如果你曾经不正常关机后,也可能导致文件系统不一致 (Inconsistent) 的情况, 也有可能会出现相同的问题啊!如果是磁区错乱的情况,请看到上图中的第二行处, fsck 告知其实是 /dev/md0 出错, 此时你就应该要利用 fsck 去检测 /dev/md0 才是!等到系统发现错误,并且出现『clear [Y/N]』时,输入『 y 』吧!
这个 fsck 的过程可能会很长,而且如果你的 partition 上面的 filesystem 有过多的数据损毁时, 即使 fsck 完成后,可能因为伤到系统槽,导致某些关键系统文件数据的损毁,那么依旧是无法进入 Linux 的。此时,就好就是将系统当中的重要数据拷贝出来,然后重新安装,并且检验一下, 是否实体硬盘有损伤的现象才好!不过一般来说,不太可能会这样啦~ 通常都是 fsck 处理完毕后,就能够顺利再次进入 Linux 了。
仔细检查一下,你的 Linux 里面应该会有一个名为 chroot 的指令才对!这是啥? 这是『 change root directory 』的意思啦!意思就是说,可以暂时将根目录移动到某个目录下, 然后去处理某个问题,最后再离开该 root 而回到原本的系统当中。
举例来说,补习班中心最容易有两三个 Linux 系统在同一个主机上面,假设我的第一个 Linux 无法进入了,那么我可以使用第二个 Linux 开机,然后在第二个 Linux 系统下将第一个 Linux 挂载起来, 最后用 chroot 变换到第一个 Linux ,就能够进入到第一个 Linux 的环境当中去处理工作了。
你同样也可以将你的 Linux 硬盘拔到另一个 Linux 主机上面去,然后用这个 chroot 来切换, 以处理你的硬盘问题啊!那怎么做啊?粉简单啦!
挂载点 设备文件名 / → /dev/hdb1 /var → /dev/hdb2 /home → /dev/hdb3 /usr → /dev/hdb5若如此的话,那么在我目前的这个 Linux 底下,我可以创建一个目录,然后可以这样做:
挂载点 设备文件名 /chroot/ → /dev/hdb1 /chroot/var/ → /dev/hdb2 /chroot/home/ → /dev/hdb3 /chroot/usr/ → /dev/hdb5
boot: linux rescue
就能够进入救援模式的侦测了!