设为首页 收藏本站
查看: 854|回复: 0

[经验分享] linux系统启动与故障排除

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-7-23 08:36:09 | 显示全部楼层 |阅读模式
1、Linux系统启动过程的大致步骤与调用过程:
    第一阶段:BIOS启动引导阶段,主要实现硬件的初始化以及查找启动介质,从MBR中装载启动引导管理器(GRUB)并运行该启动引导管理;

    第二阶段:GRUB引导阶段,装载statge1,statge1.5,statge2,读取/boot/grub.conf文件并显示启动菜单,装载所选的kernel和initrd文件到内存中;

    第三阶段:内核阶段,运行内核启动参数,解压initrd文件并挂载initrd文件系统,装载必须的驱动,挂载根文件系统;

    第四阶段:Sysinit初始化阶段,启动/sbin/init/程序,运行rc.sysinit脚本,设置系统环境,启动swap分区,检查和挂载文件系统,读取/etc/inittab文件,运行/etc/rc.d/rcn.d中定义的不同运行级别的服务初始化脚本,打开字符终端1-6号控制台或者图形显示管理的7号控制台

启动阶段
读取的文件和操作的对象
BIOS启动引导阶段
None
GRUB启动引导阶段
/boot/grub/grub.conf
/boot/grub/statge1_5
/boot/grub/statge2
内核阶段
/boot/vmlinux-<version>
/boot/initrd-<version>
Sysinit初始化阶段
/etc/rc.d/rc.sysinit
/etc/inittab
/etc/rc.d/rc<n>.d
/etc/rc.d/init.d/*

2、常见的系统启动故障与排除

    1)、故障一:root口令丢失
当你忘记自己的root口令时,只需要在系统启动时进入单用户模式,即系统运行的0级别下即可,这个模式下不需要root的口令即可登录,具体过程如下:

在引导等待的读秒结束前按下回车键:

wKioL1WvN0zDKUiPAAB4bqLIlDw587.jpg
然后进入BIOS模式,选择需要操作的系统(如果是多系统的话),按E进入编辑模式
wKioL1WvN3DByCWcAAE3FLKKF_o771.jpg

选择内核编辑,在quiet后面输入1或者single,表示进入单用户模式,

wKioL1WvN3rxYv-xAAHOVwKoKXM145.jpg

然后回车返回到内核,按下B启动系统

wKioL1WvN4aDPI2SAADUspNgvO8850.jpg
执行runlevel,可以看到已经进入单用户模式
wKiom1WvNa6RBKdGAACIghewJYQ248.jpg
修改root账号的密码
wKiom1WvNffSM088AADRjLWnED8342.jpg

或者直接删除root账号的密码
wKioL1WvN-aCMMLOAABukNlKCVE981.jpg

修改完成后执行init 3,进入3级别运行系统
wKioL1WvN--TpK6kAADEZGbZrgs547.jpg
然后登入系统执行runlevel,可以看到运行正常
wKioL1WvOAWz6v8UAACdQuCEQCM286.jpg


    2)、故障二:grub.conf文件被误删除
/boot/grub/grub.conf文件肩负着引导内核和驱动等的重要功能,如果在操作中不小心误删除了该文件,那么系统的在启动时会自动进入grub shell模式,你只能手动来引导内核和驱动了,一般情况下,该文件最好做一个备份,防止由于误操作删除引起系统无法启动,具体解决过程如下:

没有grub.conf文件时开机会进入grub shell模式:
wKioL1WvOCKhiNpTAADeUiYzr-o796.jpg

输入help可以查看当前模式的可用命令
wKiom1WvNkzhMzfrAALW9WKMzh0561.jpg

输入root (按下tab键可以看到帮助,由于系统尚未启动,所以默认硬盘为hd0
wKioL1WvOELQioRGAAAhyzHU98c630.jpg

输入root (hd0,按下tab可以查看分区
wKioL1WvOE7ioy4hAACqg1O2Ovk769.jpg

如果不知道系统的/boot在那个分区上,可以一个一个试试,不过要注意,安装操作系统时,/boot分区肯定是ext格式的文件系统,所以这也可以作为一个区分依据

假如我输入root (hd0,1),即选择第二个分区,输入kernel / 按下tab键,会显示当前分区下的文件,由此可以发现并没有我们引导所需的内核和驱动
wKiom1WvNnmxDUv5AABfv7o83Ao655.jpg

输入正确的/boot分区,输入kernel / ,按下tab键,选择内核(ro表示只读,root=表示把引导程序交给/dev/sdb2分区,即为原系统的/boot/分区)
wKiom1WvNoaR0fdEAABWJsbOqvY632.jpg

输入initrd / 按下tab键,选择驱动文件
wKiom1WvNqTwTL5lAADT1ismn0w687.jpg

输入boot重启系统
wKiom1WvNrSw_vg1AAG0AfpIHsE231.jpg

进入系统后,查看一下grub引导文件
wKiom1WvNsCgZXswAABoPg_5nRg950.jpg

没有grub.conf文件,所以下次系统启动后还需要重新手动引导,我们可以自己编写一个grub.conf文件,方便系统启动时自动引导
1
2
3
4
5
6
7
8
9
[iyunv@fcy ~]# vim /boot/grub/grub.conf
default=0                   #默认启动第一个系统
timeout=5                  #引导等待时间
hiddenmenu              #隐藏BIOS,需要在timeout计时结束前按下enter进入
title CentOS-6.5       #系统启动显示的标题信息
     root (hd0,0)          #指定引导分区
  kernel /vmlinuz-2.6.32-431.el6.i686 ro root=/dev/sda2  rhgb quiet
         #指定内核文件,ro表示只读,root=/dev/sda2引导完成后交给真正的系统根目录,rhgb表示引导时以进度条的方式显示引导过程,quiet表示静默启动,即不输出引导进程
  initrd /initramfs-2.6.32-431.el6.i686.img                    #指定驱动文件名称




如果在指定内核和驱动时不知道文件完整名称,可以使用vim的底行命令来调入
按住shift输入两个!!,即可以进入底行命令模式,然后输入使用ls命令显示内核文件和驱动文件即可,支持命令补全

Grub.conf文件编辑文成后,重新启动系统即可
这个即为rhgb的作用
wKiom1WvNujCEFudAAAyXcjksZQ997.jpg

这个是timeout指定的时间,CentOS-6.5即为title
wKiom1WvNvOTyjGhAABZpy9g3To939.jpg

系统正常启动
wKioL1WvOOqTQnOuAACd_xwJOiQ025.jpg

    3)、故障三:GRUB引导的statge1丢失(即MBR前446字节被覆盖)

使用命令覆盖MBR引导分区的前446字节
dd if=/dev/zero of=/dev/sda bs=446 count=1

重启系统,并插入光盘
wKioL1WvOR-xBv4iAAIBATwJG_I830.jpg

发现选项里有一个Rescure install system,这是系统的救援模式,进入救援模式
wKiom1WvN1-goI32AADpdCZ7tnc653.jpg
救援模式下输入chroot /mnt/sysimage,执行grub-install  /dev/sda,即可重新设置MBR
wKioL1WvOW2xSSfaAAEHWgOMwi8984.jpg
重启系统,恢复正常

    4)、故障四:MBR丢失
    如果只是MBR的前446字节丢失,还可以用救援模式使用grub-install重新安装,这种情况下分区表并未丢失,如果整个MBR的512字节都丢失了,也就是意味着连同分区表与引导去一块没有了,为了防止这种情况出现,要提前做好MBR的备份文件

使用命令备份MBR文件,保存在系统本地或者远程服务器上
wKioL1WvOY7BoKrkAADJpsvw3aA768.jpg

一但这种情况发生了,那么救援模式叶无法拯救你的系统了,这时候我们需要一种光盘,名为liveCD的镜像光盘,类似于windows的PE盘,是一种移动系统,启动liveCD系统后可以救援你的硬盘上的文件资源

装上liveCD的光盘后进入BIOS,并设置光盘启动系统,F10保存退出
wKiom1WvN7qzKtzQAAEHsgSR45c915.jpg

登入系统后切换root账号,查看/dev/sda盘的信息,发现没有分区表
wKioL1WvOaqDvZzYAABUyaLhph8209.jpg

登录远程服务器,拷贝mbr的备份
wKiom1WvN9LRO35KAAEqxJCdck4651.jpg
恢复备份文件到MBR
wKiom1WvN-qhGKMcAADvMQIUZWI809.jpg

再次查看/dev/sda的分区情况
wKioL1WvOdvxtK9EAACeReald5w761.jpg

可以看到,MBR已经恢复,重启系统即可


    5)、故障五:statge2丢失(即/boot目录下的grub目录丢失)

进入系统,删除/boot/grub
wKiom1WvOCvS2yXfAAA6eRTIHpQ568.jpg

重启系统后进入grub shell模式,重复故障二的步骤,手动引导系统启动
wKiom1WvODqiIXKsAADd7LQBdmk799.jpg

进入系统后会,使用命令重装grub,指定路径为根目录/
wKiom1WvOEOhl0t7AAE0IPH5IHM093.jpg

查看生成的grub目录,发现没有grub.conf文件
wKiom1WvOFKSRHDQAAGvkbiu1pQ853.jpg

手工创建/boot/grub/grub.conf
wKioL1WvOkLifjB5AACioAMzQRc302.jpg

重启系统即可

3、总结
    作为一个系统运维师,熟悉linux系统的启动过程是必需的,并且能够处理最常见的系统启动故障问题。由于没有接触过真实环境的系统启动故障 ,以上排除方法只是手动模拟出来的,所以有很多欠缺,有错误和建议请指导。




运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-89632-1-1.html 上篇帖子: sshd问题:A protocol error occurred. Change of username or service not allowed 下篇帖子: linux ubuntu 12.04 下默认是安装了openjdk的 linux
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表