|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
您现在的位置: ChinaBeta.cn 中文IT资讯 >> 操作系统 >> Liunx|UNIX >> 操作系统正文
实用技巧之Linux系统“死机”时怎么办
Www.ChinaBeta.Cn 更新时间:2008-2-18

【ChinaBeta.Cn 操作系统中心】
如果问题能够再现,那么问题已经解决 80% 了。对于操作系统核心而言,如果有问题的再现方法,那么可以说是已经解决 99% 了。经常遇到的问题是系统可以正常运行一段时间,然后死机。如果不好再现问题,那么只有根据死机现场遗留的东西来进行分析了。


    如果系统没有死干净,比如磁盘中断和文件系统是好的,那么也许能有日志信息保留在文件中,不过这样的好运气我是从来没有遇到过的。如果键盘中断还能响应 (按下Num Lock,可以看见键盘小灯亮灭),那么运气就算是足够好了,这时可以祭出 sysrq 大法,同时按下 Alt-Sysrq-T 获得进程系统堆栈信息,按下 Alt-Sysrq-M 获得内存分配信息,按下 Alt-Sysrq-W 获得当前寄存器信息。


    linux/Documentation/sysrq.txt。另外,最好关闭终端的自动 blank 功能,这样系统死的时候至少能从屏幕上看到一些信息。设置方法是:


    # echo 1 > /proc/sys/kernel/sysrq

    # setterm -blank


    这两个设置最好加到系统启动脚本中 (比如 /etc/rc.d/rc.local),保证每次启动都能得到运行。


    如果很不幸,键盘也死悄悄了,(更为不幸的是,这种情况很常见),那么也不是只有等死一个办法,这时可以用串口终端 (serial console)将系统信息发送


    到另一台系统上,这样可以通过对这些信息分析来定位问题。设置方法如下:


    准备工作


    1. 一台被监视的服务器,一台进行监视工作的PC。


    2. 一根串口直连线。


    配置


    1. 在服务器上,加入一个新的 grub 项目,增加核心参数 "console=ttyS0 console=tty1",如:


kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=LABEL=/1 console=ttyS0

console=tty1


    2. 在服务器上,修改 /etc/sysconfig/syslog,加入 klogd 选项 "-c 7",保证更多内核信息得到输出。如:


    KLOGD_OPTIONS="-x -c 7"


    3. 重新启动服务器


    4. 用串口直连线连接两台机器,测试:


    1) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo hi > /dev/ttyS0",看在 PC 上是否有 "hi" 输出。


    2) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo w > /proc/sysrq-trigger",看 PC 上是否有相应内核信息输出。


    3) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "modprobe loop",看 PC 上是否有相应内核信息输出。


    5. 如果测试通过,那么在 PC 上运行:cat /dev/ttyS0 | tee /tmp/result


    另外,也可以用 Windows 超级终端获得串口信息。


    that's it.


    此外,一些核心支持 LKCD, netdump 等调试功能,也可以一试。


    剩下的,就只有靠经验和运气了,一般造成 Linux 系统死机的原因有:


    系统硬件问题 (SCSI 卡,主板,RAID 卡,网卡,硬盘...)

    外围硬件问题 (终端切换器,网络...)

    软件问题

    驱动 bug (去找更新的驱动试试)

    核心系统 bug (去 LKML 上看看,或换个核心试试)

    系统设置


    最后,google一把。有时候你可以直接输入 "Linux 系统死机怎么办?"


    PE6650 经常死机",看有没有人遇到过和你同样的问题。即使没有找到,也是一个有助于分析问题的信息,至少说明你的系统可能有和其他人不同之处。


    调查 Linux 系统死机问题,这既是科学又是艺术,牵扯到众多的硬件软件知识和经验,是一个不断学习的过程。

Google

(责任编辑:hahack)

发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
热门文章 相关报道
普通操作系统 [Liunx|UNIX]实用技巧之Linux系统“死机”时怎… (02-18)最新操作系统
普通操作系统 [Vista]Windows Vista下IE无法下载解决方… (02-18)最新操作系统
普通操作系统 [Vista]善用防火墙 让Windows Vista网络… (02-18)最新操作系统
普通操作系统 [Vista]让Windows Vista Home也可运行策… (02-18)最新操作系统
普通操作系统 [Vista]新玩法?Vista系统下提高SATA硬盘… (02-18)最新操作系统
推荐操作系统 [Vista]用Vista安装盘修复Vista系统完全… (02-18)最新操作系统
普通操作系统 [Vista]Vista SP1/XP SP2文件操作性能评… (02-18)最新操作系统
普通操作系统 [Vista]不重装,不还原 让Vista系统比重… (02-18)最新操作系统
普通操作系统 [Vista]Windows Vista SP1 将增加欧盟去… (02-02)
普通操作系统 [Vista]Windows Vista出现停止响应怎么办… (02-02)
  • Linux用Vim+Taglist+Ctags阅…

  • 嵌入式Linux系统下的网页浏…

  • 在VMware中Fedora Linux 8系…

  • SUSE Linux subversion独立…

  • Ubuntu 7.10不能正常播放网…

  • 硬盘安装 openSUSE Linux 1…

  • 在Fedora Linux 8下配置AC9…

  • Linux+Apache+PHP+JSP 的Re…

  • Solaris Linux 9下Vsftpd的…

  • RHEL5.0操作系统下NFS服务的…

  •   网友评论内容:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    I D *
    邮 箱
    主 页
    评 分 1分 2分 3分 4分 5分
    评 论

    关于我们  中国·国家信息产业部{粤ICP备06006652号}{陇ICP备06002562号}
    版权所有:『AK网盟基地』站长:Hahack | QQ:80505955 | E-mail:Hahack@Gmail.com
    Copyright (C) 2005-2007  akhack.org|chinabeta.cn All Rights Reserved