通行证│用户名: 密码: 验证码: 验证码,看不清楚?请点击刷新验证码 电信网通铁通移动   在线
文章搜索:
热门搜索:红客 黑鹰 红客技术 安全动画 红客培训
首页 文章 软件 动画 资源 励志 论坛 邮箱 会员 军事 科技 博客 爱心红客 最近更新 800g资源
 业内新闻 漏洞公告 病毒公告 电脑知识 网络知识 菜鸟入门 攻防教程 黑客攻防 安全编程 工具使用 综合安全 个人安全 安全相关 Q Q安全 原创精华 红客人物 站内事件
您现在的位置: 爱国者安全网 >> 文章类 >> 技术文章 >> 电脑知识 >> 文章正文
实用技巧之Linux系统“死机”时怎么办
责任编辑:酷酷の鱼   更新日期:2008-2-27
 
如果问题能够再现,那么问题已经解决 80% 了。对于操作系统核心而言,如果有问题的再现方法,那么可以说是已经解决 99% 了。经常遇到的问题是系统可以正常运行一段时间,然后死机。如果不好再现问题,那么只有根据死机现场遗留的东西来进行分析了。


    如果系统没有死干净,比如磁盘中断和文件系统是好的,那么也许能有日志信息保留在文件中,不过这样的好运气我是从来没有遇到过的。如果键盘中断还能响应 (按下Num Lock,可以看见键盘小灯亮灭),那么运气就算是足够好了,这时可以祭出 sysrq 大法,同时按下 Alt-Sysrq-T 获得进程系统堆栈信息,按下 Alt-Sysrq-M 获得内存分配信息,按下 Alt-Sysrq-W 获得当前寄存器信息。


    linux/Documentation/sysrq.txt。另外,最好关闭终端的自动 blank 功能,这样系统死的时候至少能从屏幕上看到一些信息。设置方法是:


    # echo 1 > /proc/sys/kernel/sysrq

    # setterm -blank


    这两个设置最好加到系统启动脚本中 (比如 /etc/rc.d/rc.local),保证每次启动都能得到运行。


    如果很不幸,键盘也死悄悄了,(更为不幸的是,这种情况很常见),那么也不是只有等死一个办法,这时可以用串口终端 (serial console)将系统信息发送


    到另一台系统上,这样可以通过对这些信息分析来定位问题。设置方法如下:


    准备工作


    1. 一台被监视的服务器,一台进行监视工作的PC。


    2. 一根串口直连线。


    配置


    1. 在服务器上,加入一个新的 grub 项目,增加核心参数 "console=ttyS0 console=tty1",如:


kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=LABEL=/1 console=ttyS0

console=tty1


    2. 在服务器上,修改 /etc/sysconfig/syslog,加入 klogd 选项 "-c 7",保证更多内核信息得到输出。如:


    KLOGD_OPTIONS="-x -c 7"


    3. 重新启动服务


    4. 用串口直连线连接两台机器,测试:


    1) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo hi > /dev/ttyS0",看在 PC 上是否有 "hi" 输出。


    2) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo w > /proc/sysrq-trigger",看 PC 上是否有相应内核信息输出。


    3) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "modprobe loop",看 PC 上是否有相应内核信息输出。


    5. 如果测试通过,那么在 PC 上运行:cat /dev/ttyS0 | tee /tmp/result


    另外,也可以用 Windows 超级终端获得串口信息。


    that's it.


    此外,一些核心支持 LKCD, netdump 等调试功能,也可以一试。


    剩下的,就只有靠经验和运气了,一般造成 Linux 系统死机的原因有:


    系统硬件问题 (SCSI 卡,主板,RAID 卡,网卡,硬盘...)

    外围硬件问题 (终端切换器,网络...)

    软件问题

    驱动 bug (去找更新的驱动试试)

    核心系统 bug (去 LKML 上看看,或换个核心试试)

    系统设置


    最后,google一把。有时候你可以直接输入 "Linux 系统死机怎么办?"


    PE6650 经常死机",看有没有人遇到过和你同样的问题。即使没有找到,也是一个有助于分析问题的信息,至少说明你的系统可能有和其他人不同之处。


    调查 Linux 系统死机问题,这既是科学又是艺术,牵扯到众多的硬件软件知识和经验,是一个不断学习的过程。

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 最近更新
    固顶文章 一日一动画稿费100元起
    普通文章 瑞星公司02月27日发布 每日计算机病毒及木马播报
    普通文章 Oracle 10g DataGuard 日志传输方式
    普通文章 Fedora 8 Linux 系统内核配置注意事项
    普通文章 黑客如何利用文件漏洞进行网站入侵
    普通文章 解燃眉之急 教你5种常用密码破解办法
    普通文章 SNMP口令的利用以及一些相关知识
    普通文章 Google间接承认IP地址属于个人信息
    普通文章 木马窃取网游信息 小心紫萝卜木马下载器
    普通文章 下载器木马也长寿 安全破坏者直指杀软
    热门文章
    普通文章Bjfnt v1.3的脱壳方法手记
    普通文章安全检测之注射MSSQL
    普通文章如何选择安全漏洞扫描工具
    推荐文章推荐:Windows Vista虚拟化功能故障解决方法
    普通文章巧妙设置 将文件隐藏起来确保安全
    普通文章办公室80%U盘感染病毒 建同名文件夹阻挡U盘病毒
    普通文章Google报告:恶意网站有上升势头
    普通文章PDF最新漏洞可能已导致数千人受攻击
    普通文章Sophs:俄罗斯已成为垃圾邮件超级大国
    普通文章印度杀毒软件厂商AvSoft网站被黑
    精彩专题