一、简介
本文主要介绍如何打开Kdump并对其相关文件进行配置。前面章节已经对Kdump调试机理进行总结总结,具体可以点击下面链接:
Kdump调试机理总结(一)
crash工具分析vmcore文件常用命令总结(三)
二、Kdump整体介绍
1、kdump kdump 是一种先进的基于 kexec 的内核崩溃转储机制,用来捕获kernel crash(内核崩溃)的时候产生的crash dump。当内核产生错误时,kdump会将内存导出为vmcore保存到磁盘。
2、 kdump流程 当系统崩溃时,kdump 使用 kexec 启动到第二个内核。第二个内核通常叫做捕获内核,以很小内存启动以捕获转储镜像。第一个内核启动时会保留一段内存给kdump用。
3、kdump的配置流程具体如下:
内核配置
安装kdump(kexec-tools)工具
修改内核启动参数
修改kdump配置文件
启动kdump功能
验证Kdump功能
三、Kdump具体配置
3.1 内核配置 通常设备默认内核是已经配置了Kdump功能的。 想要确认当前内核是否支持kexec,可通过查看在/sys/kernel/下有没有kexec等文件去确认,同时通过查看 /sys/kernel/kexec_crash_loaded 的值,判断Kdump功能是否加载(“1”为已经加载,“0”为还未加载)
[root@localhost /]# cat /sys/kernel/kexec_crash_loaded
如果没有,则需要我们对内核进行配置,具体如下(make menuconfig):
CONFIG_KEXEC=y
Boot options --->[*] Kexec system call (EXPERIMENTAL)
CONFIG_CRASH_DUMP=y
Boot options --->[*] Build kdump crash kernel (EXPERIMENTAL)
CONFIG_SYSFS=y
File systems --->Pseudo filesystems --->[*] Tmpfs virtual memory file system support
CONFIG_PROC_VMCORE=y
File systems --->Pseudo filesystems --->-*- /proc file system support--->[*] /proc/vmcore support
CONFIG_DEBUG_INFO=y
Kernel hacking --->Compile-time checks and compiler options --->[*] Compile the kernel with debug info
3.2 安装kdump(kexec-tools)工具
[root@localhost /]# yum install kexec-tools
3.3 修改内核启动参数 (1)直接配置
[root@localhost /]# vim /boot/grub2/grub.cfg
grub.cfg配置总结
(2)通过工具重置grub.cfg
[root@localhost /]# vim /etc/default/grub
修改为
GRUB_CMDLINE_LINUX="crashkernel=auto"
说明: crashkernel=xxx //预留内存大小 注意: 注意预留内存大小,过大/过小都会导致生成vmcore文件失败(不知道设置多少时,可以尝试每次增加128M)
[root@localhost /]# grub2-mkconfig -o /boot/grub2/grub.cfg
(3)重启确认配置是否成功
[root@localhost /]# reboot
[root@localhost /]# cat /proc/cmdline
BOOT_IMAGE=/vmlinuz-4.4.13-200.nd7.3.x86_64 root=/dev/sda3 ro rhgb quiet loglevel=0 LANG=zh_CN.UTF-8 crashkernel=auto
说明: 如果在cmdline里找到了crashkernel参数,代表已经将配置写入内核了.
3.4 修改kdump配置文件
[root@localhost /]# vim /etc/kdump.conf
path /var/crash #指定coredump文件放在/var/crash文件夹中
core_collector makedumpfile -c -l -message-level 1 -d 31 #加上-c表示压缩,原文件中没有
default reboot #生成coredump后,重启系统
3.5 启动kdump功能
[root@localhost /]# systemctl enable kdump.service
[root@localhost /]# systemctl start kdump.service
[root@localhost 桌面]# systemctl status kdump.service
● kdump.service - Crash recovery kernel arming
Loaded: loaded (/usr/lib/systemd/system/kdump.service; disabled)
Active: active (exited) since 四 2022-05-05 19:12:31 CST; 1min 14s ago
Process: 2272 ExecStart=/usr/bin/kdumpctl start (code=exited, status=0/SUCCESS)
Main PID: 2272 (code=exited, status=0/SUCCESS)
CGroup: /system.slice/kdump.service
5月 05 19:12:31 localhost kdumpctl[2272]: kexec: loaded kdump kernel
5月 05 19:12:31 localhost kdumpctl[2272]: Starting kdump: [OK]
注意: 本人在用x86的系统打开kdump服务时,指定的crashkernel=auto不生效,导致启动失败,可以用crashkernel=128M@48M格式测试;
3.6 验证Kdump功能 我们来模拟系统异常崩溃,验证之前的操作是否都成功了:
[root@localhost /]# echo 1 > /proc/sys/kernel/sysrq
[root@localhost /]# echo c > /proc/sysrq-trigger
重启后,查看/var/crash目录
[root@localhost /]# ls /var/crash/
保留内存是否预留成功,可以通过cat /proc/meminfo查看。
[root@localhost /]# cat /proc/meminfo | grep Crash
四、其他相关链接
1、Kdump调试机理总结(一)
2、crash工具分析vmcore文件常用命令总结(三)
3、grub.cfg配置总结
4、编译linux内核常见报错总结
|