Linux Kernel Crash Debug

来源:互联网 发布:网络筹款平台哪个好 编辑:程序博客网 时间:2024/04/30 11:38
为了分析Linux crash问题,通常需要在系统中事先安装配置好crash内核(会占用100多MB内存)当linux crash时,crash内核会保存当时主内核的状况,包括内存、网络、进程等信息,并dump至本地文件。具体安装crash内核过程请google一下。
本文记录了debug生成的dump文件的过程,文章部分参考他人,具体出处已记不清,在此感谢微笑
1. 下载安装Debug内核(以Ubuntu为例)
wget http://ddebs.ubuntu.com/pool/main/l/linux-lts-raring/linux-image-3.8.0-29-generic-dbgsym_3.8.0-29.42~precise1_amd64.ddeb

2. 启动
crash /usr/lib/debug/boot/vmlinux-3.8.0-29-generic dump.201409221010

3. 开始分析
a. bt 命令
 crash> bt  PID: 5563   TASK: c0000000faac3700  CPU: 36  COMMAND: "sh" #0 [c0000000f8ce31b0] .crash_kexec at c0000000001039f8  #1 [c0000000f8ce33b0] .die at c000000000020158  #2 [c0000000f8ce3450] .bad_page_fault at c000000000045004  #3 [c0000000f8ce34d0] handle_page_fault at c000000000005ec8  Data Access error  [300] exception frame:  R0:  0000000000130000    R1:  c0000000f8ce37c0    R2:  c000000000f876d8    R3:  c000000001224dc8    R4:  0000000000000001    R5:  0000000000000000    R6:  cfffffffffffffff    R7:  0000000002220000    R8:  2ffffffff1f10000    R9:  d00000000e0f0000    R10: 0000000000000000    R11: 0000000100000000    R12: 0000000082002424    R13: c000000001f06c00    R14: 000000001003e270    R15: 0000000000000001    R16: 0000000000000001    R17: 0000000000000000    R18: 0000000000000000    R19: c0000000f820b4b8    R20: c0000000f8ce3df8    R21: c000000000fe2400    R22: 00000fffb53d0000    R23: fffffffffffff000    R24: 0000000000000400    R25: 000000000000ed99    R26: 0000000000002000    R27: 0000000000002e58    R28: c000000001224dc8    R29: c000000001224dc0    R30: c000000000ef2658    R31: c0000000f8ce39a0    NIP: c000000000255900    MSR: 8000000000009032    OR3: c000000000005278  CTR: c000000000263a08    LR:  c0000000002558dc    XER: 0000000000000001  CCR: 0000000022002444    MQ:  0000000000000001    DAR: 0000000100000008  DSISR: 0000000040000000     Syscall Result: 0000000000000000  .....  #4 [c0000000f8ce37c0] .get_vmalloc_info at c000000000255900  [Link Register ]  [c0000000f8ce37c0] .get_vmalloc_info at c0000000002558dc  (un  reliable)  #5 [c0000000f8ce3850] .meminfo_proc_show at c000000000263ad8  #6 [c0000000f8ce3b40] .seq_read at c00000000020aa44  #7 [c0000000f8ce3c30] .proc_reg_read at c000000000258ccc  #8 [c0000000f8ce3ce0] .vfs_read at c0000000001dee60  #9 [c0000000f8ce3d80] .sys_read at c0000000001df06c  #10 [c0000000f8ce3e30] syscall_exit at c0000000000097ec  syscall  [c01] exception frame:  R0:  0000000000000003    R1:  00000ffff3cceb60    R2:  00000fffb5305c40    R3:  0000000000000008    R4:  00000fffb53d0000    R5:  0000000000000400    R6:  0000000000000001    R7:  00000fffb5249f88    R8:  800000000200f032    R9:  0000000000000000    R10: 0000000000000000    R11: 0000000000000000    R12: 0000000000000000    R13: 00000fffb50b8110    NIP: 00000fffb523d0c4    MSR: 800000000200f032    OR3: 0000000000000008  CTR: 00000fffb51dae70    LR:  00000fffb51daeac    XER: 0000000000000001  CCR: 0000000044002422    MQ:  0000000000000001    DAR: 00000fffb51dcd60  DSISR: 0000000040000000     Syscall Result: 00000fffb53d0000  Crash>

我们看到系统崩溃前的最后一个调用是“#4 [c0000000f8ce37c0] .get_vmalloc_info at c000000000255900”,现在用 dis 命令来看一下该地址的反汇编结果

b. dis 命令
 crash> dis -l c000000000255900  /usr/src/debug/kernel-ppc64-3.0.8/linux-3.0/fs/proc/mmu.c: 47  0xc000000000255900 <.get_vmalloc_info+112>:     ld      r10,8(r11)

从上面的反汇编结果中,我们看到问题出在 mmu.c 第 47 行代码,翻开 linux 源码的相应位置

c. linux 源码
 21 void get_vmalloc_info(struct vmalloc_info *vmi)  22 {  23         struct vm_struct *vma; …… 46 for (vma = vmlist; vma; vma = vma->next) {  47                       unsigned long addr = (unsigned long) vma->addr;

用 struct 命令查看数据结构

d. struct 命令
 crash> struct -o vm_struct  struct vm_struct {    [0] struct vm_struct *next;    [8] void *addr;   [16] long unsigned int size;   [24] long unsigned int flags;   [32] struct page **pages;   [40] unsigned int nr_pages;   [48] phys_addr_t phys_addr;   [56] void *caller;  }  SIZE: 64  crash>

对照源码和反汇编代码,我们发现第 47 行的源码,实际对应的就是反汇编的代码

ld r10,8(r11) # 将寄存器 r11 的第 8 个 byte 后的内容,load 到寄存器 r10

那么 r11 中应该是 vm_struct 结构,我们再用 struct 来看看

e. struct 命令
 crash> struct vm_struct 0000000100000000  struct: invalid kernel virtual address: 0000000100000000  crash>

说明 r11 的内容已经被破坏,并不是指向一个 vm_struct 结构了。

经过上面的层层分析,我们推测问题的产生过程如下:mmu.c 第 46 行, vma = vma->next 取到了一个错误的地址,导致第 47 行 addr = (unsigned long) vma->addr 产生了内核错误。当然,更深层的原因,还需要对代码逻辑进行分析,找出导致这个现象的根源。




附crash内核命令
Setset [pid | taskp | [-c cpu] | -p] | [crash_variable [setting]] | -v1、设置要显示的内容,内容一般以进程为单位。Set pid 设置当前的内容为pid所代表的进程Set taskp 设置当前的内容为十六制表示的taskp任务的内容Set –p 设置当前的内容为panic任务的内容Set -v 显示crash当前的内部变量Set 不带参数,表示显示当前任务的内容2、同时set命令也可以设置当前crash的内部变量Set scroll on表示开启滚动条。具体的内部变量可以通过set –v命令获得,也可以通过help set来查看帮助。Ascii把一个十六进制表示的字符串转化成ascii表示的字符串Ascii 不带参数则显示ascii码表Ascii number number所代表的ascii字符串Structstruct struct_name[.member[,member]][-o][-l offset][-rfu] [address | symbol][count | -c count]显示结构体的具体内容(下面只介绍常用的,具体的可通过命令help struct查询)注:如果crash关键字与name所表示的结构体名称不冲突,可以省略struct关键字。Struct name 显示name所表示的结构体的具体结构Struct name.member 显示name所表示的结构体中的member成员Struct name –o 显示name所表示的结构体的具体结构,同时也显示每个成员的偏移量注:如果crash关键字与name所表示的结构体名称不冲突,可以省略struct关键字。Unionunion union_name[.member[,member]] [-o][-l offset][-rfu] [address | symbol][count | -c count]显示联合体的具体内容,用法与struct一致。*它是一个快捷键,用来取代struct和union。Struct page == *pageStruct page == *pagePp [-x|-d][-u] expressionPrint的缩写,打印表达式的值。表达式可以为变量,也可以为结构体。通过命令alias可以查看命令缩写的列表。Px expression == p –x expression 以十六进制显示expression的值Pd expression == p –d expression 以十进制显示expression的值不加参数的print,则根据set设置来显示打印信息。Whatiswhatis [struct | union | typedef | symbol]搜索数据或者类型的信息参数可以是结构体的名称、联合体的名称、宏的名称或内核的符号。Symsym [-l] | [-M] | [-m module] | [-p|-n] | [-q string] | [symbol | vaddr]把一个标志符转换到它所对应的虚拟地址,或者把虚拟地址转换为它所对应的标志符。Sym –l 列出所有的标志符及虚拟地址Sym –M 列出模块标志符的集合Sym –m module name 列表模块name的虚拟地址Sym vaddr 显示虚拟地址addr所代表的标志Sym symbol 显示symbol标志符所表示的虚拟地址Sym –q string 搜索所有包含string的标志符及虚拟地址Disdis [-r][-l][-u][-b [num]] [address | symbol | (expression)] [count]disassemble的缩写。把一个命令或者函数分解成汇编代码。Dis symbolDis –l symbolBtbt [-a|-g|-r|-t|-T|-l|-e|-E|-f|-F|-o|-O] [-R ref] [-I ip] [-S sp] [pid | task]跟踪堆栈的信息。Bt 无参数则显示当前任务的堆栈信息Bt –a 以任务为单位,显示每个任务的堆栈信息Bt –t 显示当前任务的堆栈中所有的文本标识符Bt –f 显示当前任务的所有堆栈数据,通过用来检查每个函数的参数传递Devdev [-i | -p]显示数据关联着的块设备分配,包括端口使用、内存使用及PCI设备数据Dev –I 显示I/O端口使用情况Dev –p 显示PCI设备数据Filesfiles [-l | -d dentry] | [-R reference] [pid | taskp]显示某任务的打开文件的信息Files 显示当前任务下所有打开文件的信息File –l 显示被服务器锁住的文件的信息Irqirq [[[index ...] | -u] | -d | -b]显示中断编号的所有信息Irq 不加参数,则显示所有的中断Irq index 显示中断编号为index的所有信息Irq –u 仅仅显示正在使用的中断Foreachforeach [[pid | taskp | name | [kernel | user]] ...] command [flag] [argument]跟C#中的foreach类似,为多任务准备的。它根据参数指定的任务中去查找command相关的内容。任务可以用pid、taskp、name来指定。如果未指定,则搜索所有的任务。形如:Foreach bash task 表示搜索任务bash中的task相关数据。当command为{bt,vm,task,files,net,set,sig,vtop}时,显示的内容与命令中的命令类似,只是加了foreach则显示所有任务,而不是单条任务。形如:Foreach files 显示所有任务打开的文件Runq无参数。显示每个CPU运行队列中的任务。Aliasalias [alias] [command string]创建给定的命令的别名,如果未指定参数,则显示创建好的别名列表。Command string可以是带各种参数的命令。Mountmount [-f] [-i] [-n pid|task] [vfsmount|superblock|devname|dirname|inode]显示挂载的相关信息Mount 不加参数,则显示所有已挂载的文件系统Mount –f 显示每个挂载文件系统中已经打开的文件Mount –I 显示每个挂载文件系统中的dirty inodesSearchsearch [-s start] [ -[kKV] | -u | -p ] [-e end | -l length] [-m mask] -[cwh] value ...搜索在给定范围的用户、内核虚拟内存或者物理内存。如果不指定-l length或-e end,则搜索虚拟内存或者物理内存的结尾。内存地址以十六进制表示。-u 如果未指定start,则从当前任务的用户内存搜索指定的value-k 如果未指定start,则从当前任务的内核内存搜索指定的value-p 如果未指定start,则从当前任务的物理内存搜索指定的value-c 后面则指定要搜索的字符串,这个搜索中很有用。Vmvm [-p | -v | -m | [-R reference] | [-f vm_flags]] [pid | taskp] ...显示任务的基本虚拟内存信息。-p 显示虚拟内存及转换后的物理内存信息Netnet [-a] [[-s | -S] [-R ref] [pid | taskp]] [-n addr]显示各种网络相关的数据-a 显示ARP cache-s 显示指定任务的网络信息-S 与-s相似,但是显示的信息更为详细该命令与foreach配合使用,能加快定位的速度。Vtopvtop [-c [pid | taskp]] [-u|-k] address ...显示用户或内核虚拟内存所对应的物理内存。其中-u和-k分别表示用户空间和内核空间。Ptovptov address ...该命令与vtop相反。把物理内存转换成虚拟内存。Btopbtop address ...把一个十六进制表示的地址转换成它的分页号。Ptobptob page_number ...该命令与btop相反,是把一个分页号转换成地址。Sigsig [[-l] | [-s sigset]] | [-g] [pid | taskp] ...显示一个或者多个任务的signal-handling数据-l 列出信息的编号及名字-g 显示指定任务线程组中所有的signal-handling数据Waitqwaitq [ symbol ] | [ struct.member struct_addr ] | [ address ]列出在等待队列中的所有任务。参数可以指定队列的名称、内存地址等。Ptepte contents ...把一个十六进制表示的页表项转换为物理页地址和页的位设置Swap无参数。显示已经配置好的交换设备的信息。Wrwr [-u|-k|-p] [-8|-16|-32|-64] [address|symbol] value根据参数指定的写内存。在定位系统出错的地方时,一般不使用该命令。Evaleval [-b][-l] (expression) | value计算表达式的值,及把计算结果或者值显示为16、10、8和2进制。表达式可以有运算符,包括加减乘除移位等。-b 统计2进制位数为1的索引编号。Listlist [[-o] offset] [-e end] [-s struct[.member[,member]]] [-H] start显示链表的内容Machmach [-cm]显示机器的一些信息,如CPU主频等。-c 显示每个CPU的结构体信息-m 显示物理内存每段的映射Loglog [-m]显示内核的日志,以时间的先后顺序排列-m 在每个消息前添加该消息的日志等级Syssys [-c [name|number]] config显示特殊系统的数据。不指定参数,则显示crash启动时打印的系统数据。-c [name|number] 如果不指定参数,则显示所有的系统调用。否则搜索指定的系统调用。Config 显示内核的配置。不过必须把CONFIG_IKCONFIG编进内核Rdrd [-dDsSupxmf][-8|-16|-32|-64][-o offs][-e addr] [address|symbol] [count]显示指定内存的内容。缺少的输出格式是十六进制输出-d 以十进制方式输出-D 以十进制无符号输出-8 只输出最后8位-16 只输出最后16位-32 只输出最后32位-64 只输出最后64位-o offs 开始地址的偏移量-e addr 显示内存,直到到过地址addr为止Address 开始的内存地址,以十六进制表示Symbol 开始地址的标识符Count 按多少位显示内存地址。如addr=1234,count=8,则显示34 12Tasktask [-R member[,member]] [pid | taskp] ...显示指定内容或者进程的task_struct的内容。不指定参数则显示当前内容的task_struct的内容。Pid 进程的pidTaskp 十六进制表示的task_struct指针。-R memberExtendextend [shared-object ...] | [-u [shared-object ...]]动态装载或卸载crash额外的动态链接库。Repeatrepeat [-seconds] command每隔seconds重复一次命令command,无限期的执行下去。Timer无参数。按时间的先后顺序显示定时器队列的数据。Gdbgdb command ...用GDB执行命令command。



0 0