死机问题分析

来源:互联网 发布:caffe 图片分类 编辑:程序博客网 时间:2024/05/02 17:33

====



userspace的systemService中的Inputsystem一直监控kernelspace的InputEvent,将其进一步处理后变成上层app的InputEvent,APP对相关事件进行处理后,请求更新相关的逻辑界面,而这个则有SystemServer中的wms来负责。相关的逻辑界面更新后,则会请求Surfaceflinger来产生FrameBuffer数据,surfaceFilinger则会利用Gpu等来计算生成,displaySystem/driver则会将FrameBuffer中的数据来更新显示出来,这样用户才能感知到他的动作。


死机原因==============

1软件

逻辑异常   包括 逻辑判断错误 和逻辑设计错误

逻辑卡顿  包括死循环 和死锁

从具体的原因上将,可以进一步分成:
(1). Input Driver
* 无法接收HW 的中ISR,产生原始的InputEvent, 或者产生的InputEvent 异常.
(2). Input System
* 无法监听Kernel 传递上来的原始InputEvent, 或者转换与传递异常.
(3). System Logic
* 无法正常响应Input System 传递过来的InputEvent, 或者响应出错.
(4). WMS/Surfaceflinger 行为异常
* WMS/SF 无法正确的对Z-Window 进行叠加转换
(5). Display System
* 无法更新Framebuffer 数据,或者填充的数据错误
(6). LCM Driver
* 无法将Framebuffer 数据显示在LCM 上

对应硬件HW hang, 经常见得的情况有:
* Power 
* Clock
* Memory & Memory Controller
* Fail IC

==================死机数据分析===========


死机数据 包括空间数据和时间数据

空间数据,即当时现场环境,如有哪些process 在运行,CPU 的执行情况,memory 的利用情况,以及具体的process 的memory 数据等。 时间数据,即行为上的连续数据,比如某个Process 在一段时间内执行了哪些操作,某段时间内CPU 利用率的变化等。通常时空都是交融的,对应我们抓取资讯时往往也是。

 Debug/LOG 方面,原则上user 版本只能抓到有限的资讯,eng 可以抓到更多的资讯,Debug 能力更强,推崇使用eng 版本开发测试

* 在eng 版本上,LOG 量 >= user 版本的log 量,一些地方会直接check eng/user 版本来确认是否打印LOG
* user 版本默认关闭uart, eng 版本默认开启uart
* 在eng 版本上,开启ANR 的predump, 会抓取ftrace,可以得到更多ANR的资讯
* 在eng 版本上,可用rtt 抓取backtrace,可开启kdb 进行kernel debug, 可用ftrace 抓取cpu 执行场景
* MTK aee 在ENG 版本抓取更多的异常资讯,比如native exception 会抓取core dump 信息 (2) 性能方面,原则上进行性能测试请使用user 版本测试
* user 版本为提高第一次开机速度,使用了DVM 的预优化,将dex 文件分解成可直接load 运行的odex 文件,ENG 版本不会开启这项优化
* 更少的LOG 打印,uart 的关闭,原则上user 版本的性能要优于eng 版本 (3) 如何确认user/eng 版本

Java 层,check android.os.Build 类中的TYPE 值
* native 层,property_get(ro.build.type, char* value, eng); 然后check value 值
* Debug 时, adb shell getprop ro.build.type 返回值如果是user 即user 版本,eng 即eng 版本
* Log 确认, mobile log/Aplog_xxxxx/versions 中查看ro.build.type 属性 (4) 如何编译user/eng 版本
* 默认编译是eng 版本,如果需要编译user 版本,请加入参数 -o=TARGET_BUILD_VARIANT=user 如:
./mk -o=TARGET_BUILD_VARIANT=user mt6577_phone new


 其关键是分析Java Heap

* 抓取Hprof 的手法,如:
第一种方式: 使用am 命令

第二种方式: 使用DDMS 命令

第三种方式: 通过代码的方式

 在android.os.Debug 这个class 中有定义相关的抓取hprof 的method.
 如: public static void dumpHprofData(String fileName) throws IOException;
 这样即可在代码中直接将这个process 的hprof 保存到相对应的文件中,注意这个只能抓取当时的process.
 如果想抓其他的process 的hprof, 那么就必须通过AMS 帮忙了。
 可以先获取IActivityManager 接口,然后调用它的dumpheap 方法。具体的代码,大家可以参考
 frameworks/base/cmds/am/src/com/android/commands/am/am.java 中的调用代码
 


0 0
原创粉丝点击