稳定性面试一文通
一、ANR
Activity或Input事件5秒无响应,Broadcast 10s,Service 20s,content provider 10s都会触发;
生成log
在主log中搜索 ANR 会有明显的打印;同时会生成 data/anr/trace.txt文件;
在trace文件中可以看到线程名,优先级,线程ID,线程状态以及ANR的原因。
解决方法
将所有的耗时操作不要放在主线程,比如网络通信,socket通信,SQI操作,文件读写或者有可能的阻塞放在子线程中执行。
二、crash
抛出Exception或者Error都会导致系统崩溃,应用或是进程的强制退出。
从Fork进程开始,就已存在UncaughtException位于AMS中对异常的处理;
1,进程Fork之后,就会注册一个UncaughtHandler;
2,UncaughtHandler接收到未捕获的异常,弹出Force CLose弹窗。
三、tomestone
当一个动态库native开始时,会注册一些debugger的signalhandlers,当系统crash时,会保存一个tomestone到data/tomestone目录下,文件中保存了进程号,线程号,死亡地址,堆栈信息。特别注意,当tid = pid时,问题出在父线程。
四、Watchdog
Android 中的SystemServer运行的服务超过50种,Android便开发了Watchdog监控SystemServer种的线程,一旦发现问题,Watchdog会杀死SystemServer进程。
工作原理
Watchdog一直向监控的线程队列中投递Runnable,来检查在指定时间内是否返回,如果超时不返回,则视为死锁,记录该watchdog记录,并做后续dump处理,然后kill掉当前SystemServer进程。
Watchdog在循环中发现所有服务中最长的无响应时,超过30s时会重新计时30s,如果时间在30s-60s内恢复正常,会抓取AMS,kernel等堆栈信息,如果超过60s,输出log,重启手机。
log信息
在log中搜索 “WATCHDOG” 来检测它的状态,COMPLETED 代表正常;WATING代表不到30s,不算超时,继续监听;WATED_HALF已经超时30s,开始dump关键信息。继续监听30s;OVERDUE准备kill当前进程
五、NE
Native Exception ,Android中主要在用户空间运行的native程序或native库发生异常。NE问题通常带来程序崩溃现象,导致功能模块不稳定。
log信息
在NE的log中一般会打印地址值,通过adb shell -X 可获取进程虚拟地址空间的映射文件。
常见的问题类型有:
1》主动抛出异常,代码中调用abort,系统会给进程发送信号SIGABRT(6),这种问题通常是代码执行到了异常分支,需要检查看看什么事件导致
2》进程被信号SIGKILL(9)杀死,比如通过adb shell -9 或者某种进程管理机制杀掉,一般不会生成tomestone
3》空指针,SIGSEG(11)错误信号会发送
4》野指针,指向一个无效地址,如果该地址无法读写,马上crash
5》数组越界/缓冲区溢出,情况与野指针类似,踩了别人的内存区域
|