soot代码分析框架的基础知识(二)

来源:互联网 发布:淘宝卖家寄错地址 编辑:程序博客网 时间:2024/06/08 05:55

Soot中的结构

本篇内容简单概括一下:soot中存在的主要对象、soot的执行流。

Soot中提供了几种对象,分别是:Scene、SootClass、SootMethod、SootField、Body。表示的意义如下所示:

Scene:Scene表示完整的分析环境,可以通过Scene.v()调用设置Options的API,也可以获取一些过程间分析的信息,如call graphs和points-to information(指向性分析)。如果分析的是Java工程,可以获取待分析的工程中存在哪些类。

SootClass:表示soot加载的待分析的类或者soot创建的类。如果分析的是Java源码,可以理解为SootClass对象代表Java源码中的某个类。

SootMethod:表示SootClass中的单个方法。
SootField:表示SootClass中的某个字段。

Body:表示方法主体,由Locals链(body.getLoclas())、Units链(body.getUnits())、Traps链(body.getTraps())组成。Locals链存储方法中的变量定义、Units链存储方法中的句子、Traps链存储方法中发生异常的语句。如下代码片段:

public int bar(){Foo r0;int i0,$i1;r0:=@this:Foo;//IdentityStmti0:=@parameter():int;//IdentityStmt$i1=i0+21;//AssignStmtReturn $i1;//ReturnStmt}

Body.getLocals()得到的链存储的内容就是:Foor0;int i0,$i1;

Body.getUnits()得到的链存储的内容就是:r0:=…;…Return$i1;

Stmt与Unit

Stmt与Unit都表示方法中的一个句子。interface Unit继承于interface Stmt;同样AssignStmt、IdentityStmt、IfStmt、RetrunVoidStmt、NopStmt等也继承于interface Stmt。它们的不同在于:Unit注重于句子的构成、而AssignStmt这些则注重于是哪种句式。需要注意的是:AssignStmt表示赋值语句;而IdentityStmt表示将参数赋值给Local这样的语句。

下面是Unit对象提供的一些关键API:

public List<ValueBox> getUseBoxes();//返回Unit中使用的Value的引用public List<ValueBox> getDefBoxes();//返回Unit中定义的Value的引用public List<ValueBox> getUseAndDefBox();//返回Unit中定义并使用的Value的引用public List geUnitBoxes();//获得被这个unit跳转到的UnitxBox的Listpublic List getBoxesPointingTothis();//获得该unit作为跳转对象时,所有跳转本身的UnitBoxpublic boolean fallsThrough();//如果接下来执行后面挨着的unit,则为truepublic boolean branches();//如果执行时会跳转到其他别的unit,则返回true。如:IfStmt、GotoStmtpublic void rediectJumpsToThisTo(Unit newLocation);//该方法把跳转到该unit重定向到newLocation

注:一般Value指的是Local(变量)、Expr(表达式)、Constant(常量)。

Soot的中间语言:

soot可以生成四种不同的中间语言:grimple、shimple、jimple、baf。其中一般采用的过程内/过程间分析都在在jimple中间语言上进行的。中间语言的特点灯具体信息可以查看A Survivor’s Guide to Java Program Analysis with Soot第8-15页内容。

Soot的执行流

Soot执行被分成几个阶段,这些阶段被称为packs。第一步是生成Jimple代码,然后将Jimple代码输入到其他packs中。这个步骤是通过解析class、jimple或java文件再通过Jimple Body(jb)传递它们的结果而完成的。
Soot根据分析问题是过程内分析还是过程间分析,会有不同的执行流。

过程内分析的执行流

过程内分析简单的说就是被分析的程序中不存在函数调用。


这些Pack的命名规则非常简单:第一个字母表示采用哪种中间语言,如:s表示shimple,j表示jimple,b表示baf,g表示grimp;第二个字母表示进行的pack的哪一步,如:b表示body creation,t表示transformation,o表示optimizations,a表示annotion。例如:jap表示jimple annotations pack。(注:命名规则在过程内分析、过程间分析都适用)

如上图所示:一般每种语言都有:transformation(转换)、optimizations(优化)、annotion(注释)三步。注意上图应该省略了jb(jimple bodycreation)这个阶段

其中,在jtp和stp阶段是允许我们插入自定义的transformation(指的并不是添加jtp,而是jtp阶段中的某一步)。

PackManager.v().getPack("jtp").add(new Transform("jtp.myTransform", new BodyTransformer(){@Overrideprotected void internalTransform(Body b, String phaseName,Map options) {// TODO Auto-generated method stub...}}
上述代码就是在jtp pack中插入小步骤myTransform,但soot的执行流执行完自定义的myTransform后,将继续沿着执行流执行,自定义的小步骤就像soot的一个插件,并不影响其他的执行流顺序。

过程间分析的执行流

过程间分析简单的说就是存在函数调用。
在过程间分析中,soot的执行流会有所不同。在过程间分析时,需要指定soot运行在whole-program mode下。此时,soot会增加三个阶段:cg(call-graph generation)、wjtp(whole jimple transformation pack)、wjap(whole jimple annotation pack)。

jb:指的是jimple body creation。Soot会对所有的method body执行jimple body creation,不可改变,与jimple生成有关。
其中,可以向此执行流中添加自定义的wjtp(此处指的并不是添加wjtp,而是在wjtp这个阶段中的添加某一步)
例如:
PackManager.v().getPack("wjtp").add(new Transform("wjtp.myTransform", new SceneTransformer() {@Overrideprotected void internalTransform(String arg0,Map<String, String> arg1) {// TODO Auto-generated method stub...}}));
上述代码就是在wjtp pack中插入一个小步骤myTransform。但soot的执行流执行完自定义的myTransform后,将继续沿着执行流执行,自定义的小步骤就像soot的一个插件,并不影响其他的执行流顺序。


注意:上述的过程内soot执行流和过程间soot执行流都只是列出了pack,而在每个pack中仍然存在数个小步骤。

如果需要查看可用的pack信息,可以使用下述命令:
java –cp soot-trunk.jar soot.Main -pl

如果想查看某个pack的帮助信息,可以使用下述命令:
java –cp soot-trunk.jar soot.Main -ph PACK

下面则是使用第一条命令时,得到的可用的pack信息
jb                            Creates a JimpleBody for each method     jb.ls                        Local splitter: one local per DU-UD web     jb.a                         Aggregator: removes some unnecessary copies     jb.ule                       Unused local eliminator     jb.tr                        Assigns types to locals     jb.ulp                       Local packer: minimizes number of locals     jb.lns                       Local name standardizer     jb.cp                        Copy propagator     jb.dae                       Dead assignment eliminator     jb.cp-ule                    Post-copy propagation unused local eliminator     jb.lp                        Local packer: minimizes number of locals     jb.ne                        Nop eliminator     jb.uce                       Unreachable code eliminator     jb.tt                        Trap Tightener  jj                            Creates a JimpleBody for each method directly                                from source     jj.ls                        Local splitter: one local per DU-UD web     jj.a                         Aggregator: removes some unnecessary copies     jj.ule                       Unused local eliminator     jj.tr                        Assigns types to locals     jj.ulp                       Local packer: minimizes number of locals     jj.lns                       Local name standardizer     jj.cp                        Copy propagator     jj.dae                       Dead assignment eliminator     jj.cp-ule                    Post-copy propagation unused local eliminator     jj.lp                        Local packer: minimizes number of locals     jj.ne                        Nop eliminator     jj.uce                       Unreachable code eliminator  wjpp                          Whole Jimple Pre-processing Pack  wspp                          Whole Shimple Pre-processing Pack  cg                            Call graph constructor     cg.cha                       Builds call graph using Class Hierarchy                                  Analysis     cg.spark                     Spark points-to analysis framework     cg.paddle                    Paddle points-to analysis framework  wstp                          Whole-shimple transformation pack  wsop                          Whole-shimple optimization pack  wjtp                          Whole-jimple transformation pack     wjtp.mhp                     Determines what statements may be run                                  concurrently     wjtp.tn                      Finds critical sections, allocates locks     wjtp.rdc                     Rename duplicated classes when the file                                  system is not case sensitive  wjop                          Whole-jimple optimization pack     wjop.smb                     Static method binder: Devirtualizes                                  monomorphic calls     wjop.si                      Static inliner: inlines monomorphic calls  wjap                          Whole-jimple annotation pack: adds                                interprocedural tags     wjap.ra                      Rectangular array finder     wjap.umt                     Tags all unreachable methods     wjap.uft                     Tags all unreachable fields     wjap.tqt                     Tags all qualifiers that could be tighter     wjap.cgg                     Creates graphical call graph.     wjap.purity                  Emit purity attributes  shimple                       Sets parameters for Shimple SSA form  stp                           Shimple transformation pack  sop                           Shimple optimization pack     sop.cpf                      Shimple constant propagator and folder  jtp                           Jimple transformation pack: intraprocedural                                analyses added to Soot  jop                           Jimple optimization pack (intraprocedural)     jop.cse                      Common subexpression eliminator     jop.bcm                      Busy code motion: unaggressive partial                                  redundancy elimination     jop.lcm                      Lazy code motion: aggressive partial                                  redundancy elimination     jop.cp                       Copy propagator     jop.cpf                      Constant propagator and folder     jop.cbf                      Conditional branch folder     jop.dae                      Dead assignment eliminator     jop.nce                      Null Check Eliminator     jop.uce1                     Unreachable code eliminator, pass 1     jop.ubf1                     Unconditional branch folder, pass 1     jop.uce2                     Unreachable code eliminator, pass 2     jop.ubf2                     Unconditional branch folder, pass 2     jop.ule                      Unused local eliminator  jap                           Jimple annotation pack: adds intraprocedural                                tags     jap.npc                      Null pointer checker     jap.npcolorer                Null pointer colourer: tags references for                                  eclipse     jap.abc                      Array bound checker     jap.profiling                Instruments null pointer and array checks     jap.sea                      Side effect tagger     jap.fieldrw                  Field read/write tagger     jap.cgtagger                 Call graph tagger     jap.parity                   Parity tagger     jap.pat                      Colour-codes method parameters that may be                                  aliased     jap.lvtagger                 Creates color tags for live variables     jap.rdtagger                 Creates link tags for reaching defs     jap.che                      Indicates whether cast checks can be                                  eliminated     jap.umt                      Inserts assertions into unreachable methods     jap.lit                      Tags loop invariants     jap.aet                      Tags statements with sets of available                                  expressions     jap.dmt                      Tags dominators of statement  gb                            Creates a GrimpBody for each method     gb.a1                        Aggregator: removes some copies, pre-folding     gb.cf                        Constructor folder     gb.a2                        Aggregator: removes some copies, post-folding     gb.ule                       Unused local eliminator  gop                           Grimp optimization pack  bb                            Creates Baf bodies     bb.lso                       Load store optimizer     bb.pho                       Peephole optimizer     bb.ule                       Unused local eliminator     bb.lp                        Local packer: minimizes number of locals  bop                           Baf optimization pack  tag                           Tag aggregator: turns tags into attributes     tag.ln                       Line number aggregator     tag.an                       Array bounds and null pointer check                                  aggregator     tag.dep                      Dependence aggregator     tag.fieldrw                  Field read/write aggregator  db                            Dummy phase to store options for Dava     db.transformations           The Dava back-end with all its                                  transformations     db.renamer                   Apply heuristics based naming of local                                  variables     db.deobfuscate               Apply de-obfuscation analyses     db.force-recompile           Try to get recompilable code. 
1 0
原创粉丝点击