多叉树结构:JSON数据解析(二)

来源:互联网 发布:java邮件设置传输协议 编辑:程序博客网 时间:2024/05/16 20:22

多叉树结构:JSON数据解析(二)


        在上篇文章中提到了JSON数据解析的基本方法,但是方法效率太低,这里接着上篇文章写写如何利用多叉树结构,定义对象,实现JSON数据字段快速随机访问。

JSON数据通常就是无根节点的多叉树结构,对于这种无根节点的多叉树,要实现快速随机访问得经历两个过程:隐式构造根节点,建立多叉树和遍历多叉树。


3.2 优化的方法——无根节点多叉树随机访问

        对于json的这种数据结构,目前大多数人的做法都是利用list,或者LinkedHashMap去实现,一层层地map套map的结构,非常麻烦。

        其实仔细分析下json样本数据的结构就可以知道,其实很多json数据格式都是个没有根节点的多叉树,那么为什么不构造一个隐式的根节点呢?剩下的就是构造多叉树和多叉树的遍历过程了。

        并且在随机访问方面,任意给定一个节点,我可以拿到该节点作为子树下所有节点,并且后续还可以扩展为另一种形式:通过节点拿到其所有同名兄弟节点(同层同名字段)。

分析下节点的分类:1.(只有值)无子节点;

                                    2.(有值)有子节点:

                                                 2.1 有单子节点”ss_”开头标记

                                                 2.2 有多值节点”bb_”开头标记

        定义几个节点对象,作为基础数据结构实现:


        下面开始构建多叉树,然后遍历多叉树打印输出节点:

import java.io.File;import java.io.IOException;//import java.util.Iterator;//import java.util.LinkedHashMap;import org.apache.commons.io.FileUtils;import com.alibaba.fastjson.JSONArray;import com.alibaba.fastjson.JSONObject;import com.data.jsontrans.entity.*;public class BuildTreeAction {RootNode root = new RootNode();//SingleNode singlenode = new SingleNode();//MultiNode multinode = new MultiNode();//root.getChilds().add(singlenode);//root.getChilds().add(multinode);public static void main(String[] args) throws IOException{GetData();}public static void GetData() throws IOException{BuildTreeAction bdtree = new BuildTreeAction();String json = FileUtils.readFileToString(new File("e:/data/json4.txt"));JSONObject jsono = JSONObject.parseObject(json);JSONObject b = jsono.getJSONObject("aggregations");//bdtree.buildResult(b);bdtree.BuildTree(b);Node node;node = bdtree.CreateTree(b);}public Node CreateTree(JSONObject b){SingleNode snode = new SingleNode();MultiNode mnode = new MultiNode();RootNode rnode = new RootNode();return rnode;}public void BuildTree(JSONObject b){for(String key : b.keySet()){if(key.startsWith("bb_")){MultiNode multinode = new MultiNode();root.getChilds().add(multinode);if(key.equals("bb_appId")){multinode.setNodeId("bb_appId");JSONObject buckets = b.getJSONObject(key);JSONArray bArray = buckets.getJSONArray("buckets");for(int i=0; i<bArray.size(); i++){JSONObject o = bArray.getJSONObject(i);multinode.setKey(o.get("key").toString());multinode.setDoc_count(o.get("doc_count").toString());System.out.println("key:"+multinode.key); //key:UZ6958037483314System.out.println("doc_count:"+multinode.doc_count); //doc_count:361for(String sub1_key : o.keySet()){if(sub1_key.startsWith("bb_")){MultiNode sub1_multinode = new MultiNode();multinode.getChilds().add(sub1_multinode); //在bb_appId的multinode加上子节点"bb_?"if(sub1_key.equals("bb_versionCode")){sub1_multinode.setNodeId("bb_versionCode");JSONObject sub1_buckets = o.getJSONObject(sub1_key);JSONArray sub1_bArray = sub1_buckets.getJSONArray("buckets");for(int j=0; j<sub1_bArray.size(); j++){JSONObject o1 = sub1_bArray.getJSONObject(j);sub1_multinode.setKey(o1.get("key").toString());sub1_multinode.setDoc_count(o1.get("doc_count").toString());System.out.println("key:" + sub1_multinode.key);System.out.println("doc_count:" + sub1_multinode.doc_count);for(String sub2_key : o1.keySet()){if(sub2_key.startsWith("bb_")){MultiNode sub2_multinode = new MultiNode();sub1_multinode.getChilds().add(sub2_multinode); //在bb_versionCode的sub1_multinode加上多子节点if(sub2_key.equals("bb_isNewVersion")){multinode.setNodeId("bb_isNewVersion");JSONObject sub2_buckets = o.getJSONObject(key);JSONArray sub2_bArray = sub2_buckets.getJSONArray("buckets");for(int k=0; k<sub2_bArray.size(); k++){JSONObject o2 = sub2_bArray.getJSONObject(k);multinode.setKey(o2.get("key").toString());multinode.setDoc_count(o2.get("doc_count").toString());System.out.println("key:"+multinode.key);System.out.println("doc_count:"+multinode.doc_count);}}else if(sub2_key.equals("bb_isNew")){sub2_multinode.setNodeId("bb_isNew");JSONObject sub2_buckets = o1.getJSONObject(sub2_key);JSONArray sub2_bArray = sub2_buckets.getJSONArray("buckets");for(int k=0; k<sub2_bArray.size(); k++){JSONObject o2 = sub2_bArray.getJSONObject(k);sub2_multinode.setKey(o2.get("key").toString());sub2_multinode.setDoc_count(o2.get("doc_count").toString());System.out.println("key:"+sub2_multinode.key);System.out.println("doc_count:"+sub2_multinode.doc_count);}}}else if(sub2_key.startsWith("ss_")){SingleNode sub2_singlenode = new SingleNode();sub1_multinode.getChilds().add(sub2_singlenode); //在bb_versionCode的sub1_multinode加上单子节点if(sub2_key.equals("ss_usercount")){sub2_singlenode.setNodeId("ss_usercount");sub2_singlenode.getSnode().setNodeId("value");sub2_singlenode.getSnode().value = o1.getJSONObject("ss_usercount").getString("value");System.out.println("ss_appId: "+"value:"+sub2_singlenode.getSnode().value);}}}}}/*else if(subkey1.equals("bb_versionId")){//同上处理...}*/}else if(sub1_key.startsWith("ss_")){SingleNode sub1_singlenode = new SingleNode();multinode.getChilds().add(sub1_singlenode); //在bb_appId的multinode加上子节点"ss_?"if(sub1_key.equals("ss_versionCode")){sub1_singlenode.setNodeId("ss_versionCode");sub1_singlenode.getSnode().setNodeId("value");sub1_singlenode.getSnode().value = o.getJSONObject("ss_appId").getString("value");System.out.println("ss_appId: "+"value:"+sub1_singlenode.getSnode().value);}/*else if(sub1_key.equals("ss_versionId")){//同上处理...}*/}}}}}else if(key.startsWith("ss_")){SingleNode singlenode = new SingleNode();root.getChilds().add(singlenode);ss_mynode(b, key, singlenode, "ss_appId");/*else if(key.equals("ss_usercode")){//...其他"ss_usercode"同上类似处理...//}*/}else{System.out.println("nothing");}}}

运行结果:



3.3 效率优化——迭代+递归实现

        实际上树的构建和遍历通常用递归实现,这里迭代for循环判断节点就两种类型:单值”ss_”和多值”bb_”节点,这就足够了——for循环迭代+递归。基本思路就是循环依次读取每个节点,每次判断是否单值或多值节点,如果多值节点,继续以其下子节点作为parent再继续递归,传回的参数就是本次节点Node及层级编号。

import java.io.File;import java.io.IOException;import java.util.Iterator;import java.util.List;import java.util.ArrayList;//import java.util.LinkedHashMap;import org.apache.commons.io.FileUtils;import com.alibaba.fastjson.JSONArray;import com.alibaba.fastjson.JSONObject;import com.data.jsontrans.entity.*;public class CreateTreeAction {public static void main(String[] args) throws IOException{CreateTreeAction ctree = new CreateTreeAction();String json = FileUtils.readFileToString(new File("e:/data/json4.txt"));JSONObject jsono = JSONObject.parseObject(json);JSONObject b = jsono.getJSONObject("aggregations");Node root = ctree.buildJsonTree(b);}public Node buildJsonTree(JSONObject b){RootNode node = new RootNode(); //通用变量nodebuildTree(node,b);return node; }public void buildTree(Node parent, JSONObject b) {for(String key : b.keySet()){if(key.startsWith("bb_")){//MultiNode multinode = createMutilNode(b, key);MultiNode multinode = new MultiNode();multinode.setNodeId(key);JSONObject buckets = b.getJSONObject(key); JSONArray bArray = buckets.getJSONArray("buckets");for(Iterator iterator = bArray.iterator(); iterator.hasNext(); ){JSONObject o = (JSONObject) iterator.next();if(o.get("key_as_string")!=null){multinode.setKey_as_string(o.get("key_as_string").toString());System.out.println(multinode.key_as_string);}multinode.setKey(o.get("key").toString());multinode.setDoc_count(o.get("doc_count").toString());System.out.println(multinode.key);System.out.println(multinode.doc_count);parent.getChilds().add(multinode);buildTree(parent, o);  //迭代计算buildTree()}//parent.getChilds().add(multinode);}else if(key.startsWith("ss_")){//SingleNode singlenode = createSingleNode(b, key);SingleNode singlenode = new SingleNode();singlenode.setNodeId(key);singlenode.value = b.getJSONObject(key).getString("value");System.out.println("ss_ "+"value:"+singlenode.value);parent.getChilds().add(singlenode);}}}}

看下效果图:



(原创文章,转载请注明出处)

0 0
原创粉丝点击