大数据处理大题

来源:互联网 发布:nginx指定ip转发 编辑:程序博客网 时间:2024/04/24 15:32

学校图书馆共有 300 万册图书,想统计其中 Computer , Science ,计算机,科学这几个词出现的次数,并按照自然年度分类,如 2016 年出版的书籍中这几个词各自出现的次数, 2015 年······依次类推。

1.首先将不同年份的书分别记录在不同的文件中, 比如 2016.txt , 2015.txt2.对每一年的图书记录进行遍历, 解析 HashMap<String, Integer> map    统计关键词  和 出现的次数HashMap<Stirng, Integer> map = new HashMap<>();map.put("Computer",0);map.put("Science",0);map.put("计算机",0);map.put("科学",0);public HashMap<String, Integer> calculateTimes(HashMap<String, Integer> map,String bookName){    if(bookName.length() <= 0){        return map;    }    if(bookName.contains("Computer")){        map.put("Computer", map.get("Compute")++);    }else if(bookName.contains("Science")){      map.put("Computer", map.get("Science")++);  }else if(bookName.contains("计算机")){                 map.put("计算机", map.get("计算机")++);        }else if(bookName.contains("科学")){                map.put("科学", map.get("科学")++);        }         return map;}