java读写应用（为了舒适的阅读小说，将一个2Mtxt文档中的小说的每个章节抽取出来分别放在html文件中）

来源：互联网发布：淘宝详情分割线素材编辑：程序博客网时间：2024/04/26 18:43

最近喜欢上了看小说，到网上下载了一部《神墓》来看，但是其全部内容都放在一个文本文档

中，有2M大，仅仅打开这个文本文档就要花费不短的时间，因此我实现了下面的小程序，其功能

是：

将这部小说的内容按照章节抽出出来，分别放在一个html文件中，这样一来我就可以将背景颜色

调为柔和型的，不伤眼。

如：
第二部第六章终将一战这章节的内容将被放置在 "第二部第六章终将一战.html"的html文件

中，同时这个页面生成“上一页”，“目录”，“下一页”的超链接，最后将为所有的章节生成一个

目录。

当然下面的小程序有一些不足，但是我相信在大家的帮助下，它会越来越完善的。

package com.yj.generate;
/*
* 用来将只放在一个文件中的小说切隔成
* 一个章节的html页面，其中每个页面还包括上一页，下一页，目录的超链接
* 同时还生成一个目录文件contents.html
*====================
*注意源码的编码是：utf-8
*文件读取的来源文件的编码也需是utf-8
*===================
*这里的神墓的切隔的原理是：
*根据第一个章节的标题都包含："章 "
*
*/
import java.io.*;
import java.util.ArrayList;
import java.util.Scanner;

public class GeneraeHtml {

    private ArrayList<String> fileNames;

    public GeneraeHtml()
    {
        fileNames=new ArrayList<String>();
    }
    public void generateHtmlByFile(File file)throws Exception
    {
            generate(file);
            generateContent();

    }

    //Create all chapters's html file
    private void generate(File file)throws Exception
    {
        boolean isFirstTitle=true;
        Scanner sca=new Scanner(file);
        String currentContent="";
        String currentLineStr="";
        String currentPageFileName="";
        String nextPageFileName="";
        int currentPageIndex=-1;

        sca.useDelimiter("/n");

        while(sca.hasNext())
        {
            currentLineStr=sca.next();
            if(currentLineStr.indexOf("章 ")!=-1)
            {

                if(!isFirstTitle)
                {
                    System.out.println("Current output title:"+currentPageFileName);
                    nextPageFileName=(currentPageIndex+1)+currentLineStr.trim()+".html";
                    fileNames.add(nextPageFileName);

                    writeContent(currentContent,currentPageFileName,currentPageIndex);

                    currentPageFileName=nextPageFileName;
                    currentContent="";
                }else
                {
                    currentPageFileName=(currentPageIndex+1)+currentLineStr.trim()+".html";
                    fileNames.add(currentPageFileName);
                    isFirstTitle=false;
                }
                currentPageIndex++;

            }
            currentContent+=currentLineStr+"</br>";
        }
        sca.close();
    }

    //It will write the current chapter into a html file
    private void writeContent(String bodyContent,String currentFileName,int currentPageIndex)throws Exception
    {
        int previousPageIndex=0;
        int nextPageIndex=currentPageIndex+1;
        if(currentPageIndex!=0)
        {
            previousPageIndex=currentPageIndex-1;
        }
        String pageContent="<html>/n<head>/n"
                             +"<meta http-equiv='content-type' content='text/html;charset=utf-8'>/n"
                             +"</head>/n<body bgcolor='#e6f3ff'>/n"
                             +bodyContent
                             +"</br>"
                             +"<table align='center'>"
                             +"<tr>"
                             +"<td><a href='./"+fileNames.get(previousPageIndex)+"'>上一页</a></td>"
                             +"<td><a href='./contents.html'>目录</a></td>"
                             +"<td><a href='./"+fileNames.get(nextPageIndex)+"'>下一页</a></td>"
                             +"</tr>"
                             +"</table>"
                             +"</body>/n</html>";
        String filePath="神墓/"+currentFileName;
        PrintWriter out=new PrintWriter(new BufferedWriter(new FileWriter(filePath)));
        out.print(pageContent);
        out.flush();
        out.close();
    }

    //Create a html file contain chapter's reference.
    private void generateContent()throws Exception
    {
        String pageContent="<html>/n<head>/n"
                            +"<meta http-equiv='content-type' content='text/html;charset=utf-8'>/n"
                            +"</head>/n<body bgcolor='#e6f3ff'>/n"
                            +"<table align='center' width='80%' border=1>"
                            +"<tr align='center'>";
        for(int i=0;i<fileNames.size();i++)
        {
            String item=fileNames.get(i);
            pageContent+="<td width=33% color='green'><a href='./"+item+"'>"+item+"</a></td>";
            if((i+1)%3==0)
            {
                pageContent+="</tr>/n<tr align='center'>";
            }
        }
        pageContent+="</table>/n</body>/n</html>";
        PrintWriter out=new PrintWriter(new BufferedWriter(new FileWriter("神墓/contents.html")));
        out.print(pageContent);
        out.flush();
        out.close();

    }

    public static void main(String[] args) {
        GeneraeHtml generaeHtml=new GeneraeHtml();
        try
        {
           File file=new File("G:/神墓.TXT");
           generaeHtml.generateHtmlByFile(file);
        }catch(Exception e)
        {
            e.printStackTrace();
        }
    }

}

对应的流程图：

全部抽取成功后的部分html文件：

这是处理前的一个章节：

一个html文档显示一个章节：

这是生成的目录：