linux 命令行使用hanlp

来源:互联网 发布:书生商友软件下载 编辑:程序博客网 时间:2024/06/05 03:31

本文主要工作是在linux服务器上使用hanlp, 测试源码主要是hanlp源码中的

HanLP-1.3.1\src\test\java\com\hankcs\demo\DemoKeyword.java

1. 文件内容结构介绍

本人的工作目录命名为hanlp,该目录下主要由以下文件:
这里写图片描述

  • META-INF 存放文件MANIFEST.MF文件
Manifest-Version: 1.0Main-Class: com.hankcs.demo.DemoKeyword
  • main 文件夹对应hanlp源码中HanLP-1.3.1\src\main 文件夹。
  • data 文件夹则是hanlp的data文件
  • wordseg.jar 生成的jar文件
  • sourcelist 文件记录了main中所有的java文件,用于对这些文件进行编译
  • run.sh 执行程序的脚本
#!bin/bash# 在此本人特意将hanlp的核心算法部分main和待测试的示例DemoKeyword.java分开编译# 主要是为了展示下java编译的两种情况,单文件编译和多文件编译(多文件需要构造sourcelist,命名可自定义)# sourcelist 记录所有java文件路径 # 1. 单文件编译# -d 表示编译生成java文件中package对应的文件目录,# . 表示编译目录在当前路径下构建javac -d . DemoKeyword.java# 2. 多文件编译,借助sourcelist文件find main/ -name '*.java' > sourcelist  javac @sourcelist -d .# 打包jar -cvfm wordseg.jar META-INF/MANIFEST.MF com/# 运行jar包java -jar wordseg.jar
  • DemoKeyword.java 测试示例文件

执行run.sh脚本文件即可得到运行结果:

bash run.sh

这里写图片描述