『背水一战!』基于BART的系统分析与改进实验

来源:互联网 发布:淘宝关键词卡位路由器 编辑:程序博客网 时间:2024/06/13 01:50

3.20

正式开战!

(1)早上一直困扰于一个问题:读入gender.txt文件时出错,debug进去时发现乱码。

        解决: 使用inputstreamReader来读,将编码设为"utf-8"即可。发现解决方法是浏览gender.txt时发现出现了非英语字符。从而想到gbk不兼容。

       花费时间:3小时零12分钟。

 

(2)第二个问题:实验结果表示F值较低--40+,寻找原因。

      花费时间:2个小时,无果。从Eclipse转到Netbeans又转回Eclipse。

 

下一步计划是对SemEval的数据进行预处理并进行实验,看实验结果。

 

 

 

原创粉丝点击