DBUnit导出数据库的中文问题

来源:互联网 发布:淘宝有卖电棍的吗 编辑:程序博客网 时间:2024/05/08 02:06

DBUnit在导出数据库记录时,默认情况下采用的是\”UTF-8\”编码,因此会导致乱码。我在mysql和oracle下分别做了试验,如果是用java application,针对mysql的url字串需要指定编码格式,比如:

jdbc:mysql://127.0.0.1/test?useUnicode=true&characterEncoding=GB2312

而对于oracle,则只需要直接给出url就可以了。

查看了一下DBUnit的源码,FlatXmlDataSet的write方法有三种形式:

public static void write(IDataSet dataSet, Writer writer)
public static void write(IDataSet dataSet, Writer writer, String encoding)
public static void write(IDataSet dataSet, OutputStream out)

如果传入OutputStream对象,就会有问题(具体原因待查),而如果传入FileWriter,则一切正常:

IDataSet fullDataSet = connection.createDataSet();
FlatXmlDataSet.write(fullDataSet, new FileWriter(\”full.xml\”), \”GB2312\”);

encoding参数可以不指定,DBUnit会自动判断,在我的机器上,最后生成的xml,encoding是\”GB1030\”。

另一方面,如果使用build脚本来实现导出功能,则会遇到一些麻烦:

首先,对于mysql的url字串,如果不将&替换成&,则会遇到The reference to entity \”characterEncoding\” must end with the \’;\’ delimiter的错误。

其次,通过查找DBUnit的源码发现,dbunit task中的export,是使用OutputStream作为FlatXmlWriter的传入参数的:

OutputStream out = new FileOutputStream(_dest);
FlatXmlWriter writer = new FlatXmlWriter(out);
writer.setDocType(_doctype);
writer.write(dataset);

不得已,只好将其改为FileWriter的,重新打包后即可彻底解决中文乱码的问题了。
转自:http://morningspace.51.net/weblog/?p=97

原创粉丝点击