postgresq+postgis导入导出shape文件的编码问题

来源:互联网 发布:电池修复软件 编辑:程序博客网 时间:2024/04/30 13:09

问题:想对一个140多万条记录的shape文件作属性编辑,但对GIS软件不熟悉。

解决方法:把shape文件导入到postgresql数据库,在数据库里通过sql语句处理好后,再导出成新的shape文件

环境:Windows, Postgresq8.3+postgis1.5, 数据库名postgis, 数据库编码UTF-8

 

1. 先把shape文件转成postgresql的sql脚本存在一个文本文件中

    shp2pgsql.exe -s 4267 -I -S -W GBK c:/locate/point_city_poi.shp point_city_poi > poi.sql

 

    * shp2pgsql是postgresql自带的一个命令行工具,在安装目录的bin目录下

    * -s 指定shape文件中空间数据的投影(如果不知道也可以不写)

    * -I 导入数据后在postgresql中建空间索引(可以不指定,推荐使用,提高效率)

    * -S 只使用simple的空间数据类型(可以不指定)。我这里需要保证只能为POINT,不能为MULTIPOINT,所以加了限制。

    * -W 指定shape文件的属性数据的编码格式。这个很重要了,如果指定不正确导入postgresql的属性数据很可能是乱码。

            我导入的shape文件中,属性数据是中文编码,所以用的GBK。在postgresql中对中文的支持好像就是GBK,默认字符集中没有

            GB2312和GB18030,

    *  c:/locate/point_city_poi.shp 要导入的shape文件路径

    *  > poi.sql 通过管道符 > 把输出的sql语句写入到名为 poi.sql 的文本文件中

 

2. 导入数据到postgresql

    用pgsql命令登陆到数据库的控制台界面(我登陆的数据库名字是postgis)。执行命令如下

    postgis=# /i  c:/poi.sql

    * /i 该命令用于执行一个外部的sql脚本文件。(其它命令还很多,用 /? 可以参考具体内容)

    *  c:/poi.sql 是步骤1中生成的sql脚本文件的存放位置。

       (注意,在windows下,正确的文件名应该是 c:/poi.sql,如果这样写,postgresql会报权限错误,我开始以为是文件访问的权限不够,配置了半天权限,但还是报错,后来把文件分割符改成反斜杠后,脚本开始执行)

  

3. 在数据库中编辑修改数据

    删除字段,增加字段,修改字段名称,给空字段负值等 。。

 

4. 导出数据成shape文件

    pgsql2shp.exe -f point_city_poi -P postgres -u postgres  postgis point_city_poi

    * pgsql2shp是postgresql自带的一个命令行工具,在安装目录的bin目录下

    * -f point_city_poi 导出shape文件的名字(可以更换成其它名字)

    * -P postgres 指定连接数据库的密码

    * -u postgres 指定连接数据库的用户

    * postgis  存放空间数据的数据库

    * point_city_poi 存放空间数据的表

 

    命令很简单,但导出数据后,发现属性数据是乱码。原因应该是,我数据库用的是UTF-8编码,用shp2pgsql生成sql脚本时,sql脚本里面的字符编码也是UTF-8的。所以导出的shape文件中,属性数据应该是UTF-8编码,在arcView中查看也是乱码。很奇怪,shp2pgsql命令生成sql脚本时,提供了-W参数来指定编码,但是用pgsql2shp时,却没有一个参数来指定导出数据时的编码。

    google后找到解决方发:在环境变量中设置 PGCLIENTENCODING=GBK,然后执行pgsql2shp,导出的shape文件中,属性数据编码正确是GBK的,没有显示乱码。

 

特此记录,以便以后查阅