语料处理之全角转半角
来源:互联网 发布:数据集成方法 编辑:程序博客网 时间:2024/06/06 10:06
该脚本的功能是把文本文件中的全角字符转换为半角字符:
# -*- coding: utf-8 -*- def strQ2B(inputFilePath,outputFilePath): outputFile = open(outputFilePath,'w') with open(inputFilePath) as inputFile: lines = inputFile.readlines() for line in lines: ustring = line.decode('utf-8') rstring = "" for uchar in ustring: inside_code=ord(uchar) if inside_code == 12288: #全角空格直接转换 inside_code = 32 elif (inside_code >= 65281 and inside_code <= 65374): #全角字符(除空格)根据关系转化 inside_code -= 65248 rstring += unichr(inside_code) outputFile.write(rstring.encode('utf-8')) outputFile.close() if __name__ == "__main__": inputFilePath = "../1.txt" outputFilePath = "../2.txt" strQ2B(inputFilePath,outputFilePath)
0 0
- 语料处理之全角转半角
- java 字符串处理(全角转半角,半角转换全角)
- c#之半角转全角
- SEO之半角 全角
- 全角转半角 半角转全角
- 全角转半角与半角转全角
- 半角转全角、全角转半角
- 转全角半角
- 半角转全角
- 全角转半角
- 全角转半角函数
- VBA 全角转半角
- php 全角转半角
- 全角转半角
- 半角全角互转
- 日文全角转半角
- SQL 全角转半角
- 全角转半角
- Java面向对象(四)抽象类
- AssetBundle-----资源加载(读取assetbundle)
- JSP
- Tiny4412 开发环境搭建(一)
- 认识iOS的RunLoop
- 语料处理之全角转半角
- 学习笔记
- 221. Maximal Square -Medium
- java垃圾回收机制(二)
- 图像处理之每日一练:噪声的添加和过滤
- Handler详解
- 2017.2.11【初中部 GDKOI】模拟赛B组题解
- 1112. Stucked Keyboard (20) -- 字符串处理,使用map
- 什么情况下用标准梯度下降法,什么情况下用随机梯度下降法