删除字符串中的控制字符(python)
来源:互联网 发布:metok是什么软件小米 编辑:程序博客网 时间:2024/05/16 07:07
要删除字符串中的控制字符,因为无符号控制字符不能够在xml中编码,诸如 ^B 转换成 \x02 ,如果作为内容写入xml,\ 会导致xml错误,所以需要把控制字符删除。
python 代码如下:
方法 一、
def strip_control_characters(str_input): if str_input: import re # unicode invalid characters RE_XML_ILLEGAL = u'([\u0000-\u0008\u000b-\u000c\u000e-\u001f\ufffe-\uffff])' + \ u'|' + \ u'([%s-%s][^%s-%s])|([^%s-%s][%s-%s])|([%s-%s]$)|(^[%s-%s])' % \ (unichr(0xd800),unichr(0xdbff),unichr(0xdc00),unichr(0xdfff), unichr(0xd800),unichr(0xdbff),unichr(0xdc00),unichr(0xdfff), unichr(0xd800),unichr(0xdbff),unichr(0xdc00),unichr(0xdfff), ) str_input = re.sub(RE_XML_ILLEGAL, "", input) # ascii control characters str_input = re.sub(r"[\x01-\x1F\x7F]", "", input) return str_input
方法 二、
strip_control_characters = lambda s:"".join(i for i in s if 31<ord(i)<127)
0 0
- 删除字符串中的控制字符(python)
- 删除字符串中的字符
- 删除字符串中的指定字符(23)
- 删除字符串中的特殊字符
- 删除字符串中的特定字符
- 删除字符串中的重复字符
- 删除字符串中的重复字符
- 删除字符串中的指定字符
- 删除字符串中的指定字符
- 删除字符串中的指定字符
- 删除字符串中的重复字符
- 删除字符串中的数字字符
- 删除字符串中的指定字符
- 删除字符串中的特定字符
- 删除字符串中的空格字符
- 删除字符串中的某个字符
- C 删除字符串中的字符
- 删除字符串中的指定字符
- 18.Argument replacement
- 1043. Is It a Binary Search Tree (25)
- JavaScript中的对象(二)——原型对象
- 纯css下拉
- java JMM
- 删除字符串中的控制字符(python)
- .9.png图片讲解
- unity3d 一键截图与调用
- 1.5.1 FROM子句
- TCP/IP学习与总结-1(TCP/IP 简介)
- Ubuntu 14.04 安装 Sublime Text 3
- 通用记忆函数
- APICloud Studio iphone真机调试失败:transferApplication package failed
- 1.5.2 WHERE子句