程序博客网 > 卓讯数据库

写爬虫时遇到的 &nbsp 处理

来源：互联网发布：卓讯数据库编辑：程序博客网时间：2024/05/19 00:35

爬取到html内容含有 &nbsp（no-break space = non-breaking space（html中的键盘输入的多个空格会被折断为一个空格））时，将该内容无法GBK形式编码，为了不影响编码，应该使用方法

string.replace(u'\xa0', u' ')

其中string为待操作的字符串

阅读全文

0 0

卓讯数据库

卓讯数据库

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子电子科技大学沙河校区 17做网店广州沙河中央财经大学沙河校区荆门沙洋沙洋社区沙洋沙洋社区网沙洋县沙洋论坛沙洋信息网沙洋鲜花店沙洋铁路沙洋联通沙洋鲜花中国沙洋沙洋市沙洋县属于哪个市长沙洋湖宜家被叫停沿江高铁沙洋沙洋县鲜花店沙洋社区论坛寂寞沙洲鱼骨沙洲沙洲优黄失落沙洲沙洲沙洲坝沙洲工学院沙洲坝旅游沙洲市寂寞沙洲冷歌词寂寞沙洲歌词沙洲职业工学院寂寞沙洲冷吉他谱沙洲优黄价格表失落沙洲歌词寂寞沙洲岭歌词寂寞沙洲冷简谱寂寞沙洲冷歌曲沙洲职业工学院专升本沙洲职业工学院成教