Python 出现 'gbk' codec can't encode character u'\xb6' 的解决办法

Python  

用 scrapy 获取网站信息的时候,出现以下错误:


'gbk' codec can't encode character u'\xb6' in position 24051: illegal multibyte sequence


网上查找得知,中文编码默认为 GBK 编码,但是字符的编码超出了GBK的编码范围导致错误,使用GBK的超集:GB18030(国家最新标准)解码即可。

str.encode('GB18030')


GB18030转换成UTF-8编码:

str.decode('GB18030').encode('utf-8')


GB18030是国家标准,在技术上是GBK的超集,并与其兼容,目前已经在MS Windows 9x/Me/NT/2000、IBM OS/2的系统中广泛应用。

时间:2018年01月05日    作者:孟德    分类:后端   浏览:6116    评论:0

链接地址:https://www.abclogs.com/backend_python_gbk_encode_error.html

评论列表

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。