Python 出现 'gbk' codec can't encode character u'\xb6' 的解决办法

用 scrapy 获取网站信息的时候，出现以下错误：

'gbk' codec can't encode character u'\xb6' in position 24051: illegal multibyte sequence

网上查找得知，中文编码默认为 GBK 编码，但是字符的编码超出了GBK的编码范围导致错误，使用GBK的超集：GB18030（国家最新标准）解码即可。

str.encode('GB18030')

GB18030转换成UTF-8编码：

str.decode('GB18030').encode('utf-8')

GB18030是国家标准，在技术上是GBK的超集，并与其兼容，目前已经在MS Windows 9x/Me/NT/2000、IBM OS/2的系统中广泛应用。

时间：2018年01月05日作者：孟德分类：后端浏览：6116 评论：0

链接地址：https://www.abclogs.com/backend_python_gbk_encode_error.html

前一篇：Python常见函数修饰符
后一篇：Python中 os.mkdir 与 os.makedirs 创建目录的区别

您可能对这些内容感兴趣

Golang：解决国内 go get 无法下载的问题  07-03
Emgu CV3+C#图像处理：霍夫圆检测/线检测 & 矩形/三角形检测（转）  10-27
Windows 下使用 VSCode 编译调试c/c++  07-10
jieba（结巴）分词种词性简介（转）  06-07
Python中 os.mkdir 与 os.makedirs 创建目录的区别  01-08
Python 出现 'gbk' codec can't encode character u'\xb6' 的解决办法  01-05

评论列表

发表评论:取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

2020年7月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

最近发表

标签列表

ZBlog 3
PHP 15
SSL 3
Linux 12
CentOS 7
yum 3
Bootstrap 7
Nginx 6
MySQL 4
Json 1
Visual Studio Code 3
JQuery 1
CSS 5
Yii 8
DedeCMS 1
Less 1
Composer 1
Python 4
C 1
C++ 1
C# 1
Emgu 1
OpenCV 1
Go 1
Go Module 1

最新留言

文章归档

友情链接