在网上抓取的新闻,有时候会遇到这样的点,文字编码已经转换过了,但还是会报错 'gbk' codec can't encode character '\u2022' in position 20
不知道该如何处理这个点。系统 是 python3.4+sublime
1
bxb100 2017-03-15 23:37:00 +08:00 via Android
转成 UTF-8 应该能解决啊
|
2
PythonAnswer 2017-03-16 02:22:57 +08:00 via Android
不 print 出来 是没事的。你的 windows stdout 不是 utf8 。
|
3
nyanyh 2017-03-16 07:14:23 +08:00
执行 py 脚本前先在 cmd 执行一下 chcp 65001
|
4
backing 2017-03-16 12:33:50 +08:00
可能这个字符 gbk 没有收录,可以考虑用 GB18030
|