python mysql 抓取入库乱码


试了很多办法都无法解决
requests 获取
BeautifulSoup 解析
MySQLdb 入库
页面编码是 ISO-8859-1
数据库 编码是统一使用 utf8
目标内容直接写到文本中,可以正常显示

但是入库后就是乱码

中文乱码 python 乱码

我与泰迪对愁眠 10 years, 10 months ago

问题已经解决了,原因是requests 获取的response 编码有些情况下不准确,强制解码 可是作为unicode 使用,但是入库时会出现异常,跟其他组件没有关系。

办法就是使用 chardet 再次检测 reponse.content的编码,指定给response

一代阿迪王 answered 10 years, 10 months ago

BeautifulSoup 解析的时候得utf-8

LOLI控哥哥 answered 10 years, 10 months ago

Your Answer