本文摘自php中文网,作者烟雨青岚,侵删。

python写入html文件中文乱码问题
使用open函数将爬虫爬取的html写入文件,有时候在控制台不会乱码,但是写入文件的html中的中文是乱码的
案例分析
看下面一段代码:
1 2 3 4 5 6 7 8 | # 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__' :
url = "http://www.renren.com/967487029/profile"
rsp = request.urlopen(url)
html = rsp.read().decode() with open( "rsp.html" , "w" ) as f: # 将爬取的页面
print (html)
f.write(html)
|
看似没有问题,并且在控制台输出的html也不会出现中文乱码,但是创建的html文件中

解决方案
阅读剩余部分
相关阅读 >>
Python之禅怎么打出来
Python3中时间处理与定时任务的方法介绍(附代码)
Python访问限制私有还是公有的介绍(附示例)
Python嵌套字典比较值,取值的实例详解
Python类方法和静态方法的区别
Python爬虫可以自学吗
Python如何读取 .ini 格式文件(代码)
Python中函数参数的详细介绍(附实例)
Python实现爬虫设置代理ip和伪装成浏览器的方法分享
Python 的自省是什么?
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » 如何解决python写入html文件中乱码的现象(图文详解)