如何解决python写入html文件中乱码的现象(图文详解)


本文摘自php中文网,作者烟雨青岚,侵删。

python写入html文件中文乱码问题

使用open函数将爬虫爬取的html写入文件,有时候在控制台不会乱码,但是写入文件的html中的中文是乱码的

案例分析

看下面一段代码:

1

2

3

4

5

6

7

8

# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__':

    url = "http://www.renren.com/967487029/profile"

 

    rsp = request.urlopen(url)

 

    html = rsp.read().decode()    with open("rsp.html","w")as f:        # 将爬取的页面

        print(html)

        f.write(html)

看似没有问题,并且在控制台输出的html也不会出现中文乱码,但是创建的html文件中

ba7eb27c8a76a73427692c57650df14.png

解决方案

阅读剩余部分

相关阅读 >>

Python之禅怎么打出来

Python3中时间处理与定时任务的方法介绍(附代码)

Python访问限制私有还是公有的介绍(附示例)

Python嵌套字典比较值,取值的实例详解

Python类方法和静态方法的区别

Python爬虫可以自学吗

Python如何读取 .ini 格式文件(代码)

Python中函数参数的详细介绍(附实例)

Python实现爬虫设置代理ip和伪装成浏览器的方法分享

Python 的自省是什么?

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...