golang写爬虫乱码怎么办


本文摘自php中文网,作者angryTom,侵删。

golang写爬虫乱码怎么办

在用golang编写爬虫程序时,会碰见编码格式gb2312的页面。

网页页面上可以看出该页面字符编码为gb2312

1

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

而golang默认是支持UTF-8编码格式的,这样直接爬下来的结果会乱码。

解决方法:

使用 github.com/axgle/mahonia 这个包可以完成编码转换、

1、执行 go get github.com/axgle/mahonia 命令下载此包后,在%gopath%/src目录下会生产

1

github.com\axgle\mahonia

2、代码使用方法

阅读剩余部分

相关阅读 >>

go 内嵌静态资源

一个守护进程执行的问题

[译]go语言最佳实战[一]

go实现安全并发map读写

聊聊nacos-coredns-plugin的udpserver

手撸golang 基本数据结构与算法 快速排序

golang cgo是什么

2017年最适合go新手的十本书

golang 默认几核运行

golang编译器用什么写的

更多相关阅读请进入《golang》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...