本文摘自php中文网,作者angryTom,侵删。
golang写爬虫乱码怎么办
在用golang编写爬虫程序时,会碰见编码格式gb2312的页面。
网页页面上可以看出该页面字符编码为gb2312
1 |
|
而golang默认是支持UTF-8编码格式的,这样直接爬下来的结果会乱码。
解决方法:
使用 github.com/axgle/mahonia 这个包可以完成编码转换、
1、执行 go get github.com/axgle/mahonia 命令下载此包后,在%gopath%/src目录下会生产
1 |
|
2、代码使用方法
相关阅读 >>
golang 类似php中 http_build_query 方法
更多相关阅读请进入《golang》频道 >>
Go语言101
一个与时俱进的Go编程知识库。