golang写爬虫乱码怎么办


本文摘自php中文网,作者angryTom,侵删。

golang写爬虫乱码怎么办

在用golang编写爬虫程序时,会碰见编码格式gb2312的页面。

网页页面上可以看出该页面字符编码为gb2312

1

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

而golang默认是支持UTF-8编码格式的,这样直接爬下来的结果会乱码。

解决方法:

使用 github.com/axgle/mahonia 这个包可以完成编码转换、

1、执行 go get github.com/axgle/mahonia 命令下载此包后,在%gopath%/src目录下会生产

1

github.com\axgle\mahonia

2、代码使用方法

阅读剩余部分

相关阅读 >>

聊聊storagetapper的pool

golang | 一文带你快速入门context

golang 类似php中 http_build_query 方法

适合开发者的七种python代码审查工具

实用在线工具网站 https://qetool.com

了解学习golang类型断言

golang语言学习之基本语法

skywalking golang客户端源码解析

golang 快餐 - 环境变量

godoc命令不存在的解决方法

更多相关阅读请进入《golang》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...