golang写爬虫乱码怎么办


本文摘自php中文网,作者angryTom,侵删。

golang写爬虫乱码怎么办

在用golang编写爬虫程序时,会碰见编码格式gb2312的页面。

网页页面上可以看出该页面字符编码为gb2312

1

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

而golang默认是支持UTF-8编码格式的,这样直接爬下来的结果会乱码。

解决方法:

使用 github.com/axgle/mahonia 这个包可以完成编码转换、

1、执行 go get github.com/axgle/mahonia 命令下载此包后,在%gopath%/src目录下会生产

1

github.com\axgle\mahonia

2、代码使用方法

阅读剩余部分

相关阅读 >>

关于golang gopath的新用法

使用viper读取nacos配置(开源)

手撸golang go与微服务 saga模式之8 集成测试

手撸golang go与微服务 聚合模式之2

golang指针传递和值传递的区别是什么?

slice

使用cron创建定时任务【golang 入门系列八】

分享golang的一个丑陋实现

devops ci/cd 分析(三)之k8s yaml模版配置详解

go系列:go项目中包的管理

更多相关阅读请进入《golang》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...