golang写爬虫乱码怎么办


本文摘自php中文网,作者angryTom,侵删。

golang写爬虫乱码怎么办

在用golang编写爬虫程序时,会碰见编码格式gb2312的页面。

网页页面上可以看出该页面字符编码为gb2312

1

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

而golang默认是支持UTF-8编码格式的,这样直接爬下来的结果会乱码。

解决方法:

使用 github.com/axgle/mahonia 这个包可以完成编码转换、

1、执行 go get github.com/axgle/mahonia 命令下载此包后,在%gopath%/src目录下会生产

1

github.com\axgle\mahonia

2、代码使用方法

阅读剩余部分

相关阅读 >>

golang json格式化自定义日期格式

easydss如何定制go语言生成csv文件?

golang 泛型初探

golang常用的http请求操作

关于golang的那些事(八)-- 使用共享变量实现并发

分享golang和vue3开发的一个im应用

[go] golang 中main包下入口文件调用其它go文件函数出现undefined

golang基础数据类型-浮点型

手撸golang 架构设计原则 依赖倒置原则

手撸golang 基本数据结构与算法 快速排序

更多相关阅读请进入《golang》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...

    暂无评论...