爬虫—响应页面乱码问题解决方法

发布时间:2024年01月13日

爬虫—响应页面乱码问题解决方法

案例:腾牛网图片抓取

源代码如下:

import requests

url = 'https://www.qqtn.com/wm/meinvtp_1.html'
headers = {
    'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}

res = requests.get(url, headers=headers
data = res.content.decode()
print(data)

执行之后,报错如下:

image-20240113105337356

解决办法:

  1. 方法一,设置解码格式为’GBK’
data = res.content.decode('GBK')
print(data)

运行结果如下:

image-20240113105639927

  1. 方法二,自动获取解码格式
# 自动获取解码格式
res.encoding = res.apparent_encoding
data = res.text
print(data)
文章来源:https://blog.csdn.net/weixin_41905135/article/details/135567150
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。