python爬取页面的时候如何过滤非GBK编码的不读取?

【python爬取页面的时候如何过滤非GBK编码的不读取?】

python爬取页面的时候如何过滤非GBK编码的不读取?

文章插图
python在抓取页面时如何过滤非GBK编码的未读页面?python在抓取页面时如何过滤非GBK编码的未读页面?简介:是我想爬的一页的数据 。这个页面是GBK的,但是里面会有人回复非GBK的帖子,比如“伞伞伞” 。如果字符像这样爬出来想要解码( # 039;gbk# 039)将报告一个错误>: gt gtnew.decod