爬虫零基础学习,第一天,安装环境,requests库常用命令的讲解

Python爬虫

爬虫学习思路



URL内容获取,requests的基本常用语法

python 复制代码
import  requests
# 先向目标网站发送请求
url =  "http://www.baidu.com"
r = requests.get(url)
# 可以用看一下访问码返回值是不是200,若是200则表示访问成功
print(r.status_code)
# 输出头部格式查看,文本格式
print(r.headers)
# 如果content-type没有写文件格式,那获取文本内容时,中文会出现乱码
print(r.encoding)  # 用于查看文本格式
print(r.text)
# 所以可以先指定utf-8的格式,然后再访问文本内容
r.encoding="utf-8"
print(r.text)
相关推荐
yngsqq5 分钟前
031集——文本文件按空格分行——C#学习笔记
笔记·学习·c#
_.Switch12 分钟前
Python机器学习模型的部署与维护:版本管理、监控与更新策略
开发语言·人工智能·python·算法·机器学习
醉颜凉14 分钟前
银河麒麟桌面操作系统修改默认Shell为Bash
运维·服务器·开发语言·bash·kylin·国产化·银河麒麟操作系统
NiNg_1_23420 分钟前
Vue3 Pinia持久化存储
开发语言·javascript·ecmascript
带带老表学爬虫29 分钟前
java数据类型转换和注释
java·开发语言
Hoper.J31 分钟前
PyTorch 模型保存与加载的三种常用方式
人工智能·pytorch·python
qianbo_insist31 分钟前
simple c++ 无锁队列
开发语言·c++
zengy532 分钟前
Effective C++中文版学习记录(三)
数据结构·c++·学习·stl
cyt涛41 分钟前
MyBatis 学习总结
数据库·sql·学习·mysql·mybatis·jdbc·lombok
BigYe程普42 分钟前
我开发了一个出海全栈SaaS工具,还写了一套全栈开发教程
开发语言·前端·chrome·chatgpt·reactjs·个人开发