Python爬虫学习笔记(一)---Python入门

一、pycharm的安装及使用

pycharm的安装可以自行去搜索教程。

pycharm的使用需要注意:

1、venv文件夹是这个项目的虚拟环境文件,应与代码文件分开。

2、如果运行没有,最后一行是"进程已结束,退出代码为0",如果最后不是0,那么,就说明运行出错。

二、python的基础使用

1、字符串连接

python 复制代码
print("Hello"+"world"+"!")

2、单双引号转义

print括号中使用单引号或者双引号都是可以的。

如果引号中需要打印引号,我们则需要转义。或者外双内单、外单内双都是可以的。

python 复制代码
print("He said 'let's go!'")
print("He said \"let\'s go!\"")

3、换行

python 复制代码
print("Hello!\nHi!")

每一个print也可以默认换行

4、三引号跨行字符串

隆重介绍""" XXX"""即可换行

python 复制代码
print("""XXXXXX
XXX
XXX
XXX""")

5、命名规则

尽量使用英文变量名,以避免控制台或日记等编码不兼容等问题展现出乱码。

python英文变量名又称是用"下划线命名法":

1、字母全部小写

2、不同单词用下划线分割

也可以用驼峰命名法,就是用大写字母分割

user_age≠user_Age

python是对大小写敏感的。

同时也不能使用关键词作为变量名,如果打出来是彩色的说明是关键字哦!

6、注释

#是注释,也可以用快捷键"ctrl"+"/"注释。

""" """也可以作为多行注释

7、 优先级not>and>or

8、列表(list)

python 复制代码
shopping_list=[]
sp_list=["1", "2"]
sp_list.append("3")

方法是对象.方法名(...)

函数是函数名(对象)

列表是可变的

9、字典(dictionary)

key:value

键:值

键是用来查找值的

python 复制代码
dict={"小明":"1",
	  "小花":"2"}
#增加元素
dict["小谭"]="3"
#判断一个键是否在
print("小明" in dict)
#删除元素
del dict["小谭"]

10、元组(tuple)

python 复制代码
tp={("张伟",21):"1",
	("张伟",22):"2",
	("张伟",23):"3"}
zw21_phone=tp[("张伟",21)]

11、迭代

python 复制代码
dict.keys()   #所以键
dict.values() #所有值
dict.items()  #所有键值对

#写法一
for a,b in dict.items():
	if a>=38:
		print("XXXX")

#写法二:
for temp in dict.items():
	a=temp[0]
	b=temp[1]
	...

range(a,b)表示从a到b-1

range(a,b,c)表示从a开始一直到b-1,步长为c

12、format方法

python 复制代码
message="""金{0}贺岁,金{0}敲门,给{1}及家人拜年啦!""".format(year,name)

message="""金{year}贺岁,金{year:.0f}敲门,给{name}及家人拜年啦!""".format(year=year,name=name)

print(f"{message}")
#f+字符串

13、引入模块

python 复制代码
import statistics
print(statistic.median([19,-5,36])
python 复制代码
#也可以这样子写
from statistics import median
print(median([19,-5,36])

pycharm中,按住control键点击函数名即可查看更详细的介绍。

要安装什么的话,去终端,输入pip install 库名

14、文件

两个等价的代码

python 复制代码
f=open("./data.txt") #相对路径
print(f.read())
f.close()

与之等价的是

python 复制代码
with open("./data.txt","r",encoding="utf-8") as f:
	print(f.read()) #结束后,会自动关闭文件,释放资源

一些相关操作

python 复制代码
f.readline()
f.readlines()
f.read()#文件特别大的时候,最好不要用read(),因为可能爆内存
f.read(10)
f.read(10)#会接着上面继续读

"w":如果文件不存在,会自动创建新文件;如果文件存在,就会把原本的文本清空。
"a":就是一个追加模式。

15、异常与测试

python 复制代码
try:
	XXX #放上你觉得可能会报错的代码
except ValueError:#这里ValueError是错误的类型,可以替换成其他的,也可以不写
	print("XX") #可以用来告知客户
except:
	XXX
else: #没有错误时运行
	XXX
finally: #不管有没有错误都会运行
	XXX

'assert'断言

python 复制代码
assert 1+2>6 #这里就会报错且不会继续进行下去

unittest专门测试的库


继承super()

测试,来判断是否与自己的预期相等

这表明全部通过测试点

有一个测试点错误,还会告诉你具体原因

常见的测试方法

unittest会返回更加具体的原因。

相关推荐
蹦蹦跳跳真可爱58918 分钟前
Python----OpenCV(几何变换--图像平移、图像旋转、放射变换、图像缩放、透视变换)
开发语言·人工智能·python·opencv·计算机视觉
蹦蹦跳跳真可爱58922 分钟前
Python----循环神经网络(Transformer ----Layer-Normalization(层归一化))
人工智能·python·rnn·transformer
m0_6256865524 分钟前
Day58
python
夜阳朔27 分钟前
Conda环境激活失效问题
人工智能·后端·python
m0_723140231 小时前
Python训练营-Day49
开发语言·python
北风toto1 小时前
python学习DataFrame数据结构
数据结构·python·学习
亿牛云爬虫专家1 小时前
微服务化采集平台:可扩展性与容错机制
python·微服务·架构·爬虫代理·扩展性·新浪财经·财经新闻
傻啦嘿哟2 小时前
Python爬虫动态IP代理报错全解析:从问题定位到实战优化
爬虫·python·tcp/ip
mit6.8242 小时前
[Meetily后端框架] Whisper转录服务器 | 后端服务管理脚本
c++·人工智能·后端·python
zhangfeng11332 小时前
python 数据分析 单细胞测序数据分析 相关的图表,常见于肿瘤免疫微环境、细胞亚群功能研究 ,各图表类型及逻辑关系如下
开发语言·python·数据分析·医学