AI 学习之旅 · 阶段一 Python 基础
学习进度:阶段一 Python 基础
--
📚 阶段一:Python 基础
第1课:为什么从 Python 开始?
核心理解:
- 学 AI 就像盖房子,Python 是施工队,各种库是预制工具
- 不需要先"学完 Python"再学 AI,只需要掌握核心概念就能开始
- 用 Google Colab 在浏览器里写代码,不用安装任何东西
只需掌握的 5 个概念:
变量与数据类型 → 数字、字符串、布尔值
数据结构 → 列表(list)、字典(dict)
控制流 → if 判断、for 循环
函数 → 定义和调用
导入库 → import
代码示例:
python
scores = [85, 92, 78, 96, 88]
average = sum(scores) / len(scores)
best = max(scores)
print(f"平均分: {average}") # 平均分: 87.8
print(f"最高分: {best}") # 最高分: 96
测验答案: B --- 学 AI 只需要很少的 Python 知识,可以边学边补
第2课:Python 核心语法速通
1. 变量和数据类型
python
age = 25 # 整数 int
price = 19.99 # 浮点数 float
name = "小明" # 字符串 str
is_student = True # 布尔值 bool
greeting = f"你好,{name}!" # f-string 格式化
2. 列表(List)
python
numbers = [1, 2, 3, 4, 5]
print(numbers[0]) # 1(索引从 0 开始!)
print(numbers[-1]) # 5(倒数第一个)
numbers.append(6) # 添加元素
# 列表推导式
squares = [x**2 for x in numbers] # [1, 4, 9, 16, 25, 36]
3. 字典(Dict)
python
student = {"name": "小明", "age": 25, "score": 95}
print(student["name"]) # 小明
student["score"] = 98 # 修改
for key, value in student.items(): # 遍历
print(f"{key}: {value}")
4. 循环和条件
python
# if 判断
score = 85
if score >= 90:
print("优秀!")
elif score >= 60:
print("及格了")
else:
print("要加油哦")
# for 循环
for i in range(5): # 0,1,2,3,4
print(i)
5. 函数
python
def calculate_average(numbers):
"""计算平均值"""
return sum(numbers) / len(numbers)
avg = calculate_average([80, 90, 70, 85])
print(f"平均分: {avg}") # 平均分: 81.25
⚠️ 注意:Python 用缩进表示代码块,通常是 4 个空格,不能用 {}
测验答案: B --- data = [10, 20, 30],data[1] 的值是 20(索引从 0 开始)
第3课:NumPy 数组操作
为什么需要 NumPy?
Python 列表处理大量数据很慢,NumPy 数组是专门为高速数学运算设计的。
1. 创建数组
python
import numpy as np
a = np.array([1, 2, 3, 4, 5])
zeros = np.zeros(5) # [0. 0. 0. 0. 0.]
ones = np.ones((2, 3)) # 2行3列的全1矩阵
rang = np.arange(0, 10, 2) # [0 2 4 6 8]
2. 向量化运算(核心优势)
python
a = np.array([1, 2, 3, 4])
print(a * 2) # [2 4 6 8] ← 整个数组直接运算!
print(a + 10) # [11 12 13 14]
print(a ** 2) # [1 4 9 16]
b = np.array([10, 20, 30, 40])
print(a + b) # [11 22 33 44]
3. 多维数组(矩阵)
python
matrix = np.array([
[1, 2, 3],
[4, 5, 6]
])
print(matrix.shape) # (2, 3) → 2行3列
print(matrix[0, 0]) # 1(第0行,第0列)
print(matrix[0]) # [1 2 3](第0行)
4. 常用统计函数
python
scores = np.array([85, 92, 78, 96, 88])
scores.mean() # 平均值: 87.8
scores.max() # 最大值: 96
scores.min() # 最小值: 78
scores.std() # 标准差
💡 比喻: NumPy 像自动挡汽车,整个数组一次性操作;Python 列表像手动挡,每个元素要单独处理。
测验答案: C --- NumPy 可以直接对整个数组进行数学运算,不需要写循环
第4课:Pandas 数据处理入门
NumPy vs Pandas:
- NumPy → 像计算器,专注数值运算
- Pandas → 像 Excel,专注数据整理和分析
1. DataFrame(核心数据结构)
python
import pandas as pd
data = {
"姓名": ["小明", "小红", "小刚", "小美"],
"年龄": [25, 22, 24, 23],
"成绩": [85, 92, 78, 96]
}
df = pd.DataFrame(data)
print(df)
# 姓名 年龄 成绩
# 0 小明 25 85
# 1 小红 22 92
# 2 小刚 24 78
# 3 小美 23 96
2. 读取和查看数据
python
df = pd.read_csv("data.csv") # 读取 CSV(最常用!)
df.head(3) # 看前3行
df.shape # (行数, 列数)
df.columns # 所有列名
df.describe() # 数值列的统计摘要
3. 筛选和过滤
python
# 单条件
high_scorers = df[df["成绩"] > 80]
# 多条件(注意要用 & 和括号)
result = df[(df["成绩"] > 80) & (df["年龄"] < 25)]
# 选择特定列
df[["姓名", "成绩"]]
4. 新增列和分组统计
python
df["是否及格"] = df["成绩"] >= 60 # 新增列
df["成绩"].mean() # 平均分
df.groupby("班级")["成绩"].mean() # 按班级分组算平均分
测验答案: A --- df = pd.read_csv("data.csv")