AI 学习之旅 · 学习笔记

AI 学习之旅 · 阶段一 Python 基础

学习进度:阶段一 Python 基础

--

📚 阶段一:Python 基础

第1课:为什么从 Python 开始?

核心理解:

  • 学 AI 就像盖房子,Python 是施工队,各种库是预制工具
  • 不需要先"学完 Python"再学 AI,只需要掌握核心概念就能开始
  • 用 Google Colab 在浏览器里写代码,不用安装任何东西

只需掌握的 5 个概念:

复制代码
变量与数据类型  →  数字、字符串、布尔值
数据结构        →  列表(list)、字典(dict)
控制流          →  if 判断、for 循环
函数            →  定义和调用
导入库          →  import

代码示例:

python 复制代码
scores = [85, 92, 78, 96, 88]
average = sum(scores) / len(scores)
best = max(scores)
print(f"平均分: {average}")   # 平均分: 87.8
print(f"最高分: {best}")       # 最高分: 96

测验答案: B --- 学 AI 只需要很少的 Python 知识,可以边学边补


第2课:Python 核心语法速通

1. 变量和数据类型
python 复制代码
age = 25              # 整数 int
price = 19.99         # 浮点数 float
name = "小明"          # 字符串 str
is_student = True      # 布尔值 bool
greeting = f"你好,{name}!"  # f-string 格式化
2. 列表(List)
python 复制代码
numbers = [1, 2, 3, 4, 5]
print(numbers[0])      # 1(索引从 0 开始!)
print(numbers[-1])     # 5(倒数第一个)
numbers.append(6)      # 添加元素

# 列表推导式
squares = [x**2 for x in numbers]   # [1, 4, 9, 16, 25, 36]
3. 字典(Dict)
python 复制代码
student = {"name": "小明", "age": 25, "score": 95}
print(student["name"])              # 小明
student["score"] = 98               # 修改
for key, value in student.items():  # 遍历
    print(f"{key}: {value}")
4. 循环和条件
python 复制代码
# if 判断
score = 85
if score >= 90:
    print("优秀!")
elif score >= 60:
    print("及格了")
else:
    print("要加油哦")

# for 循环
for i in range(5):    # 0,1,2,3,4
    print(i)
5. 函数
python 复制代码
def calculate_average(numbers):
    """计算平均值"""
    return sum(numbers) / len(numbers)

avg = calculate_average([80, 90, 70, 85])
print(f"平均分: {avg}")   # 平均分: 81.25

⚠️ 注意:Python 用缩进表示代码块,通常是 4 个空格,不能用 {}

测验答案: B --- data = [10, 20, 30]data[1] 的值是 20(索引从 0 开始)


第3课:NumPy 数组操作

为什么需要 NumPy?

Python 列表处理大量数据很慢,NumPy 数组是专门为高速数学运算设计的。

1. 创建数组
python 复制代码
import numpy as np

a = np.array([1, 2, 3, 4, 5])
zeros = np.zeros(5)          # [0. 0. 0. 0. 0.]
ones = np.ones((2, 3))      # 2行3列的全1矩阵
rang = np.arange(0, 10, 2)  # [0 2 4 6 8]
2. 向量化运算(核心优势)
python 复制代码
a = np.array([1, 2, 3, 4])
print(a * 2)        # [2 4 6 8]    ← 整个数组直接运算!
print(a + 10)       # [11 12 13 14]
print(a ** 2)       # [1 4 9 16]
b = np.array([10, 20, 30, 40])
print(a + b)         # [11 22 33 44]
3. 多维数组(矩阵)
python 复制代码
matrix = np.array([
    [1, 2, 3],
    [4, 5, 6]
])
print(matrix.shape)   # (2, 3) → 2行3列
print(matrix[0, 0])  # 1(第0行,第0列)
print(matrix[0])     # [1 2 3](第0行)
4. 常用统计函数
python 复制代码
scores = np.array([85, 92, 78, 96, 88])
scores.mean()   # 平均值: 87.8
scores.max()    # 最大值: 96
scores.min()    # 最小值: 78
scores.std()    # 标准差

💡 比喻: NumPy 像自动挡汽车,整个数组一次性操作;Python 列表像手动挡,每个元素要单独处理。

测验答案: C --- NumPy 可以直接对整个数组进行数学运算,不需要写循环


第4课:Pandas 数据处理入门

NumPy vs Pandas:

  • NumPy → 像计算器,专注数值运算
  • Pandas → 像 Excel,专注数据整理和分析
1. DataFrame(核心数据结构)
python 复制代码
import pandas as pd

data = {
    "姓名": ["小明", "小红", "小刚", "小美"],
    "年龄": [25, 22, 24, 23],
    "成绩": [85, 92, 78, 96]
}
df = pd.DataFrame(data)
print(df)
#    姓名  年龄  成绩
# 0  小明   25   85
# 1  小红   22   92
# 2  小刚   24   78
# 3  小美   23   96
2. 读取和查看数据
python 复制代码
df = pd.read_csv("data.csv")   # 读取 CSV(最常用!)
df.head(3)       # 看前3行
df.shape          # (行数, 列数)
df.columns        # 所有列名
df.describe()     # 数值列的统计摘要
3. 筛选和过滤
python 复制代码
# 单条件
high_scorers = df[df["成绩"] > 80]

# 多条件(注意要用 & 和括号)
result = df[(df["成绩"] > 80) & (df["年龄"] < 25)]

# 选择特定列
df[["姓名", "成绩"]]
4. 新增列和分组统计
python 复制代码
df["是否及格"] = df["成绩"] >= 60          # 新增列
df["成绩"].mean()                           # 平均分
df.groupby("班级")["成绩"].mean()           # 按班级分组算平均分

测验答案: A --- df = pd.read_csv("data.csv")