一、开篇回顾 + 今日目标
-
回顾:Day1完成环境搭建,明确8天学习规划,今日正式进入Python基础学习。
-
今日目标:
-
熟练掌握Python变量的定义、命名规则、使用方法(Python基础核心)
-
掌握Python3种核心数据类型(字符串、数字、布尔值),理解每种类型的用途和操作
-
熟练使用print输出语句,掌握基础输出和格式化输出(大模型调试常用)
-
完成简单实操练习,巩固知识点,能独立写基础代码。
-
二、核心知识点(细致讲解,兼顾Python基础与大模型场景)
(一)变量(Python的"容器",存储数据的基础)
-
- 变量的定义(核心语法)
-
语法格式:变量名 = 值("="是赋值符号,不是等于,左边是变量名,右边是要存储的值)
-
示例:name = "llama"(存储模型名称)、temperature = 0.7(存储模型参数)
-
关键说明:变量是"动态的",可以随时修改值,修改后覆盖原有值(示例:temperature = 0.5,重新赋值后,变量值变为0.5)
-
- 变量命名规则(必须遵守,否则报错)
-
核心规则:只能由字母(a-z、A-Z)、数字(0-9)、下划线(_)组成,不能以数字开头
-
规范建议:小写字母+下划线(Python官方规范,如model_name、max_tokens),避免大写、中文、特殊符号
-
禁止使用关键字:不能用Python自带的关键字作为变量名(如if、for、print、def等,附常见关键字列表)
-
大模型场景适配:变量名尽量贴合用途(如prompt存储提示词、chat_history存储对话历史),提升代码可读性。
-
- 变量的使用(基础操作)
-
直接使用:print(变量名),打印变量存储的值
-
变量运算:数字类型变量可进行加减乘除等运算(示例:a = 5,b = 3,print(a+b) → 输出8)
-
变量拼接:字符串变量可与其他字符串拼接(示例:model = "qwen-7b",print("当前模型:" + model))
-
- 易错点提醒(新手必看)
-
变量未定义直接使用,会报错(如print(num),未定义num变量)
-
变量名区分大小写(如Model和model是两个不同的变量)
-
赋值符号''="与等于符号"==" 容易混淆
(二)Python核心数据类型(3种,足够满足大模型开发)
-
- 字符串(str)------ 文本数据的"容器"(大模型最常用)
-
定义:用单引号('')、双引号("")或三引号(''' ''')包裹的文本(示例:"Python"、'大模型'、'''多行文本''')
-
核心用途:存储prompt、对话内容、模型名称、日志信息等(大模型开发中90%的文本数据用字符串)
-
基础操作(必学):
-
长度计算:len(字符串) → 计算字符串的字符个数(示例:len("prompt") → 6)
-
去空格:strip() → 去除字符串前后的空格(大模型处理prompt时常用,避免多余空格影响模型响应)
-
切分:split(分隔符) → 按指定分隔符切分字符串(示例:"a,b,c".split(",") → ["a","b","c"],处理批量prompt常用)
-
拼接:用+拼接两个字符串(示例:"模型:" + "llama-7b" → "模型:llama-7b")
-
易错点:字符串不能与数字直接拼接(如print("温度:" + 0.7)会报错,需先将数字转为字符串)
-
-
- 数字(int/float)------ 数值数据的"容器"(大模型参数常用)
-
整数(int):没有小数点的数字(示例:7、1024、0,常用于存储模型参数量、tokens数)
-
浮点数(float):有小数点的数字(示例:0.7、1.2、3.14,常用于存储模型温度、准确率等参数)
-
基础操作:加减乘除(+、-、*、/)、取整(int())、四舍五入(round())
-
大模型场景适配:int用于存储max_tokens(如1024)、参数量(如7);float用于存储temperature(如0.7)、top_p(如0.9)。
-
- 布尔值(bool)------ 判断条件的"容器"(大模型逻辑判断常用)
-
定义:只有两个值------True(真)、False(假),首字母必须大写(不能写true/false)
-
核心用途:判断模型调用是否成功、参数是否合法、对话是否结束等(示例:is_success = True,标记模型调用成功)
-
基础操作:与(and)、或(or)、非(not)(示例:True and False → False,not True → False)
-
易错点:布尔值不能与字符串直接拼接(需先转为字符串);True等价于1,False等价于0(可参与运算,但不推荐)。
(三)print输出语句(Python的"打印机",调试必备)
-
- 基础用法(核心语法)
-
语法格式:print(输出内容),输出内容可以是字符串、变量、数字,也可以是多个内容(用逗号分隔)
-
示例1:print("Hello Python") → 输出字符串
-
示例2:print(temperature) → 输出变量值
-
示例3:print("模型:", model_name, "温度:", temperature) → 输出多个内容,用逗号分隔,默认用空格隔开
-
- 格式化输出(大模型调试高频用法)
-
f-string格式化(推荐,简洁高效):在字符串前加f,用{变量名}嵌入变量(示例:print(f"模型:{model_name},温度:{temperature}"))
-
占位符格式化(备用):用%s(字符串)、%d(整数)、%f(浮点数)占位(示例:print("模型:%s,温度:%f" % (model_name, temperature)))
- 大模型场景适配:格式化输出常用于打印模型配置、调试信息、对话内容,方便排查问题。
-
- 进阶用法(可选,按需掌握)
- 换行输出:print("内容1\n内容2"),\n表示换行
- 不换行输出:print("内容", end=""),end参数指定结尾字符(默认是换行符)
三、今日实操(代码可直接复制,新手必练)
- 实操1:变量定义与使用
python
#定义大模型相关变量
model_name = "qwen-7b" # 字符串变量,存储模型名称
temperature = 0.7 # 浮点数变量,存储模型温度
max_tokens = 1024 # 整数变量,存储最大生成tokens
is_chat = True # 布尔值变量,标记是否为对话模式
#打印变量
print("模型名称:", model_name)
print("模型温度:", temperature)
print("最大tokens:", max_tokens)
print("是否为对话模式:", is_chat)
#变量修改与运算
temperature = 0.5 # 修改温度参数
print("修改后温度:", temperature)
print("tokens数的2倍:", max_tokens * 2)
- 实操2:数据类型操作
python
#字符串操作(大模型prompt处理模拟)
prompt = " 介绍大模型的核心原理 "
print("原始prompt:", prompt)
print("去空格后:", prompt.strip())
print("prompt长度:", len(prompt.strip()))
print("prompt切分:", prompt.strip().split(" "))
#数字操作(大模型参数运算)
param1 = 7 # 模型参数量(7B)
param2 = 0.9 # top_p参数
print("参数量+top_p:", param1 + param2)
print("参数量取整:", int(param1 + param2))
print("top_p四舍五入:", round(param2, 1))
#布尔值操作(模型调用判断)
is_success = True
is_error = False
print("模型调用是否成功:", is_success and not is_error)
- 实操3:格式化输出(大模型调试模拟)
python
model = "llama-7b"
temp = 0.6
max_len = 512
# f-string格式化(推荐)
print(f"当前模型配置:模型={model},温度={temp},最大长度={max_len}")
# 占位符格式化
print("当前模型配置:模型=%s,温度=%f,最大长度=%d" % (model, temp, max_len))
# 多内容输出
print("模型名称:", model, "温度:", temp, "状态:", is_success)
四、易错点汇总(新手避坑)
-
变量命名不规范(如以数字开头、使用中文),导致代码报错;
-
字符串与数字直接拼接,导致报错;
-
布尔值首字母小写(true/false),导致识别失败;
-
print格式化输出时,{变量名}漏写f,导致变量无法识别。
五、今日练习(10分钟巩固)
-
- 定义3个变量,分别存储模型名称(chatglm3-6b)、温度(0.8)、是否开启流式输出(True),并格式化打印出来;
-
- 定义一个prompt字符串(" Python如何调用大模型?"),去除前后空格,计算长度,并切分字符串;
-
- 计算两个数字(5和2.3)的和、差、积、商,并打印结果。
六、次日预告
- Day3将讲解Python最核心的两个数据结构------列表(list)和字典(dict),这两个结构是大模型存储对话历史、模型配置的核心,学会后就能处理批量数据,为后续批量调用模型打下基础!