一、什么是语言模型?

一、什么是语言模型?

各位读者好,欢迎收看我的新专栏大语言模型实战系列,本专栏主要讲述大模型实际操作部门内容,不会特别涉及底层概念,主要是了解和用,这次为第一节,什么是语言模型?

本节我们主要是调用一个实例来看看语言模型能做什么?

当我们使用LLM时,需要加载两个模型:

  • 生成模型本身
  • 其底层的分词器(tokenizer)
    分词器负责在将输入文本送入生成模型之前,将其分割成词元。我们可以在Hugging Face网站上找到分词器和模型,只需要传入相应的ID即可。

功能包

首先我们需要安装依赖功能包

python 复制代码
pip install transformers>=4.40.1 accelerate>=0.27.2

模型与分词器

第一步是将模型加载到 GPU 上以加快推理速度。请注意,我们将模型和分词器分开加载(非必要)。这里我们以microsoft/Phi-3-mini-4k-instruct作为模型的主路径。

python 复制代码
from transformers import AutoModelForCausalLM, AutoTokenizer

# Load model and tokenizer
model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=False,
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

输出:

虽然我们现在可以直接使用模型和分词器,但除此之外在transformers库种可以有简化过程,将其(模型、分词器和文本生成过程)封装在 pipeline 对象中,也就是装成一个单一的函数,就变得容易得多:

python 复制代码
from transformers import pipeline

# 创建流水线
generator = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    return_full_text=False,
    max_new_tokens=500,
    do_sample=False
)

输出:

Device set to use cuda

The following generation flags are not valid and may be ignored: 'temperature'. Set TRANSFORMERS_VERBOSITY=info for more details.

注意:

  • return_full_text 将其设置为False时,只返回模型的输出结果,而不包含提示词
  • max_new_tokens 此为允许模型生成的最大词元数。通过限制,我们可以避免过长或异常的输出,因为某些模型可能会一直生成输出直到达到他们上下文窗口的限制。
  • do_sample 决定模型是否采用采样策略来选择下一个词元。设置为False代表模型将始终选择概率最高的下一个词元。

示例

最后,我们以用户身份创建提示并将其提供给模型:

python 复制代码
# 提示词(用户输入/查询)
messages = [
    {"role": "user", "content": "生成一个有关俄罗斯的笑话。"}
]

# 生成输出
output = generator(messages)
print(output[0]["generated_text"])

输出:

有一天,一个俄罗斯人在街上看着一只猫。他问:"它是俄罗斯的猫吗?"猫咪回答说:"不,我来自美国。"人惊讶地问:"那你是什么品种?"猫咪笑着回答:"我是猫咪,不管我的国籍。"

(注意每次生成都不相同哦!

相关推荐
染指11104 小时前
26.RAG进阶(Advanced RAG)-假设性问题索引
人工智能·windows·agent·rag·advanced rag
闵孚龙4 小时前
动态图机制:为什么 PyTorch 调试起来更舒服
人工智能·pytorch·python
甲维斯4 小时前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能
百胜软件@百胜软件5 小时前
百胜软件亮相“AI消费新生活”主题日活动,AI智能运营平台入选市级案例征集
人工智能·生活·零售数字化·数智中台·珠宝行业
专注搞钱6 小时前
GPT-4o写设备Recipe:从3小时到10分钟
数据库·人工智能·gpt·半导体
闻道参看6 小时前
贝芯宠AI灵兽 ELFVET 大模型聚焦临床应用,强化宠物诊疗综合能力
人工智能·宠物
MartinYeung56 小时前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型
财经资讯数据_灵砚智能6 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
m0_380167146 小时前
加密货币价格 API、市场数据 API 与 分析 API 有什么区别?
人工智能·ai·区块链
zyplayer-doc6 小时前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新