bert-base-chinese另外的加载方法.txt

import os

os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

import torch

from transformers import pipeline

pipe = pipeline("fill-mask", model="google-bert/bert-base-chinese")

from transformers import AutoTokenizer, AutoModelForMaskedLM

tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-chinese")

model = AutoModelForMaskedLM.from_pretrained("google-bert/bert-base-chinese")

input_text='bert-base-chinese该怎么用?'

inx_text=tokenizer.encode(input_text)

inv_text=tokenizer.convert_ids_to_tokens(inx_text)

with torch.no_grad():

output=model(torch.tensor([inx_text]))

print(type(output))

last_hidden=output['logits']

print(last_hidden.shape,last_hidden[0])# (1,9,21128)(batch_size,seq_len,d_model)

from transformers import AutoModelForQuestionAnswering

aq=AutoModelForQuestionAnswering.from_pretrained("google-bert/bert-base-chinese")

定义问题和上下文

question = "你好,请问今天天气怎么样?"

context = "今天是晴天,气温适中,非常适合户外活动。"

使用分词器对问题和上下文进行编码

inputs = tokenizer(question, context, return_tensors='pt', \

padding=True, truncation=True)

input_ids = inputs['input_ids']

attention_mask = inputs['attention_mask']

在Transformers库中,模型并不是通过数字本身来识别分割符的,

而是通过分词器(Tokenizer)对输入文本的处理来识别这些特殊标记。

在不计算梯度的情况下进行推理

with torch.no_grad():

aq_outputs =aq(input_ids, attention_mask=attention_mask)

start_inxes=aq_outputs['start_logits'][0]

end_inxes=aq_outputs['end_logits'][0]

print(len(start_inxes),len(end_inxes))

start=torch.argmax(start_inxes)

end=torch.argmax(end_inxes)

(question+context)[start:end]

相关推荐
AI程序员7 小时前
Claude Code 权限系统拆解:一个工具调用要过几道关卡才能执行?
人工智能
Roselind_Yi7 小时前
【吴恩达2026 Agentic AI】面试向+项目实战(含面试题+项目案例)-4
人工智能·面试·职场和发展·实时互动·跳槽·社交电子·学习方法
乐鑫科技 Espressif7 小时前
亚马逊 KVS WebRTC SDK 适配乐鑫芯片及 ESP RainMaker Camera
人工智能·webrtc·乐鑫科技
前端摸鱼匠7 小时前
【AI大模型春招面试题15】自回归(Autoregressive)与自编码(Autoencoding)语言模型的区别?
人工智能·语言模型·面试·回归·大模型·求职招聘
AI程序员7 小时前
Claude Code 的三种多 Agent 模式:Coordinator、Swarm 和 Fork
人工智能
AI程序员7 小时前
Claude Code 的三层记忆系统:从"一次性对话"到"有记性的搭档"
人工智能
Lethehong7 小时前
从零搭建 BettaFish:打造自己的多 Agent 舆情分析系统
人工智能·docker·开源·蓝耘元生代·蓝耘maas
Kelvin4real7 小时前
10分钟速通 ACP 协议:LLM 生态的标准化时代
人工智能
monsion7 小时前
Claude Code 的三种多 Agent 模式:Coordinator、Swarm 和 Fork
人工智能·vscode·个人开发
YA8888888888897 小时前
数字时代B端拓客:号码核验的价值重构与行业突围,氪迹科技法人股东号码筛选系统,阶梯式
大数据·人工智能·重构