BERT情感分类

参考B站BigC_666微调BERT模型做情感分类实战,代码逐行讲解,100%可以跑通!!! 一键三连+关注,私信即可获得代码_哔哩哔哩_bilibili

大致记录下出现了哪些问题

首先第一个问题是,huggingface.co无法访问,通过修改环境变量让目标地址改到镜像地址也没起作用,最终解决方案是挂代理下载了

复制代码
import os
os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890'
os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890'

后面就是jupyter代码了,修改了评估的部分

python 复制代码
from datasets import load_dataset

import os

import os
os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890'
os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890'


os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
dataset = load_dataset("imdb")
print(dataset)

import datasets
print(datasets.config.HF_DATASETS_CACHE)

from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
print("done")
def tokenizer_func(examples):
    return tokenizer(examples['text'],padding='max_length',truncation=True)
tokens_dataset = dataset.map(tokenizer_func,batched=True)
print(tokens_dataset)
print(tokens_dataset['train'][0])
train_dataset = tokens_dataset['train'].select(range(5000))
test_dataset = tokens_dataset['test'].shuffle(42).select(range(5000))
print(test_dataset['label'])

from transformers import BertForSequenceClassification

classifier = BertForSequenceClassification.from_pretrained('bert-base-uncased')

from transformers import Trainer,TrainingArguments

train_arg = TrainingArguments(
    output_dir='./result',
#    eval_strategy='epoch',
    learning_rate=2e-5,
    per_device_train_batch_size=1,
    per_device_eval_batch_size=1,
    num_train_epochs=1,
    weight_decay=0.02
)
print('done')

print('start')
trainer = Trainer(
    model = classifier,
    args = train_arg,
    train_dataset = train_dataset,
    eval_dataset = test_dataset
)
print('done')

predictions = trainer.predict(test_dataset)

import numpy as np
print('start')
# 模型输出的预测 logits(二维数组)
logits = predictions.predictions  # shape: (num_samples, num_classes)
labels = predictions.label_ids    # shape: (num_samples,)

# 步骤1:将 logits 转换为预测标签(取最大值所在的索引)
predicted_labels = np.argmax(logits, axis=1)

# 步骤2:计算准确率
accuracy = np.mean(predicted_labels == labels)

print(f"Accuracy: {accuracy:.4f}")


trainer.train()

# metric = trainer.evaluate()
print(test_dataset['label'])

predictions = trainer.predict(test_dataset)

print(metric)

print(predictions)

from transformers import Trainer
from sklearn.metrics import accuracy_score
import numpy as np

# 1. 定义 compute_metrics
def compute_metrics(eval_pred):
    predictions, labels = eval_pred
    preds = np.argmax(predictions, axis=1)
    return {"accuracy": accuracy_score(labels, preds)}

# 2. 重新构造 Trainer(用原来的模型和训练参数)
new_trainer = Trainer(
    model=classifier,  # 你之前训练好的模型
    args=train_arg,   # 你原来使用的 TrainingArguments
    compute_metrics=compute_metrics
)

# 3. 调用 predict
results = new_trainer.predict(test_dataset)

print("准确率:", results.metrics["test_accuracy"])

代码比较混乱,可读性比较差,实验性质,各种参数没有详细的考量

相关推荐
freewlt6 分钟前
科技热点速递:AI技术集中爆发
人工智能·深度学习·计算机视觉
驕傲的兎孒6 分钟前
基于 SpringBoot + Vue3 + AI 打造企业级售后服务支持平台 | 实战方案分享
人工智能·spring boot·后端
guoji77887 分钟前
2026年AI编程辅助实战:国内镜像站如何使用Claude提升开发效率?
人工智能·ai编程
程序猿炎义8 分钟前
Agent Skills入门 - Datawhale共学
人工智能
大傻^10 分钟前
Spring AI Alibaba 可观测性实践:AI应用监控与链路追踪
java·人工智能·后端·spring·springaialibaba
星辰yzy11 分钟前
AI 聚合 Token 平台怎么选?我为什么开始长期使用 jige.io
人工智能·语言模型
视***间11 分钟前
京聚全球智,算力观新程——视程空间赴2026北京国际人工智能应用与机器人创新博览会
大数据·人工智能·机器人·边缘计算·ai算力开发板
云烟成雨TD15 分钟前
Spring AI Alibaba 1.x 系列【1】阿里巴巴 AI 生态
java·人工智能·spring
柯儿的天空25 分钟前
【OpenClaw 全面解析:从零到精通】第 005 篇:OpenClaw 在 macOS 上的安装与部署实战
人工智能·macos·自然语言处理·ai作画
JicasdC123asd27 分钟前
感受野CBAM融合卷积改进YOLOv26双重注意力机制与自适应特征增强协同突破
人工智能·yolo·目标跟踪