基于大语言模型的新闻判断技术

  1. 原来基于LangChain的方式来判断新闻的真假方案不可行。
  1. 由于大语言模型的弊端无法稳定的通过推理来确定新闻的真假。
  2. 针对某新闻的相关信息,无法通过训练来获取,可供引用的数据匮乏
  1. 通过大语言模型的训练,训练后的大语言模型依然无法有效的识别新闻真假
  1. 大语言模型的不稳定和GPU资源匮乏,无法大规模训练
  2. 通过训练后的模型对假新闻判断依然不精确。

利用https://colab.research.google.com/上的资源。需要至少V100以上的GPU。

在通过https://github.com/hiyouga/LLaMA-Factory 搭建训练平台。

  1. 通过LLama2的LlamaForSequenceClassification来对新闻进行判断真假。通过对新闻的训练,提高辨别率。
  1. 训练LLama2需要用至少A100的GPU(40G)。训练的时候要使用将近31G的GPU的RAM
  2. 训练LLama2无法输入长的新闻内容。输入超过1000长度的Text,LLama2会崩溃,造成Out Of Memery。所以,目前只能训练短文本,譬如:Twitter相关的假新闻。
  3. 1600条Twitter数据。1300条数据用来训练,300条数据用来验证。能达到85%左右的准确率。

使用的大语言模型如下:

togethercomputer/Llama-2-7B-32K-Instruct

https://huggingface.co/togethercomputer/Llama-2-7B-32K-Instruct

相关推荐
爱打代码的小林2 分钟前
用 PyTorch 实现 CBOW 模型
人工智能·pytorch·python
人工智能培训3 分钟前
具身智能如何在保证安全的前提下高效探索学习?
语言模型·llm·数据采集·模型量化·多模态学习·具身智能·环境感知
Deepoch3 分钟前
Deepoc具身模型开发板:让农业采摘机器人智能化升级更简单
人工智能·科技·农业·采摘机器人·农业机器人·deepoc·具身模型开发板
北巷`4 分钟前
大模型应用的模型架构和核心技术原理-以DeepSeek对话助手为例分析
人工智能
CDA数据分析师干货分享6 分钟前
【干货】CDA一级知识点拆解3:《CDA一级商业数据分析》第3章 商业数据分析框架
大数据·人工智能·数据挖掘·数据分析·cda证书·cda数据分析师
Coding茶水间6 分钟前
基于深度学习的花朵识别系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
开发语言·人工智能·深度学习·yolo·目标检测·机器学习
GAOJ_K7 分钟前
滚柱导轨润滑周期预测
人工智能·科技·自动化·制造
致Great10 分钟前
Kimi K2.5技术报告解读:视觉-文本联合训练与并行智能体框架
人工智能
阿杰学AI10 分钟前
AI核心知识82——大语言模型之AI Value Alignment(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·机械学习·ai价值观对齐
小镇cxy10 分钟前
OpenSpec 规范开发
人工智能·ai