山东大学软件学院毕业设计(二)

本项目主要用于验证模型在不同知识注入机制下的表现

代码模块说明:

data(数据模块)
raw(未处理的数据)
processed(处理过的数据)
prompts(提示词)
models(模型模块)
src(源代码模块)
download(下载模块)
inference(推理模块)
evaluate(量化评估模块[F1参数等])
run_experiments(测试模块)
results(输出模块)
keyword_extraction(关键词提取)
summary(摘要)

读博客

https://blog.csdn.net/weixin_29166013/article/details/158185843

https://blog.csdn.net/omonday1234/article/details/147037162

https://zhuanlan.zhihu.com/p/651430181

https://zhuanlan.zhihu.com/p/48982978

遇到的问题

OOM,目前认为是没有进行内存碎片管理,或者需要调整batch和epoch。

相关推荐
KG_LLM图谱增强大模型1 小时前
图谱智能体记忆技术和应用综述:构建AI Agent的“大脑记忆系统“
人工智能
小龙报2 小时前
【Coze-AI智能体平台】Coze 工作流 = 智能体的 “流程管家”?一文解锁自动化落地新玩法
人工智能·语言模型·自然语言处理·性能优化·数据分析·知识图谱·需求分析
两万五千个小时2 小时前
构建mini Claude Code:08 - Fire and Forget:用后台线程解锁 Multi-Agent 并行执行
人工智能·python·架构
老金带你玩AI2 小时前
OpenClaw1184个恶意插件Claude找出500个零日漏洞,老金开源个安全Skill你直接拿去用
人工智能
薛定e的猫咪2 小时前
Vibe Coding范式实战:用AI工具链(Stitch+Figma+ai studio+Trae)快速开发全栈APP
前端·人工智能·react.js·github·figma
风栖柳白杨2 小时前
【Transformer】核心思想与原理
人工智能·深度学习·transformer
和小潘一起学AI2 小时前
人工智能中常用的KL散度是什么?
人工智能
yzx9910132 小时前
重构价值:2026年AI就业形势的深度剖析
人工智能·重构
I Promise342 小时前
BEV视角智驾方案业务需求分类与主流技术全解
人工智能·深度学习·计算机视觉