山东大学软件学院毕业设计(二)

本项目主要用于验证模型在不同知识注入机制下的表现

代码模块说明:

data(数据模块)
raw(未处理的数据)
processed(处理过的数据)
prompts(提示词)
models(模型模块)
src(源代码模块)
download(下载模块)
inference(推理模块)
evaluate(量化评估模块[F1参数等])
run_experiments(测试模块)
results(输出模块)
keyword_extraction(关键词提取)
summary(摘要)

读博客

https://blog.csdn.net/weixin_29166013/article/details/158185843

https://blog.csdn.net/omonday1234/article/details/147037162

https://zhuanlan.zhihu.com/p/651430181

https://zhuanlan.zhihu.com/p/48982978

遇到的问题

OOM,目前认为是没有进行内存碎片管理,或者需要调整batch和epoch。

相关推荐
人工智能AI技术1 天前
AWE2026现场直击:脑机接口、意念控无人机,中国家电正进入“物理AI“时代
人工智能
愈努力俞幸运1 天前
llm+agent,使用与 OpenAI 兼容的 API 格式
人工智能
IT_陈寒1 天前
Vue组件复用率提升300%?这5个高阶技巧让你的代码焕然一新!
前端·人工智能·后端
jkyy20141 天前
破局家电同质化:智能冰箱+主动健康,解锁家庭健康新赛道
大数据·人工智能·健康医疗
王知无(import_bigdata)1 天前
一个极简的AI Agentic Engineering技术栈学习路线
人工智能·学习
ToB营销学堂1 天前
B2B AI内容实战指南:AI提效 x GEO获客 x 增长闭环
人工智能·geo·b2b营销获客
东离与糖宝1 天前
Java 玩转 AI 智能体性能优化:OpenClaw 高并发调用与 Token 成本控制实战
java·人工智能
芯片-嵌入式1 天前
具身智能(3):有哪些AI模型
人工智能·深度学习·机器学习
skywalk81631 天前
在LMStudio中使用microsoft_Fara-7B 模型(未实践)
人工智能·microsoft
cxr8281 天前
创建专业虚拟一人公司的 Skills 深度对比分析
人工智能·ai智能体·openclaw