山东大学软件学院毕业设计(二)

本项目主要用于验证模型在不同知识注入机制下的表现

代码模块说明:

data(数据模块)
raw(未处理的数据)
processed(处理过的数据)
prompts(提示词)
models(模型模块)
src(源代码模块)
download(下载模块)
inference(推理模块)
evaluate(量化评估模块F1参数等)
run_experiments(测试模块)
results(输出模块)
keyword_extraction(关键词提取)
summary(摘要)

读博客

https://blog.csdn.net/weixin_29166013/article/details/158185843

https://blog.csdn.net/omonday1234/article/details/147037162

https://zhuanlan.zhihu.com/p/651430181

https://zhuanlan.zhihu.com/p/48982978

遇到的问题

OOM,目前认为是没有进行内存碎片管理,或者需要调整batch和epoch。

相关推荐
IT_陈寒1 小时前
SpringBoot自动配置的坑,我的API突然就404了
前端·人工智能·后端
笃行3501 小时前
从零到上线:用 EdgeOne Makers + CodeBuddy 搭一个「对账核对员」AI Agent
人工智能
用户6856326208692 小时前
Claude Code 乱猜字段名?我给它写了一个"数据库查询约束 Skill"
人工智能
你_好2 小时前
# 给你的产品嵌入一个「会操作界面的 AI 助手」
人工智能
ShallWeL2 小时前
【机器学习】(3)—— 线性回归:梯度下降
人工智能·机器学习
陈广亮2 小时前
Prompt、Context、Harness、Agentic:LLM 应用四层嵌套结构,搞清自己卡在哪一层
人工智能
刺猬的温驯2 小时前
Flow Matching 训练的输入分布问题:从 VAE Latent 统计性质到归一化工程实践——以 VoxFlash-TTS 为例
人工智能·语音合成·tts
机器之心2 小时前
近80年后,埃尔德什经典「拉姆齐数下界」,被三位中国学者首次指数级改进
人工智能·openai
机器之心2 小时前
Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?
人工智能·openai
美团技术团队3 小时前
LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆
人工智能·算法