qwen模型

大傻^6 天前
transformer·生成式ai·多模态·qwen模型·大模型基础·deepseek架构·参数规模
从感知机到DeepSeek:AI大模型基础认知全栈解析(演进史·架构对比·参数详解)摘要:本文基于"AI大模型基础认知"知识体系,系统梳理从早期NLP到现代大模型的技术演进脉络,深度解析DeepSeek与Qwen底层架构差异,并通过可视化方式拆解"大模型究竟大在哪里"这一核心命题。适合作为大模型技术入门的系统性学习手册。
yubin12774086292 个月前
llamafactory·qwen模型
llamafactory调试代码由ai生成,本地调试通过。llamafactory会自动将模型下载到cache路径下,例如:/home/work/.cache/modelscope/hub/models/Qwen/Qwen3-VL-4B-Instruct
大龄码农有梦想1 年前
人工智能·function call·function·spring ai·deepseek·qwen模型
Spring AI如何调用Function Calling在 AI 智能体开发的过程中,RAG(Retrieval-Augmented Generation) 和 功能调用(Function Calling) 已经成为两种至关重要的模式。RAG 通过结合检索技术和生成模型的强大能力,使智能体能够实时从外部数据源获取信息,并在生成过程中增强其知识深度和推理能力。Function Calling模式为智能体提供了调用外部工具的能力,极大地扩展了其应用范围。智能体可以通过调用外部工具(如数据库操作、业务规则执行、算法工具调用等),完成更为复杂的任务和操作。这种灵活性使
我是有底线的