大模型

AI大模型顾潇4 小时前
人工智能·算法·机器学习·数据挖掘·大模型·微调·ai大模型
[特殊字符] 大模型对话风格微调项目实战——模型篇 [特殊字符]✨🎯 背景介绍🔍 这篇文章的任务🤖 模型选型📊 模型评测⚙️ 模型训练🔄 模型转换🧪 模型训练效果评估
Roc.Chang21 小时前
macos·语言模型·大模型·llm·ollama
释放 Mac 存储空间:Ollama 模型迁移到外接 NVMe 磁盘在本地运行 Ollama 时,模型数据默认保存在 ~/.ollama/models。 但对于 macOS 用户来说,苹果的存储是真的贵,真的是 Only Apple can do!!!所以就考虑存储外置的方案。
进击的DEV1 天前
人工智能·机器学习·ai·大模型·自动驾驶·deepseek
DeepSeek在自动驾驶领域的创新应用随着人工智能技术的快速发展,DeepSeek作为新一代AI大模型正在重塑自动驾驶行业的技术路径。凭借其强大的多模态理解能力、高效推理性能和低成本部署优势,DeepSeek为自动驾驶从L2辅助驾驶到L4完全自动驾驶的演进提供了全新的技术解决方案。本文将系统分析DeepSeek在自动驾驶领域的关键应用、技术突破及未来趋势。
卓越进步1 天前
大模型·llm·go·后端开发·mcp
MCP Server架构设计详解:一文掌握框架核心在微服务架构日益复杂的今天,一个优秀的服务器框架设计显得尤为重要。本文将详细介绍MCP Server的架构设计,通过图文结合的方式,帮助读者深入理解其核心组件和设计理念。
終不似少年遊*2 天前
人工智能·python·深度学习·算法·大模型·ds
国产之光DeepSeek架构理解与应用分析04目录门控机制?门如何控制专家信息的传递,如何实现路由机制?每个线性层和对应的门是什么关系?如何理解‘专家的选择是基于每个token进行的,而不是基于每个序列或者批次’?
大数据AI人工智能培训专家培训讲师叶梓2 天前
人工智能·ai·大模型·音视频·视频·视频生成·长视频
FramePack:让视频生成更高效、更实用想要掌握如何将大模型的力量发挥到极致吗?叶梓老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。
CoderOnly2 天前
计算机视觉·大模型
【图问答】DeepSeek-VL 论文阅读笔记《DeepSeek-VL: Towards Real-World Vision-Language Understanding》
云逸001~2 天前
云原生·kubernetes·大模型·llm·mlops·kubeflow·kserver
Kubeflow 快速入门实战(二) - Pipelines / Katib / KServer承接前文博客 Kubeflow 快速入门实战(一)Kubeflow 快速入门实战(一) - 简介 / Notebooks-CSDN博客文章浏览阅读441次,点赞19次,收藏6次。本文主要介绍了 Kubeflow 的主要功能和能力,适用场景,基本用法。以及Notebook,piplines,katib,KServer 的入门级示例https://blog.csdn.net/weixin_39403185/article/details/147337813?spm=1001.2014.3001.5502
万俟淋曦2 天前
人工智能·ai·机器人·大模型·论文·具身智能·vla
【论文速递】2025年04周 (Robotics/Embodied AI/LLM)作者: DeepSeek-AI, Daya Guo, Dejian Yang, Haowei Zhang, Junxiao Song, Ruoyu Zhang, Runxin Xu, Qihao Zhu, Shirong Ma, Peiyi Wang, Xiao Bi, Xiaokang Zhang, Xingkai Yu, Yu Wu, Z. F. Wu, Zhibin Gou, Zhihong Shao, Zhuoshu Li, Ziyi Gao, Aixin Liu, Bing Xue, Bingx
TGITCIC2 天前
大模型·数据治理·ai agent·rag检索增强·mcp·大模型数据·ai数据
智驱未来:AI大模型重构数据治理新范式在制造业巨头西门子的案例中,其全球200个工厂每天产生1.2PB工业数据,传统人工清洗需要300名工程师耗时72小时完成,错误率高达15%。数据孤岛问题导致供应链决策延迟平均达48小时。
程序员一一涤生3 天前
大模型·知识库
别再堆文档了,大模型时代知识库应该这样建有人说,大模型+知识库就是新一代的员工。可你有没有想过,如果你把一堆资料往员工桌上一扔,不教、不管,还想让他做出像样的工作,结果会如何?
CoderJia程序员甲3 天前
人工智能·ai·大模型·音视频·短视频
KrillinAI:视频跨语言传播的一站式AI解决方案在全球内容创作领域,跨语言传播一直是内容创作者面临的巨大挑战。传统的视频本地化流程繁琐,涉及多个环节和工具,不仅耗时耗力,还常常面临质量不稳定的问题。随着大语言模型(LLM)技术的迅猛发展,一款名为KrillinAI的开源工具横空出世,为内容创作者带来了革命性的视频翻译与配音解决方案。本文将深入剖析这款GitHub上备受瞩目的项目,探讨其技术架构、核心功能及应用价值。
黑客-雨3 天前
人工智能·ai·大模型·llm·agent·ai大模型·mcp
一文读懂 MCP!大模型如何用它连接世界,打造更智能的 AI Agent?可能有人会问:“这不就是大模型的工具调用吗?”没错,MCP 本质上就是工具调用。但不同的是,过去的工具调用需要开发人员手动编写代码,将工具嵌入应用程序,而 MCP 引入了一种标准化的调用协议。
轻口味3 天前
人工智能·ai·大模型·mcp
给AI装上“万能双手”的协议,小白也能玩转智能工具-一文搞懂MCP最近AI圈最火的就是MCP了,MCP是什么呢?MCP要解决什么问题?MCP优势有哪些?MCP如何使用?MCP可以给我们带来哪些机会?本文带你解答这些疑惑。
meisongqing3 天前
人工智能·大模型·prompt
【大模型】Prompt构造与优化指南在人工智能领域,尤其是自然语言处理任务中,prompt(提示词)的构造和优化直接影响模型输出质量。以下从构成要素到调优方法的完整指南:
ybdesire4 天前
网络·人工智能·安全·web安全·大模型·漏洞·大模型安全
Jinja2模板引擎SSTI漏洞再研究大模型相关应用的漏洞CVE-2025-25362时(参考1),看到作者给了比较详细的分析(参考2)。下面对这个漏洞做个介绍。
AI大模型顾潇4 天前
运维·人工智能·spring·自然语言处理·自动化·大模型·prompt
[特殊字符] AI 大模型的 Prompt Engineering 原理:从基础到源码实践在 AI 大模型蓬勃发展的当下,它们展现出令人惊叹的语言处理能力,从文本生成到智能问答,从机器翻译到代码编写,几乎涵盖了自然语言处理的各个角落。然而,要充分挖掘这些大模型的潜力,使其输出符合我们预期的高质量结果,并非易事。
Sherlock Ma6 天前
人工智能·阿里云·大模型·aigc·检索增强·rag·deepseek
基于LightRAG进行本地RAG部署(包括单卡多卡本地模型部署、调用阿里云或DeepSeekAPI的部署方法、RAG使用方法)RAG(Retrieval-Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的自然语言处理模型架构。它旨在解决传统生成模型在面对复杂任务时可能出现的生成内容缺乏准确性和多样性的不足。在RAG模型中,首先会有一个检索模块,它会在一个庞大的外部知识库中检索与输入文本相关的片段或文档。这个知识库可以是预先构建的语料库,也可以是实时从互联网等来源获取的信息。RAG模型通过检索模块引入外部知识,使得生成的内容能够更好地结合实际的背景知识,从而提高生成结果
鸿乃江边鸟7 天前
大模型·deepseek
快速部署大模型 Openwebui + Ollama + deepSeek-R1模型本文主要快速部署一个带有web可交互界面的大模型的应用,主要用于开发测试节点,其中涉及到的三个组件为open-webui
X.Cristiano7 天前
大模型·glm
智谱开源 9B/32B 系列模型,性价比超 DeepSeek-R1,Z.ai 平台上线智谱将开源 32B/9B 系列 GLM 模型,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。该系列模型现已通过全新平台 Z.ai 免费开放体验,并已同步上线智谱 MaaS 平台。