大语言模型

188_djh2 天前
人工智能·大语言模型·wps·ai技术·ai应用·deepseek·ai知识
# 10分钟了解DeepSeek,保姆级部署DeepSeek到WPS,实现AI赋能原创 DeepSeek 2025年02月12日 08:01 西安 AI技术、 AI知识 、 AI应用 、 人工智能 、 大语言模型
DeepDriving3 天前
大语言模型·deepseek
纯新手教程:用llama.cpp本地部署DeepSeek蒸馏模型llama.cpp是一个基于纯C/C++实现的高性能大语言模型推理引擎,专为优化本地及云端部署而设计。其核心目标在于通过底层硬件加速和量化技术,实现在多样化硬件平台上的高效推理,同时保持低资源占用与易用性。
子诚之4 天前
大语言模型
大模型Deepseek的使用_基于阿里云百炼和Chatbox上篇博文中探索了(本地)部署大语言模型,适合微调、数据高隐私性等场景。随着Deepseek-R1的发布,大语言模型的可及性得到极大提升,应用场景不断增加,对高可用的方案的需求激增。目前Deepseek-R1的使用方案主要包括以下四种:
翻滚的小@强4 天前
大语言模型·llama
Llama3.0论文学习笔记: The Llama 3 Herd of Models今天分享Llama3.0的论文,2024.7月来自Meta的Llama团队,2025年1月DeepSeek R1出现之后,其风头显然已经盖住了Llama3,这时候整理Llama3感觉有点赶不上潮流了,但是我还是想整理下Llama3.0,原因是刚好春节的时候读了下原论文(起源是节后在公司做分享),另外一个是Llama3的技术比较成熟,很多大模型的语言部分都是Llama的架构,因此想做为入门大模型的第一个实践模型。
子诚之5 天前
大语言模型
Cursor笔记优点:交互式生成和修改代码等文本。 局限:①目前还不能独立完成中大型项目,需要人工分解需求,逐步实现。②幻觉问题,需要人工检查。
遇见小美好9 天前
人工智能·自然语言处理·大语言模型
从零开始认识大语言模型(LLM)“AI小美好——聚焦科技、商业、职场。前沿资讯,实用干货,邂逅更美好的自己!”在当今数字化时代,语言不仅是人类交流的工具,更是信息传递的核心。随着人工智能技术的飞速发展,大语言模型逐渐走进了我们的生活,成为了一个备受瞩目的焦点。它不仅改变了我们与技术的交互方式,还在多个领域引发了深刻的变革。今天,就让我们一起探索大语言模型的奥秘,了解它的工作原理、应用场景以及对未来的深远影响。
阡之尘埃12 天前
人工智能·python·openai·大语言模型·api接口·deepseek
调用deepseek的API接口使用,对话,json化,产品化最近没咋用chatgpt了,deepseek-r1推理模型写代码质量是很高。deepseek其输出内容的质量和效果在国产的模型里面来说确实算是最强的,并且成本低,它的API接口生态也做的非常好,和OpenAI完美兼容。所以我们这一期来学一下怎么调用deepseekAPI的接口去进行对话批量化,产品化。
youcans_13 天前
人工智能·深度学习·大语言模型·moe·deepseek
【DeepSeek论文精读】3. DeepSeekMoE:迈向混合专家语言模型的终极专业化欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html)原创作品 【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】2. DeepSeek LLM:以长期主义扩展开源语言模型 【DeepSeek论文精读】3. DeepSeekMoE:迈向混合专家语言模型的终极专业化 【DeepSeek论文精读】4. DeepSeek-V2:强大、经济且高效的混合专家语言
TracyCoder12325 天前
java·llm·大语言模型·星火大模型
星火大模型接入及文本生成HTTP流式、非流式接口(JAVA)首先,需要在讯飞开放平台(https://passport.xfyun.cn/login)进行登录:点击这个+创建应用:
Space655361 个月前
人工智能·语言模型·自然语言处理·大语言模型
论文速读| A Survey on Data Synthesis and Augmentation for Large Language Models论文地址:https://arxiv.org/abs/2410.12896v1 bib引用:综述大语言模型(LLMs)的数据合成与增强技术,涵盖其在LLMs生命周期各阶段和核心功能中的应用,讨论面临的挑战并展望未来方向。
Cc不爱吃洋葱1 个月前
人工智能·大语言模型·agent·ai大模型·ai agent·智能体·ai智能体
如何本地部署AI智能体平台,带你手搓一个AI Agent今天分享如何在个人电脑上搭建一个AI智能体平台,可以自定义聊天机器人,设计智能体,编排工作流,知识库,RAG管道等等,还支持本地大模型接入,并对外提供API接口。
yuanlulu1 个月前
lora·llm·transformer·分布式训练·大语言模型·huggingface·多卡训练
llamafactory使用8张昇腾910b算力卡lora微调训练qwen2-72b大模型我需要在昇腾服务器上对Qwen2-72B大模型进行lora微调,改变其自我认知。 我的环境下是8张910B1卡。显存约512GB。
温柔哥`1 个月前
人工智能·大语言模型·vad·视频异常检测·llms·vlms·training-free
MCANet: 基于多模态字幕感知的大语言模型训练无关视频异常检测ICPR’24 - 印度卡利卡特国立理工学院 MCANet: Multimodal Caption Aware Training-Free Video Anomaly Detection via Large Language Model
zyplanke1 个月前
人工智能·ai·llm·大语言模型·ollama
Ollama私有化部署大语言模型LLM(上)目录一、Ollama介绍二、安装Ollama1、标准安装2、国内加速三、升级Ollama版本四、使用Ollama
程序员正茂1 个月前
人工智能·python·chatglm·大语言模型
Win10本地部署大语言模型ChatGLM2-6B鸣谢《ChatGLM2-6B|开源本地化语言模型》作者PhiltreX作者显卡为英伟达4060打开CMD命令行,在D盘新建目录openai.wiki
paixiaoxin2 个月前
人工智能·深度学习·机器学习·计算机视觉·语言模型·大语言模型·mllm
CV-MLLM经典论文解读| Link-Context Learning for Multimodal LLMs面向多模态大型语言模型的链接上下文学习Link-Context Learning for Multimodal LLMs面向多模态大型语言模型的链接上下文学习
老A的AI实验室2 个月前
人工智能·ai·llm·大语言模型·图片资源·genai
赛博周刊·2024年度工具精选(图片资源类)emoji表情包查找工具。微软开源的Fluent Emoji表情包。一个开源的emoji库,目前拥有4000+个emoji表情。
deephub2 个月前
人工智能·深度学习·transformer·大语言模型·kv缓存
SCOPE:面向大语言模型长序列生成的双阶段KV缓存优化框架Key-Value (KV)缓存已成为大语言模型(LLM)长文本处理的关键性能瓶颈。当前研究尚未充分关注解码阶段的优化,这一阶段具有同等重要性,因为:
yuanlulu2 个月前
人工智能·华为·自然语言处理·nlp·大语言模型·昇腾
mindie推理大语言模型问题及解决方法汇总使用功能mindie 1.0 RC2推理大语言模型,遇到不少问题,记录下解决思路。我的硬件是910B4。
知来者逆2 个月前
人工智能·深度学习·语言模型·自然语言处理·llm·大语言模型
Binoculars——分析证实大语言模型生成文本的检测和引用量按学科和国家明确显示了使用偏差的多样性和对内容类型的影响论文地址:https://www.biorxiv.org/content/10.1101/2024.03.25.586710v2.full.pdf 人工智能技术的进步正在改变数字内容生产和消费的格局。尤其值得注意的是生成式人工智能的快速发展,包括大规模语言模型,如 ChatGPT,它出现于 2022 年,是基于 GPT-3 的大规模语言模型,能够生成质量非常接近人类文本的文本。这些模型可以自由生成考虑到用法、语气和上下文的文本,因此被广泛应用于内容创作。