llm

Baihai_IDP7 小时前
人工智能·llm·deepseek
「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡编者按: 在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
山青花欲燃3107 小时前
前端·llm
React 对接流式接口实现在现代 AI 对话应用中,流式响应(Streaming Response)已经成为提升用户体验的关键技术。本文将详细介绍如何在 React 应用中实现流式接口的对接。
货拉拉技术1 天前
前端·程序员·llm
LLM 驱动前端创新:AI 赋能营销合规实践自从OpenAI在22年年底发布GPT-3.5 大型语言模型(LLM)以来,LLM正在快速的进入各个领域,但是部分前端开发同学产生了一个误区,认为LLM是后端或者AI工程师的事,与咱们前端开发无关。
xidianjiapei0011 天前
llm·bert·word2vec·elmo·cbow·llm架构·词嵌入模型
LLM架构解析:词嵌入模型 Word Embeddings(第二部分)—— 从基础原理到实践应用的深度探索本专栏深入探究从循环神经网络(RNN)到Transformer等自然语言处理(NLP)模型的架构,以及基于这些模型构建的应用程序。
xidianjiapei0011 天前
人工智能·语言模型·自然语言处理·llm·transformer
构建大语言模型应用:句子转换器(Sentence Transformers)(第三部分)在之前的博客中,我们学习了为RAG(检索增强生成,Retrieval Augmented Generation)进行数据准备,包括数据摄取(Data Ingestion)、数据预处理(Data Preparation)和分块(Chunking)。
白云千载尽1 天前
java·人工智能·大模型·llm·blender
AI时代下的编程——matlib与blender快捷编程化、初始MCPblender编程建模测试 进入blender脚本模式新建一个脚本并运行上述程序,可以得到太阳系的自转公转的动画 点击即可播放 添加上相关颜色即可。 matlib脚本搭建simulink测试
浪漫程序1 天前
人工智能·llm·aigc
OWL 简明指南:快速上手🦉 OWL 是一个前沿的多智能体协作框架,推动任务自动化的边界,构建在 Camel AI 之上,其愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互,OWL 实现了跨多领域更自然、高效且稳健的任务自动化。 github.com/camel-ai/ow…
Aaaaaaaaaaayou2 天前
llm·测试
浅玩一下,基于 Appium 的自动化测试 AI Agent上篇文章,我们使用 Appium 的插件 appium-llm-plugin 来辅助我们进行 UI 自动化测试。不过整个流程感觉还是不够智能,我们还是得手动去调用 API 来完成一个测试用例的编写,有没有可能把这个也去掉,用纯自然语言来写一个自动化测试用例呢?这篇文章就来试一下,来实现一个简单的自动化测试 Agent。
爱听歌的周童鞋2 天前
llm·llama·llama.cpp·inference
理解llama.cpp如何进行LLM推理看到一篇非常不错的文章和大家分享下,主要是解决了博主之前的很多困惑,记录下个人学习笔记,仅供自己参考😄
Golinie2 天前
llm·prompt·gin·langchaingo
使用Ollama+Langchaingo+Gin通过定义prompt模版实现翻译功能提示词为:你是一个只能进行中英文翻译的机器。请翻译这段文字到{{.outpugLang}}:{{.input}}。
movee3 天前
后端·llm·mcp
十分钟从零开始开发一个自己的MCP server(二)本来计划一篇文章介绍完如何开发一个自己的MCP server,写完 十分钟从零开始开发一个自己的MCP server(一)后,发现虽然很多内容没有介绍,篇幅还是比较长的,所以分成两篇来介绍。这一篇通过一个写文件功能的例子来介绍如何开发一个具体的MCP server
movee3 天前
后端·llm·mcp
十分钟从零开始开发一个自己的MCP server(一)自从chatGPT发布以后,大家探索和应用大语言模型(LLM)的热情不断高涨,不同行业、不同应用领域都在积极尝试使用大语言模型的能力解决各自的问题,取得了惊人的效果。当前,大语言模型最基础的使用方式,就是像chatGPT那样,我们向它提问,然后它给我们一个答案。这个答案,可能是提供一些信息知识,生成sql查询语句,生成一段代码,制定一个行动计划等等。然后我们使用模型提供的sql语句去查询数据库,将代码集成到自己的项目中编译执行。于是,自然而然地,我们就可以想到让大语言模型应用程序自己用大语言模型生成的sq
Martian小小3 天前
llm·mcp
MCP探索MCP 作为 Agent 中很火的一个概念,我们来了解一下它具体是什么?有什么作用?有什么应用场景?在下文开始之前,我们首先来关注一个场景:在USB 协议诞生前,电子设备(如手机、平板、键盘)使用不同的充电接口,这导致:
go4it3 天前
llm
聊聊Spring AI的Advisors本文主要研究一下Spring AI的Advisorsorg/springframework/ai/chat/client/advisor/api/Advisor.java
我爱果汁3 天前
人工智能·llm·aigc
AI学习-1-Ollama+OpenUI+NeutrinoProxy本地搭建Deepseek-R1本章分享个人怎么在本地部署大模型,并让它可以被公网访问需要:个人电脑,具有公网IP的服务器具体分为三个步骤:
袭明_3 天前
llm
AI大模型 之 词向量(Word to Vector)词向量 和 词嵌入 都是指,将单词转换成向量,然后再使用余弦相似度计算单词相似度。一个指向量,一个指转换成向量的过程。
simplify203 天前
llm
【译】Anthropic:追踪大型语言模型的思想原文地址: www.anthropic.com/research/tr…像 Claude 这样的大语言模型,并非由人类直接编写程序,而是通过海量数据训练而成。在训练过程中,它们会学习自己的策略来解决问题。这些策略被编码在模型为生成每个词所执行的数十亿次计算中。对我们这些开发者来说,这些策略就像个黑盒子,难以理解。这意味着我们不理解模型是如何完成它们所做的大部分事情的。 了解 Claude 这类模型的工作原理,能让我们更好地理解其能力,并确保它们按照我们的意愿行事。例如:
xidianjiapei0014 天前
人工智能·语言模型·自然语言处理·llm·rag
构建大语言模型应用:数据准备(第二部分)本专栏通过检索增强生成(RAG)应用的视角来学习大语言模型(LLM)。如上图所示,是检索增强生成(RAG)的数据准备流程
聪明的一休丶4 天前
python·llm·aigc·mcp
MCP Server 实现一个 天气查询Question: 什么是 uv 呢和 conda 比有什么区别? Answer: 一个用 Rust 编写的超快速 (100x) Python 包管理器和环境管理工具,由 Astral 开发。定位为 pip 和 venv 的替代品,专注于速度、简单性和现代 Python 工作流。
袭明_4 天前
llm
AI大模型 之 词袋模型(Bag-of-words)词袋模型忽略词与词之间的顺序关系。 将文本中的词看作一个个独立的个体,只关心每个词出现的频次。一般的自然语言处理工具包都为我们提供了分词工具。比如,英文分词用NLTK,spaCy,中文则使用 jieba 包对这些句子分词,以词为单位处理语料,而不是字。