llm

求知呀4 分钟前
前端·人工智能·llm
最直观的 Cursor 使用教程此篇文章不是针对纯小白的,而是简单用过Cursor一段时间的人内容主要来自官网 Cursor编写于 2025-4-4
simplify2014 分钟前
llm·deepseek
【译】通用奖励建模的推理时扩展:综合概述原文地址IntroductionUnderstanding Reward Modeling Paradigms
Mengke11 小时前
llm·mcp
以「asset-price-mcp」为例,从 0 开发 MCP Server关于 MCP 的介绍之前已经写过,可以参考 《Model Context Protocol (MCP) 快速开始》。
simplify2020 小时前
llm·deepseek
【译】Anthropic:推理模型的思维链并非总是忠实2025年4月3日原文地址自去年末以来,“推理模型”的概念在人工智能领域备受关注。 这些AI模型,例如Claude 3.7 Sonnet,能够展示其推理过程:除了给出最终答案,你还可以阅读它们得出结论的路径,通常既引人入胜又错综复杂,这就是所谓的“思维链”(Chain-of-Thought, CoT)。 “思维链”不仅帮助推理模型解决更复杂的问题,也为人工智能安全研究人员提供了便利。 因为我们可以检查模型在“思维链”中表达、但在最终输出中未提及的内容,这有助于我们发现诸如欺骗之类的不良行为。 但如果我们想
几米哥20 小时前
llm·aigc·chatglm (智谱)
从思考到行动:AutoGLM沉思如何让AI真正"动"起来人工智能技术正经历一场范式转变,从擅长对话的大型语言模型,到擅长思考的推理模型,再到如今能够"边想边干"的智能体。近日,智谱AI推出的"AutoGLM沉思"作为国内首个集深度研究与操作执行于一体的自主智能体,标志着AI代理技术的重要突破。本文将深入探讨AutoGLM沉思的核心功能、技术原理、应用场景及其与其他产品的对比,帮助读者全面了解这一创新技术及其潜在影响。
遇码1 天前
人工智能·语言模型·langchain·llm·大模型开发·智能体
大语言模型开发框架——LangChainLangChain是一个开发由语言模型驱动的应用程序的框架,它提供了一套工具、组件和接口,可以简化构建高级语言模型应用程序的过程。利用LangChain可以使应用程序具备两个能力:
Ai野生菌1 天前
网络·人工智能·安全·大模型·llm
工具介绍 | SafeLLMDeploy教程来了 保护本地LLM安全部署在AI技术飞速发展的今天,大语言模型(LLM)如GPT、DeepSeek等正以前所未有的方式改变着我们的工作和生活。然而,本地部署这些强大的AI系统在带来便利的同时,也伴随着不容忽视的安全隐患。数据泄露、未授权访问、恶意攻击——这些威胁让企业和开发者在本地部署LLM时如履薄冰。
缘友一世1 天前
开源·llm·ollama·deepseek
开源的 LLM 应用开发平台Dify的安装和使用创建知识库,上传文本文件设置分段标识和索引方式、向量化模型创建Chatflow应用,并填写基本信息,点击创建
kcarly2 天前
开源·大模型·llm·deepseek
DeepSeek 都开源了哪些技术?DeepSeek作为中国领先的人工智能企业,通过开源策略推动了全球AI技术的普及与创新。以下是其官方公布的主要开源项目及其技术内容、应用场景和社区反馈的详细分析:
洛阳泰山2 天前
python·ai·llm·agent·ppt
PPTAgent:一款开源免费生成和评估幻灯片的项目这篇文章介绍一下PPTAgent,一个从文档自动生成演示文稿的创新系统。该系统从人类的展示创作方法中汲取灵感,采用两步流程来确保卓越的整体质量。此外,本文还介绍了PPTEval,这是一个综合评估框架,可以跨多个维度评估演示文稿。
redreamSo2 天前
llm·mcp
模型上下文协议(MCP):连接大语言模型与外部世界的桥梁在人工智能技术快速发展的今天,大型语言模型(LLM)的能力边界不断扩展,但其与真实世界的数据孤岛、工具系统的连接问题始终是技术落地的关键瓶颈。模型上下文协议(Model Context Protocol,MCP)正是由Anthropic在2024年11月推出的开放标准,旨在通过标准化接口解决LLM与外部数据源、工具的集成难题。截至2025年,该协议已在GitHub、Claude Desktop等平台实现深度集成,被VentureBeat等媒体称为"AI领域的USB-C接口"。
星始流年2 天前
python·llm·pyspider
解决PyInstaller打包PySide6+QML应用的资源文件问题最近为了扩展自己的技术边界,紧跟AI时代的潮流,我正在尝试使用Python开发一个基于LLM的youtube视频翻译工具。但因为自己最熟悉的技术栈都是JS相关,开发Electron应用还好,使用Python开发桌面应用属实费脑 (还好有cursor。另外扯一句,希望大家也都尽量迁移到这类AI编程工具上来。现阶段的AI编程工具离自主编程还有一段距离「就像我在解决本文提到的问题时,使用claude3.7尝试了好几次,始终无法解决,甚至路会越走越偏」,但借助它来辅助编程,绝对能提升80%的工作效率。AI自主编程
go4it2 天前
llm
聊聊Spring AI的Image Model本文主要研究一下Spring AI的Image Modelorg/springframework/ai/image/ImageModel.java
林泽毅2 天前
算法·llm·强化学习
SwanLab x EasyR1:多模态LLM强化学习后训练组合拳,让模型进化更高效很开心,SwanLab已经与多模态LLM强化学习后训练框架EasyR1完成官方集成。在最新的EasyR1版本中,可以使用SwanLab进行实验跟踪与曲线可视化,并将LLM中间生成的内容直观的记录与管理起来。接下来让我介绍一下如何使用。
EdisonZhou3 天前
llm·aigc·asp.net core·.net core
使用MCP C# SDK开发MCP Server + Client大家好,我是Edison。近日被MCP刷屏了,刚好看到张队发了一篇文章提到MCP的官方C# SDK发布了预览版,于是手痒痒尝了一下鲜,写了一个DEMO分享给大家。
量子位3 天前
人工智能·llm
稚晖君刚挖来的 90 后机器人大牛:逆袭履历堪比爽文男主刚刚,稚晖君旗下创企智元机器人官宣了两个新动向——一则是关于人事变动。具身智能领域的国际领军学者罗剑岚博士,已于近日加盟并出任首席科学家。
量子位3 天前
人工智能·llm
200 亿机器人独角兽被曝爆雷,官方回应来了估值 223 亿元人形机器人明星创企,突传暴雷???风暴中心,是总部位于上海的达闼机器人。从多方消息来看,核心信息如下:
Baihai_IDP3 天前
人工智能·llm·deepseek
「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡编者按: 在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
山青花欲燃3103 天前
前端·llm
React 对接流式接口实现在现代 AI 对话应用中,流式响应(Streaming Response)已经成为提升用户体验的关键技术。本文将详细介绍如何在 React 应用中实现流式接口的对接。
货拉拉技术4 天前
前端·程序员·llm
LLM 驱动前端创新:AI 赋能营销合规实践自从OpenAI在22年年底发布GPT-3.5 大型语言模型(LLM)以来,LLM正在快速的进入各个领域,但是部分前端开发同学产生了一个误区,认为LLM是后端或者AI工程师的事,与咱们前端开发无关。