llm

DO_Community1 小时前
大数据·人工智能·ai·llm·区块链
DigitalOcean携手Persistent达成战略合作,让 AI 更亲民、更易扩展DigitalOcean(纽约证券交易所代码:DOCN)——全球领先的综合性智能体云(agentic cloud)平台,宣布与全球领先的数字工程与企业现代化服务商 Persistent Systems(孟买证券交易所代码:533179;印度国家证券交易所代码:PERSISTENT)达成一项多年期、年均金额达八位数的战略合作,为全球数字原生企业及开发者提供更经济、可扩展且安全的人工智能(AI)解决方案。此次合作旨在通过提供高性价比、易于获取的基础设施,加速 AI 技术的落地应用,为创新和业务增长提供坚实支撑
南麟剑首4 小时前
ai·llm·数据集·数据清洗·大模型开发·模型训练
LLM模型开发教程(六)模型训练的数据集获取与清洗总纲数据的“科学划分”:训练、验证与测试请理解这句话!!!! 预训练之所以叫做“自监督学习”,是因为数据本身就是标签,通过掩码机制既确保了预测方向,也是一种遮住答案的策略,即数据本身答案已知,但用掩码遮住了,通过预测的token与掩码下的token做对比观察损失,以此为依据来优化模型参数
暴风鱼划水5 小时前
python·语言模型·大模型·llm
大型语言模型(入门篇)C预训练模型是大型语言模型(LLM)完成其训练阶段后的结果。使用预训练模型的原因:预训练LLM的访问途径:
xiao5kou4chang6kai46 小时前
人工智能·自然语言处理·llm·大语言模型·n8n自动化
只是把AI当作一个更聪明的搜索工具??如何用大语言模型高效整合信息并把研究想法快速转化为可发表成果《贯通LLM应用→数据分析→自动化编程→文献及知识管理→科研写作与绘图→构建本地LLM、Agent→多模型圆桌会议→N8N自动化工作流深度应用》
CoderJia程序员甲1 天前
开源·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-01-20)生成于:2026-01-20共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI应用开发正全面开花,开发者正积极利用大语言模型解决实际问题。热点集中在两大方向:一是智能体与RAG技术,如LEANN实现本地高效私密检索,PocketFlow用百行代码搭建智能体框架,凸显轻量化与实用化趋势;二是AI工具链完善,Google的langextract能精准抽取文本信息,多款Claude技能工具则极大降低了AI工作流的定制门槛。同时,经典项目如PythonRobotics和freqtrade持续受到
程序员柒叔1 天前
大模型·llm·prompt·dify
Dify 集成-文档处理Dify 集成多种文档处理和网页爬取服务,用于从各类文档和网页中提取文本内容,构建知识库。📌 以下路径均为项目实际文件结构
audyxiao0011 天前
llm·aaai·智能体·智慧教育·个性化学习
AAAI 2025论文分享|Agent4Edu:基于大语言模型生成式智能体的个性化学习模拟器本推文介绍了AAAI 2025收录的一篇论文《Agent4Edu: Generating Learner Response Data by Generative Agents for Intelligent Education Systems》。Agent4Edu是一种基于大语言模型的个性化学习模拟器,旨在解决智能教育系统中高质量学习者响应数据稀缺、传统模拟方法简化且依赖真实数据的痛点。Agent4Edu由生成式智能体和个性化学习环境构成。智能体集成学习者档案、记忆、动作三大模块,可模拟学习者完整解题流程
CoderJia程序员甲2 天前
git·ai·开源·llm·github
GitHub 热榜项目 - 日榜(2026-01-19)生成于:2026-01-19共发现热门项目: 9 个榜单类型:日榜本期GitHub热榜显示AI工具本地化与实用化成为核心趋势,AionUi作为多模型AI编程助手整合平台,结合LEANN的高效私有化RAG方案,凸显开发者追求离线、可控的AI开发体验;同时Google的langextract与OpenBMB的VoxCPM分别聚焦LLM信息精确提取与免分词语音生成技术,推动AI在结构化数据处理与语音交互的深度应用;而Rust构建的高频交易框架nautilus_trader及经典工具yt-dlp的持续热度,印证高
DO_Community2 天前
人工智能·算法·llm·aigc·moe·aiter
技术解码:Character.ai 如何实现大模型实时推理性能 2 倍提升Character.ai 是一家领先的 AI 娱乐平台,全球用户约 2000 万。Character.ai 团队希望提升 GPU 性能,并降低推理成本。其应用需要在大规模场景下保持极低延迟。为实现这一目标,Character.ai 找到了 DigitalOcean 和 AMD。三方紧密合作,对 AMD Instinct™ MI300X 和 MI325X GPU 平台进行了深度优化,使生产环境的推理吞吐量提升了 2 倍。
YuTaoShao2 天前
llm·agent·智能体·提示词工程·上下文工程
提示词工程已死,上下文工程当立原文:提示词工程已死,上下文工程当立上下文对智能体至关重要,但它并非取之不尽。这篇文章将分享如何高效筛选和管理上下文,让你的 Agent 表现更出色。
一个处女座的程序猿2 天前
llm·moe·thinking
LLMs之MoE之Thinking:LongCat-Flash-Thinking-2601的简介、安装和使用方法、案例应用之详细攻略LLMs之MoE之Thinking:LongCat-Flash-Thinking-2601的简介、安装和使用方法、案例应用之详细攻略
眠りたいです2 天前
人工智能·langchain·llm·ollama·python3.13
使用LangChain进行AI应用构建-快速上手,定义模型和调用工具部分读者在进行学习之前,需要了解Python并自行解决魔法上网问题,最好是有其他语言的基础比如C/C++或JAVA。本文主要演⽰如何使⽤ LangChain 接⼊⼤模型组件,以及与⼤模型进⾏简单对话的能力。 掌握了基本⽤法后,将会引出 LangChain 相关前置概念,以便后续深⼊学习 LangChain 标准化组件。注意:Python版本为3.13版本
doll ~CJ2 天前
langchain·llm·ai agent·应用开发·通义千问系列大模型
Large Language Model(LLM)应用开发学习实践(一)阿里云百炼平台(Bailian)与DashScope(灵积)都是阿里云提供的大模型服务产品,二者都基于通义千问(Qwen)等大模型,但在定位、功能、目标用户和使用方式上存在明显区别。整体上两者的关系为互补演进,DashScope 提供原子能力,百炼在此之上构建应用生态。
EdisonZhou3 天前
llm·aigc·agent·.net core
MAF快速入门(12)主工作流+子工作流大家好,我是Edison。最近我一直在跟着圣杰的《.NET+AI智能体开发进阶》课程学习MAF开发多智能体工作流,我强烈推荐你也上车跟我一起出发!
人工干智能3 天前
langchain·llm
LangChain 中的「工具(Tool)」和「工具包(Toolkit)」漫谈在LangChain的生态体系中,工具(Tool)与工具包(Toolkit)是撑起大模型落地应用的核心骨架,也是让大模型从“能说会道”走向“能做实事”的关键桥梁。如果说大模型是LangChain应用的“大脑”,负责思考、决策与推理,那么工具就是延伸大脑能力的“手脚”,是连接虚拟大模型与现实世界、业务系统的唯一枢纽。没有工具的加持,大模型终究囿于自身的预训练知识边界,无法触达实时数据、本地业务资源,也无法完成具体的业务操作,LangChain作为“大模型应用开发框架”的落地价值也会大打折扣。可以说,工具是L
山顶夕景4 天前
大模型·llm·ocr·多模态·文档智能·vlm
【VLM】Format Decoupled Reinforcement Learning for Document OCR【文档智能进展】讲的故事是格式化文本(公式、表格等)比纯文本熵值高一个数量级,导致模型输出不确定性大、解析准确率低,所以搞了个应对思路。工作在:Reading or Reasoning? Format Decoupled Reinforcement Learning for Document OCR,https://arxiv.org/pdf/2601.08834,
用什么都重名4 天前
python·大模型·llm·api调用
「实战指南」使用 Python 调用大模型(LLM)目录前言1. 原生HTTP请求方式1.1 核心特点1.2 关键代码分析1.3 优势和适用场景1.4 完整代码
mumu-hn4 天前
人工智能·llm·agent
浅说LLM-Agent(大模型-智能体)大家好我是木木,自从2022年11月30日OpenAI发布ChatGPT后,大模型迅速火热起来,人工智能作为当下最火的行业之一,2025年春节期间DeepSeek R1模型大火。LLM中有很多的技术,今天我们浅说LLM-Agent智能体技术。
人工干智能4 天前
langchain·llm
LangChain的提示模板template中的{tool_names}和{agent_scratchpad}与一般程序不同:LangChain的提示模板template中的{tool_names}和{agent_scratchpad}变量并不需显示指定,它们会自动被填充。
一个处女座的程序猿4 天前
llm·transformer·lcw·ttt-e2e
Transformer 之LCW/TTT-E2E:《End-to-End Test-Time Training for Long Context》翻译与解读Transformer 之LCW/TTT-E2E:《End-to-End Test-Time Training for Long Context》翻译与解读