技术栈
llm
组合缺一
14 分钟前
java
·
人工智能
·
分布式
·
ai
·
llm
·
solon
·
mcp
OpenSolon v3.9.3, v3.8.5, v3.7.5, v3.6.8 年货版发布
OpenSolon 是新一代,Java 企业级应用开发框架。从零开始构建(No Java-EE),有灵活的接口规范与开放生态。采用商用友好的 Apache 2.0 开源协议,是“杭州无耳科技有限公司”开源的根级项目,是 Java 应用开发的生态基座(可替换美国博通公司的 Spring 生态)。
26岁的学习随笔
26 分钟前
llm
·
agent框架
·
claude code
·
prompt engineering
·
api分析
【Claude Code】拆解 Claude Code 的 API 交互 —— 抓包看清每一个字节
作者:Sebastilan & Claude(AI 协作)Claude Code 作为 Agent 框架,每次对话不是简单地把用户消息发给模型。但 API 层面到底发送了什么?system prompt 里写了哪些规则?工具定义具体长什么样?我的 CLAUDE.md 配置是怎么被塞进去的?多轮对话时,请求是增量传输还是全量重发?
EdisonZhou
12 小时前
llm
·
aigc
·
agent
·
.net core
MAF快速入门(16)用户智能体交互协议AG-UI(上)
大家好,我是Edison。最近我一直在跟着圣杰的《.NET+AI智能体开发进阶》课程学习MAF开发多智能体工作流,我强烈推荐你也上车跟我一起出发!
XX123122
17 小时前
llm
数据处理与转换|基于 data_engineering_book 玩转 ETL/ELT 核心流程
本文基于《Data Engineering Book》核心内容,深度拆解 ETL/ELT 的核心差异与适用场景,结合 Spark 批处理、Flink 流处理给出可落地的代码示例,总结数据转换最佳实践,并入门级讲解处理性能调优的核心思路,覆盖数据工程中数据处理环节的核心考点与实操要点。
XX123122
17 小时前
llm
重写图文描述(Recaptioning)| 基于 data_engineering_book让文本更适配模型、更贴合图片
在多模态项目落地中,我们常会遇到「图片描述文本质量差」「文本风格不匹配模型输入习惯」「单描述覆盖不了图片核心信息」等问题——而Recaptioning(重写图文描述/重新生成图片标题) 正是解决这些问题的核心手段。本文基于《Data Engineering Book》核心内容,从Recaptioning的应用价值、核心策略、工程化实现到效果评估,手把手教你落地高质量的Recaptioning流程。
EasyLLM
18 小时前
人工智能
·
llm
MiniMax M2.5实测
MiniMax在春节假期前发布了MiniMax M2.5新版本,官方表示该模型经过数十万个真实复杂环境中的大规模强化学习训练,在编程、工具调用和搜索、办公等生产力场景达到了行业前沿水平。我们对MiniMax M2.5与上一代MiniMax M2.1进行了全面的中文场景对比评测,测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。
Baihai_IDP
21 小时前
人工智能
·
面试
·
llm
Prompt caching 技术是如何实现 1 折的推理成本优化的?
编者按: 你是否曾好奇过,那些声称能将长文本输入成本降低90%、延迟减少85%的"Prompt Caching"技术,背后究竟缓存了什么?是简单的文本复用,还是某种更深层的计算优化?
马腾化云东
1 天前
人工智能
·
python
·
llm
Agent开发应知应会(Langfuse):Langfuse Session概念详解和实战应用
最近在做一个 Text-to-SQL 的 Agent 项目 EasySQL,这篇文章就把我langfuse的session使用整理一下,代码都是从项目里直接搬的,欢迎大佬们高抬贵手点点star,共建、交流。
Tadas-Gao
1 天前
架构
·
系统架构
·
大模型
·
llm
大模型实战装备全解析:从本地微调到移动算力的笔记本电脑选择指南
面对屏幕上加载到一半就因显存不足而中断的模型训练任务,计算机专业研究生李涛再次感受到硬件瓶颈带来的无奈。他环顾实验室里那几台沉重的塔式工作站,思考着一个问题:如果有一台笔记本能像工作站一样完成模型训练,又能在图书馆和教室之间自由移动,那该多好。
dawdo222
2 天前
llm
·
transformer
·
性能调优
·
推理引擎
·
xllm
·
模型执行器
自己动手从头开始编写LLM推理引擎(12)-xLLM的整体调优
大型语言模型(LLM)推理系统的性能调优是一个复杂而关键的过程,涉及到系统架构、算法实现、资源管理等多个方面。xLLM作为一个高性能的LLM推理框架,通过一系列精心设计的优化措施,实现了显著的性能提升。本文将全面总结xLLM的整体调优过程,包括模型执行器、调度器、采样器等核心组件的优化策略,以及性能测试和监控分析结果。
缘友一世
2 天前
llm
·
数据集
GRPO奖励模型微调:从数据构建到技术路径选择
微调带来的好处:核心逻辑:奖励模型是GRPO整个训练的"指向针"。微调奖励模型,确保它能准确指向专业领域的"正确方向"。
Gain_chance
2 天前
langchain
·
llm
·
rag
01-从零构建LangChain知识体系通俗易懂!!!
目录从零构建 LangChain 知识体系(小白友好·比喻版)📌 引言第一层 · 地基:LLM 与它的基本语言
dawdo222
3 天前
llm
·
transformer
·
性能测试
·
qwen
·
benchmark
·
推理引擎
自己动手从头开始编写LLM推理引擎(11)-xLLM的benchmark实现
在大型语言模型(LLM)推理系统中,性能评估是确保系统稳定性和效率的关键环节。xLLM提供了一个功能完善的基准测试工具(benchmark),用于全面评估系统在不同负载条件下的性能表现。本文将详细介绍xLLM benchmark工具的设计理念、核心实现、测试策略和性能分析方法,帮助开发者深入理解LLM推理系统的性能评估方法。
CoderJia程序员甲
3 天前
开源
·
大模型
·
llm
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-02-10)
生成于:2026-02-10共发现热门项目: 13 个榜单类型:日榜本期GitHub热榜彰显AI自主代理技术如火如荼,聚焦网络安全如Shannon的高效漏洞挖掘、金融分析如Dexter的深度研究,凸显自动化与精准性;安全优先趋势显著,Monty和Litebox以Rust强化性能与隔离;开发工具如AionUi和GitButler提升AI集成与协作效率,开源项目推动代码为主、问题解决的可复现实践,助力开发者应对实际挑战。
字节架构前端
3 天前
llm
·
agent
·
ai编程
多智能体协作系统与传统软件工程的比较及未来展望
人工智能技术的飞速发展正在重塑软件系统的设计与实现方式。作为 AI 领域的前沿研究方向,多智能体协作系统(Multi-Agent Collaboration Systems)通过组织多个具有不同能力和专长的智能体共同工作,为解决复杂问题提供了新的范式。这些系统不仅展示了强大的问题解决能力,还在软件架构设计上呈现出与传统软件工程惊人的相似性和创新性。
Baihai_IDP
3 天前
人工智能
·
llm
·
ai编程
分享一些编程助手使用过程中的经验教训与观察思考
编者按: 文章内容涵盖作者近18个月的深度实践观察:首先,作者指出AI助手在主流语言代码生成、长期任务连贯性方面取得显著突破,但在UI框架抽象层处理上仍显笨拙;其次,他揭示了模型“求快”的默认性格需通过“惯用性”提示词加以约束,并惊叹于Opus 4.5与GPT 5.2在Bug定位上的惊人能力,但也警示,过度依赖AI会导致开发者心智模型保真度快速衰减,进而缩短代码库的“品质半衰期”;最后,作者提出务实建议——从处理繁琐任务入手,使用外部沙箱隔离会话,并接受“亲手打磨代码”将逐渐从职业需求回归为纯粹热爱的现实
掘金安东尼
4 天前
llm
离了大谱!一个 prompt 生成了 7 万字!mark
我也不明所以,糖糖,先记下来!评价这个技术框架,列表:交付一款成品感很强的桌面软件,名字叫「短信智标官(SMS Tagging Officer)」。它用于对几千条短信做离线分类打标与结构化抽取,运行环境完全离线,推理引擎内嵌 llama.cpp,前端用 Tauri + Vue 3,数据落 SQLite,用户通过桌面界面完成导入、批处理、复核、导出,最后能用于行业报表与短信治理。你需要把它当作真实交付项目来做,输出的内容必须是可复制运行的完整工程骨架与关键代码文件,包含打包说明,能够在没有网络的环境里直接跑
gustt
4 天前
前端
·
后端
·
llm
构建支持流式输出的AI聊天应用:React与DeepSeek集成实践
在AI聊天应用开发中,流式输出已成为提升用户体验的关键特性。传统的一次性响应往往导致用户等待时间过长,而流式输出允许模型生成的文本逐 token 实时传输,像打字机一样逐步显示内容。这不仅使交互更自然,还能让用户感知到应用的响应速度更快。本文将基于一个实际项目,分享如何使用 React 前端结合自定义 Hook ,以及 Mock 后端集成DeepSeek模型,实现支持流式输出的聊天机器人。项目强调前后端分离、响应式设计和HTTP协议优化,适用于开发者快速构建原型或学习AI集成。
liuchangng
4 天前
人工智能
·
llm
·
ollama
Huggingface大模型下载方法总结_20260128084905
几G以内的小型模型,无需安装额外工具,浏览器即可操作几十G的大型模型,支持断点续传、后台运行,可灵活指定下载目录/过滤文件