ai

码以致用6 小时前
人工智能·ai·架构·agent
DeerFlow Memory架构DeerFlow 的 长期记忆(Long-Term Memory) 系统使 Agent 能够在会话之间保留信息。与传统的聊天机器人在会话结束后会忘记一切不同,DeerFlow 会构建用户偏好、上下文和知识的持久记忆。
数数科技的数据干货7 小时前
人工智能·ai·华为云·agent
ThinkingAI携手华为云,共建企业级AI Agent平台Agentic Engine企业级 AI Agent 的落地,需要稳定的算力底座、低时延的推理服务、以及持续演进的知识体系。ThinkingAI 与华为云达成深度合作,依托华为云 AI 算力与 MaaS 平台,联合共建企业级AI Agent 平台 Agentic Engine,让 Agent 能感知、能理解、能行动。
研究点啥好呢19 小时前
人工智能·ai·金融·开源·github·hermes
FinceptTerminal:开源金融分析平台的民主化革命在金融分析领域,专业工具长期以来被少数几家巨头垄断,Bloomberg Terminal每年2.4万美元的费用让大多数个人投资者和小型机构望而却步。然而,这一格局正在被一个开源项目彻底改变——FinceptTerminal。这个由Fincept Corporation开发的开源金融分析平台,正以其强大的功能和完全免费的特性,重新定义金融分析工具的边界。
fanly117 小时前
微服务·ai·surging
surging 的Agent插件研发全流程:从定义到落地上一篇文章谈到要做AI赋能智能化微服务引擎,而在这块设计不单单为了用在微服务框架,而是要做成AI行业解决方案Agent 插件生态,而在大模型Agent生态中,插件是连接AI能力与外部工具的核心桥梁。通过标准化的插件开发,开发者可以快速扩展Agent的功能边界,实现从“文本交互”到“实际行动”的跨越。本文将结合示例代码,详细解析Agent插件的研发逻辑与实践路径。
不停喝水7 小时前
前端·人工智能·后端·ai·ai编程·cursor
【AI+Cursor】 告别切图仔,拥抱Vibe Coding: AI + Cursor 开启多模态全栈新纪元 (1)从"敲代码"到"描述需求",AI时代的开发范式正在重构在软件开发的传统叙事中,一个产品从想法到上线,往往要经历漫长的跋涉:产品经理撰写需求文档,设计师在Figma或MasterGo中绘制高保真原型,前端工程师将设计图"翻译"为代码,后端工程师搭建复杂的微服务架构。
阿菜ACai9 小时前
ai
Kimi 新模型发布!教你如何在 Claude Code 上配置并使用最新的 k2.6 模型!Kimi k2.6 是月之暗面推出的新一代代码大模型,在代码生成、Agent 能力和长上下文理解上都有显著提升。虽然 Kimi 订阅计划支持在 Claude Code 上进行配置使用,但此前 Kimi k2.5 在 Claude Code 中接入的配置方式已失效。无论你是想寻找 Claude 的平价替代,还是 Kimi + Claude Code 的使用者,都可以通过本篇文章了解到如何在 Claude Code 上配置与使用 Kimi k2.6 模型。
GHL28427109012 小时前
学习·ai
Agent相关问题整理学习1、什么是MCP?和Function call区别是什么?Function call:是点对点的私有接口适配,让大模型调用本地的工具函数。 MCP:是一个通用协议,开发一次,能被多个模型客户端调用。
小糖学代码12 小时前
人工智能·python·算法·机器学习·ai·数据挖掘·最小二乘法
LLM系列:2.pytorch入门:3.基本优化思想与最小二乘法在正式开始进行神经网络建模之前,必须掌握机器学习中最核心的数学工具和思想:最优化方法。PyTorch的核心优势之一也就是提供了AutoGrad(自动微分)模块来辅助最优化计算。
J_bean12 小时前
人工智能·ai·llm·大语言模型·token
大语言模型 API Token 消耗深度剖析在调用大语言模型(LLM)API 时,Token 统计不仅是计费的唯一依据,更是评估模型推理深度、响应延迟及上下文窗口管理的关键指标。本文旨在通过源码解析,帮助开发者彻底理解 Token 的消耗逻辑。
维元码簿13 小时前
ai·agent·claude code·ai coding
Claude Code 深度拆解:上下文里有什么——工具能力声明Hi,大家好,欢迎来到维元码簿。本文属于 《Claude Code 源码 Deep Dive》 系列,专注于上下文工程中的 Tools 板块——模型怎么知道"我能用什么工具"。如果你想了解整个系列,可以先看系列开篇 | Claude Code 源码架构概览:51万行代码的模块地图。
j_xxx404_14 小时前
人工智能·ai·prompt
【AI大模型入门(二)】提示词工程进阶上篇文章:大语言模型 (LLM) 零基础入门:核心原理、训练机制与能力全解目录1.为什么提示词如此重要?
张忠琳14 小时前
ai·架构·vllm
【vllm】(二)vLLM v1 Engine — 模块超深度逐行分析之二本文档对 vllm/v1/engine/ 子目录中的输入处理、输出处理、反分词器、Logprobs计算、并行采样及类型定义等六大模块进行逐行级深度剖析。
易生一世14 小时前
windows·ai·kiro
Kiro CLI的Windows安装及认证从Kiro官网上,可以下载适合Windows系统的MSI文件。以Windows系统管理员的身份执行MSI文件。
gao_tjie16 小时前
ai
鱼音频生成 API 集成指南在这篇文章中,我们将介绍如何集成鱼音频生成 API,该 API 能够通过输入提示词来克隆您的声音。这项技术的应用场景包括语音合成、自动化语音助手、以及任何需要个性化语音输出的应用。
前端摸鱼匠16 小时前
人工智能·ai·面试·大模型·求职招聘
【AI大模型春招面试题25】掩码自注意力(Masked Self-Attention)与普通自注意力的区别?适用场景?你好!咱们就不整那些虚头巴脑的教科书定义了。既然你问到了**掩码自注意力(Masked Self-Attention)与普通自注意力(Standard Self-Attention)**的区别,这不仅是Transformer架构的基石,更是大模型面试中考察“你对生成式原理理解深度”的必考题。
张忠琳17 小时前
ai·架构·vllm
【vllm】(四)vLLM v1 Worker — 模块超深度逐行分析之三源文件:gpu_input_batch.py,1085 行InputBatch 是 GPU 推理批次的持久化状态容器,它维护了一个虚拟连续数组——逻辑上紧凑,物理上可能因请求增删而存在空洞(通过 condense() 消除)。
CoderJia程序员甲17 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-21)生成于:2026-04-21共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
2501_9481142417 小时前
大数据·人工智能·ai·架构
星链4SAPI中转枢纽深度技术解构:架构优势、工程实践与演进脉络在当下的技术圈层中,围绕大模型接口调用、API密钥管理与中转网关的讨论热度居高不下。几乎每隔一段时间,就会有关于“黑盒优化”或“算力调度霸权”的新观点浮现。这背后的技术实体——星链4SAPI所代表的模型接口聚合层,正成为开发者工具链中一个无法绕开的节点。
其实防守也摸鱼18 小时前
人工智能·安全·ai·大模型·软件工程·本地大模型
部署本地AI大模型--ollma下载链接:1.官网:在Windows上下载《Ollama2.github:Release v0.21.0 · ollama/ollama
张忠琳18 小时前
ai·架构·vllm
【vllm】(三)vLLM v1 Core — 模块超深度逐行分析之二逐行解释:_select_waiting_queue_for_scheduling 逻辑(行1576-1586):