技术栈
大模型
xixixi77777
1 小时前
人工智能
·
深度学习
·
大模型
·
lstm
·
transformer
·
智能
·
前沿
对 两种不同AI范式——Transformer 和 LSTM 进行解剖和对比
这不仅仅是两个模型的比较,更是两种AI范式的对话。1. LSTM:门控的精密流动 LSTM像一个带有精密控制阀的水库系统,其核心在于 “门” 对信息流的调控:
和你一起去月球
2 小时前
大数据
·
ai
·
大模型
·
agent
·
agentic
Agent 应用开发与落地学习总结
AI Agent 和 Agentic AI 的区分:python 示例如下所示:LLM 会识别用户需求,调用get_weather工具,输出包含 “location: Paris, France” 参数的工具调用指令,示例如下:
三千世界006
2 小时前
人工智能
·
ai
·
大模型
·
agent
·
claude
·
原理
Claude Code Agent Skills 自动发现原理详解
Agent Skills 的自动发现采用声明式、基于提示的发现系统,通过语言模型推理来判断何时使用哪个技能,而非传统的算法匹配或规则引擎。
CoderJia程序员甲
2 小时前
开源
·
大模型
·
llm
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-1-15)
生成于:2026-1-15共发现热门项目: 8 个榜单类型:日榜本期GitHub热榜显示AI应用开发依然是核心焦点,技术热点集中在智能体评估、多模态数据处理和实用工具开发。τ²-Bench和Inspect AI提供了专业的大模型评估框架,而ART项目则推动智能体在真实任务中的强化学习实战。Buzz凭借离线的音频转录与翻译功能获得高关注,Chandra项目专注于复杂文档OCR,展现了多模态理解的工程需求。同时,MediaCrawler等数据爬虫工具和知识图谱生成器凸显了数据供给与结构化在AI链路中的关键作用
精致先生
3 小时前
大模型
·
ocr
OCR发票识别
在 Dify 中实现 OCR 发票识别时,一般有两种方式:核心是通过 “工作流(Workflow)” 串联 图像处理、OCR 文本识别、结构化信息提取 三个核心环节,输入图像 → OCR 转文本 → 大模型结构化 → 校验输出
huazi-J
3 小时前
人工智能
·
自然语言处理
·
大模型
·
llm
·
datawhale
Datawhale Happy-LLM 课程 task 1和2:NLP基础概念
此博客为Datawhale 组队学习打卡笔记[1] https://github.com/datawhalechina/happy-llm
清 澜
4 小时前
人工智能
·
面试
·
大模型
大模型扫盲式面试知识复习 (一)
在处理一个句子时,模型需要知道每个词与其他词的相关程度。例如,在“The cat sat on the mat”中,“sat”这个动作主要和谁相关?是“cat”还是“mat”?自注意力就是要量化这种内部依赖关系。
molaifeng
4 小时前
人工智能
·
ai
·
大模型
·
llm
·
go
·
token
Token:AI 时代的数字货币——从原理到计费全解
Go 系列博文的最近一口气写了十篇(王婆卖瓜下,全是干货)。这一次换个方向,紧跟技术趋势,聊一个几乎所有 AI 应用都绕不开、却经常被一笔带过的概念——Token。
精致先生
4 小时前
ai
·
大模型
·
milvus
Milvus向量数据库
/ˈmɪlvəs/百亿级,分布式,毫秒级检索,低延迟、高并发,支持百万维度;支持多模态(文本、图片、视频、音频)各种非结构化数据的向量存储,支持混合检索、多向量类型(稠密向量、稀疏向量);
KG_LLM图谱增强大模型
5 小时前
人工智能
·
大模型
·
知识图谱
知识图谱的演进:从静态到动态、时序与事件的全景综述
本文系统综述了知识图谱的演进历程,涵盖静态、动态、时序和事件知识图谱四大类型,深入探讨知识抽取与推理技术的发展脉络,并结合金融分析等实际应用案例,展望知识工程与大语言模型融合的未来方向。
iFlow_AI
5 小时前
前端
·
javascript
·
大模型
·
心流
·
iflow
·
iflowcli
使用iFlow CLI创建自定义Command:网页文章下载与翻译工具
作者:JAX作为技术人员,我经常需要阅读海外技术文章和文档。由于英文水平有限,通常需要通过浏览器插件进行翻译。同时,为了长期保存有价值的内容,需要将喜欢的文章收藏到本地。
精致先生
5 小时前
大模型
·
dify
Dify内网离线部署
1、dify-1.3.0源码、及 核心镜像包docker-compose.yaml配置文件中,查看需要的镜像,前几个必要、后几个按需加载
互联网开发者
16 小时前
ai
·
大模型
·
ai大模型
资深程序员白话干货AI工具技术
作为资深架构师,您对AI代码工具的深入对比和推荐是非常有价值的。以下是对市面上主流AI代码工具的简要分析与使用场景建议,供您在博客中参考:
core512
1 天前
大模型
·
白盒蒸馏
【深度硬核】大模型白盒蒸馏:原理、架构与实战详解
摘要:在LLM(大语言模型)“参数爆炸”的今天,如何让小模型拥有大模型的智慧?**知识蒸馏(Knowledge Distillation, KD)**是关键技术之一。不同于仅利用API返回结果的“黑盒蒸馏”,白盒蒸馏通过利用大模型的完整内部状态(Logits、Hidden States、Attention Maps),能更高效、更精准地完成知识迁移。本文将带你深入白盒蒸馏的内部世界。
xixixi77777
1 天前
人工智能
·
ai
·
大模型
·
agi
·
通用人工智能
·
asi
AGI-Next前沿峰会——对于唐杰教授提到的AI下一步方向的“两条思路一次取舍”的思考(思路分析+通俗易懂解释)
思考来源原句——唐杰教授:“当时摆在我们面前的,主要有两条思路:一条是围绕Thinking能力,结合Coding与Agent;
七牛云行业应用
2 天前
python
·
系统架构
·
大模型
·
aigc
·
deepseek
重构实录:我删了 5 家大模型 SDK,只留了 OpenAI 标准库
今天是 2026 年 1 月 12 日。如果你正在维护一个接入了 AI 能力的 Python 后端项目,我猜你的 requirements.txt 可能已经肿得看不下去了。为了同时兼容 DeepSeek V3 的高性价比和 GPT-5 的逻辑能力,你是不是引入了五六个厂家的 SDK?一旦某个接口出现 502 报错,整个服务就得挂。
CoderJia程序员甲
2 天前
人工智能
·
ai
·
大模型
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-1-13)
生成于:2026-1-13共发现热门项目: 12 个榜单类型:日榜本期热榜揭示了一个显著的技术趋势,即基于Rust的高性能全栈与跨端UI开发正成为业界新宠。以Dioxus项目为代表,它利用Rust的内存安全与卓越性能,旨在统一Web、桌面和移动端的开发体验,直接对标传统JavaScript技术栈。这不仅反映出开发者对突破Electron等框架性能瓶颈的迫切需求,更预示着Rust正从底层系统编程向更广阔的应用层快速渗透,为构建下一代高性能、高安全性的应用程序提供了极具潜力的解决方案。
laplace0123
2 天前
架构
·
大模型
·
llm
·
agent
·
rag
claude code架构猜测总结
Claude Code 本质 =「LLM 驱动的 Tool-Calling 循环」+「逐层外置的认知结构」 模型是 Agent,本体代码只负责:约束、反馈、隔离、注入知识。
xueyongfu
2 天前
大模型
·
dpo
·
偏好学习
·
offline rlhf
Offline RLHF-DPO/KTO/ORPO/SPO等偏好学习方法
Offline RLHF 以 DPO 为代表,进一步发展出一系列 xPO 方法。相关工作在目标设计上做了多种改动:例如移除目标函数中的 reference 约束、引入长度惩罚项、或显式利用偏好数据中的偏好强度信息等。近期研究更多聚焦于在高噪声偏好数据下提升训练稳健性,以缓解分布漂移带来的性能退化;同时,也有工作开始系统分析 xPO 方法的退化现象,并通过对 logits/策略更新施加约束来稳定优化过程。
KG_LLM图谱增强大模型
2 天前
人工智能
·
大模型
·
知识图谱
知识图谱+大模型“驱动的生物制药企业下一代主数据管理:Neo4j知识图谱与GraphRAG及GenAI的深度整合
制药行业主数据管理(MDM)面临数据复杂性和关系互联的挑战。本文探讨将Neo4j知识图谱与GraphRAG和生成AI整合的创新框架,提升数据准确性、一致性和可访问性。通过图谱数据库捕捉药物、患者和临床试验间的复杂关系,结合向量嵌入和检索增强生成,实现精准查询和模式发现。实验显示,该方法显著优于传统关系数据库,推动制药决策智能化。