大模型

KG_LLM图谱增强大模型9 小时前
人工智能·大模型·知识图谱·向量存储·多模态
[谷歌最新白皮书]嵌入与向量存储:打开AI多模态数据处理的钥匙本文深入探讨嵌入技术与向量数据库在现代机器学习中的核心作用。嵌入将文本、图像、音频等异构数据转换为统一的向量表示,实现高效的语义搜索和检索。文章详细介绍了嵌入的原理、类型、向量搜索技术及实际应用场景,特别强调了在检索增强生成(RAG)等前沿应用中的价值。
人工智能培训14 小时前
人工智能·深度学习·神经网络·大模型·dnn·具身智能·智能体
DNN案例一步步构建深层神经网络(3)
模型启动机20 小时前
人工智能·ai·大模型·ocr
告别OCR与分块!ICLR 2025 ColPali实现视觉文档检索精度&速度双碾压来自Illuin Technology、巴黎中央理工-高等电力学院、苏黎世联邦理工学院等机构的团队,在2025年ICLR会议上提出了颠覆性解决方案——ColPali模型与ViDoRe基准测试,直接通过文档图像生成嵌入向量,完美融合文本与视觉信息,彻底简化检索流程并实现性能飞跃。
人工智能培训21 小时前
人工智能·深度学习·神经网络·大模型·dnn·ai大模型·具身智能
国内外知名大模型及应用近年来,随着人工智能技术的迅猛发展,大模型(Large Models)已成为推动科技进步的重要引擎。大模型通常指参数量巨大、训练数据广泛、具备强大泛化能力的深度学习模型,尤其在自然语言处理(NLP)、计算机视觉和多模态任务中表现突出。国内外科技企业与研究机构纷纷投入资源研发大模型,推动其在多个领域的实际应用。本文将系统梳理国内外知名的大模型及其典型应用场景。
CoderJia程序员甲21 小时前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-22)生成于:2025-12-22共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI与安全技术深度融合成为主导趋势,分布式AI集群项目exo让开发者能用日常设备构建私有AI基础设施,PentestGPT和PayloadsAllTheThings凸显AI赋能网络安全实战的迫切需求。同时模型优化工具unsloth和ComfyUI-GGUF推动大模型高效部署,而crawl4ai和SurfSense则展现LLM与多源数据整合的能力,这些项目共同指向AI技术正朝着实用化、平民化和高性能方向发展,为开发者
bylander1 天前
论文阅读·图像处理·大模型
【论文阅读】VTP:Towards Scalable Pre-training of Visual Tokenizers for Generationhttps://arxiv.org/html/2512.13687v1阅读了MiniMax的这个论文,眼前一亮。
骚戴1 天前
人工智能·语言模型·自然语言处理·大模型·llm·api
在科研与项目开发中:如何高效调用大语言模型(LLM)API2023年被誉为生成式AI的元年,而2024年则是大模型应用落地的爆发期。无论是学术界的科研工作者,还是工业界的项目开发者,大家的起跑线似乎都是一样的:一行简单的 import openai,接着是 client.chat.completions.create(...),短短几行代码,从屏幕上跃出的文字仿佛魔法一般,宣告着智能时代的到来。
CoderJia程序员甲1 天前
开源·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-21)生成于:2025-12-21共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI应用开发与安全正加速融合,技术热点集中在两大方向。一方面,AI代理与多智能体协作工具(如DeepAudit、NeMo-Agent-Toolkit)强势崛起,通过一键部署和自动化流程显著降低了安全审计与漏洞挖掘的门槛。另一方面,AI基础设施工具呈现高效化趋势,exo项目让家庭设备组建AI集群成为可能,而flash-linear-attention和ty等项目聚焦底层算力和开发效率优化。同时,PayloadsAll
喜欢吃豆1 天前
学习·语言模型·架构·开源·大模型·多模态
我把 LLM 技术栈做成了一张“可复用的认知地图”:notes-on-llms 开源仓库介绍📚 项目推荐:notes-on-llms 我在系统整理大语言模型(LLM)相关知识的过程中,长期维护了一个公开文档仓库 notes-on-llms。 这个项目不是零散的论文笔记或 Prompt 技巧合集,而是从 模型原理 → 训练范式 → 推理优化 → Agent 架构 → 安全与对齐 → 多模态,系统性拆解 LLM 技术栈,构建一份 结构化的认知地图。 如果你已经接触过 LLM,希望从“会用模型”进阶到“理解模型系统”,这个仓库会更有参考价值。 🔗 项目地址: https://likebeans.g
北邮刘老师1 天前
网络·人工智能·大模型·智能体·智能体互联网
【智能体互联协议解析】需要“智能体名字系统”(ANS)吗?在上一篇,介绍智能体身份码的文章中,我们一起了解了智能体身份码的格式和示例:1.2.156.****.1.34C2.478BDF.3GF547.1
北邮刘老师2 天前
网络·人工智能·大模型·智能体·智能体互联网
【智能体互联协议解析】身份码-智能体的身份证号智能体的身份码,是AIP标准系列中,可以说是除了体系架构外,大家最为关注的一个点。今天就对身份码,智能体的身份证号,做一个解析和分享。
万俟淋曦2 天前
人工智能·深度学习·ai·机器人·大模型·论文·具身智能
【论文速递】2025年第40周(Sep-28-Oct-04)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准标题: The Dragon Hatchling: The Missing Link between the Transformer and Models of the Brain
万俟淋曦2 天前
人工智能·深度学习·机器学习·机器人·大模型·论文·具身智能
【论文速递】2025年第38周(Sep-14-20)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准The field of 4D world modeling - aiming to jointly capture spatial geometry and temporal dynamics - has witnessed remarkable progress in recent years, driven by advances in large-scale generative models and multimodal learn
北邮刘老师2 天前
网络·人工智能·大模型·智能体·智能体互联网
智能体,超越人类与机器的世界“理解者”【注:本文来自于与医学专家罗哲教授的对话整理而成,探讨智能体解决医疗AI中最难的关键问题:如何结合文字与数据,理解医生与病人的世界。】
万俟淋曦2 天前
人工智能·ai·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第37周(Sep-07-13)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准Post-training language models (LMs) with reinforcement learning (RL) can enhance their complex reasoning capabilities without supervised fine-tuning, as demonstrated by DeepSeek-R1-Zero. However, effectively utilizing RL fo
七夜zippoe2 天前
架构·大模型·oom·轻量·语义感
轻量级大模型在RAG系统中的集成方案目录摘要一、技术原理1.1 架构设计理念解析1.2 核心算法实现1.2.1 语义感知异构图索引1.2.2 轻量级拓扑增强检索
万俟淋曦2 天前
人工智能·ai·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第42周(Oct-12-18)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准We propose QeRL, a Quantization-enhanced Reinforcement Learning framework for large language models (LLMs). While RL is essential for LLMs’ reasoning capabilities, it is resource-intensive, requiring substantial GPU memory
北邮刘老师2 天前
数据库·人工智能·架构·大模型·智能体·智能体互联网
马斯克的梦想与棋盘:空天地一体的智能体互联网【摘要】本文首次大胆推测马斯克从StarShip(星舰)到StarLink(星链)再到StarNet(星网-星上智能体互联网)的逻辑和商业闭环。
七夜zippoe2 天前
架构·langchain·大模型·kv·轻量
使用OpenLLM管理轻量级大模型服务目录摘要一、技术原理1.1 架构设计理念解析1.2 核心算法实现1.2.1 动态批处理优化1.2.2 量化压缩算法
万俟淋曦2 天前
人工智能·深度学习·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第41周(Oct-05-11)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准Hierarchical Reasoning Model (HRM) is a novel approach using two small neural networks recursing at different frequencies. This biologically inspired method beats Large Language models (LLMs) on hard puzzle tasks such as Su