大模型

CoderJia程序员甲1 小时前
开源·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-21)生成于:2025-12-21共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI应用开发与安全正加速融合,技术热点集中在两大方向。一方面,AI代理与多智能体协作工具(如DeepAudit、NeMo-Agent-Toolkit)强势崛起,通过一键部署和自动化流程显著降低了安全审计与漏洞挖掘的门槛。另一方面,AI基础设施工具呈现高效化趋势,exo项目让家庭设备组建AI集群成为可能,而flash-linear-attention和ty等项目聚焦底层算力和开发效率优化。同时,PayloadsAll
喜欢吃豆3 小时前
学习·语言模型·架构·开源·大模型·多模态
我把 LLM 技术栈做成了一张“可复用的认知地图”:notes-on-llms 开源仓库介绍📚 项目推荐:notes-on-llms 我在系统整理大语言模型(LLM)相关知识的过程中,长期维护了一个公开文档仓库 notes-on-llms。 这个项目不是零散的论文笔记或 Prompt 技巧合集,而是从 模型原理 → 训练范式 → 推理优化 → Agent 架构 → 安全与对齐 → 多模态,系统性拆解 LLM 技术栈,构建一份 结构化的认知地图。 如果你已经接触过 LLM,希望从“会用模型”进阶到“理解模型系统”,这个仓库会更有参考价值。 🔗 项目地址: https://likebeans.g
北邮刘老师4 小时前
网络·人工智能·大模型·智能体·智能体互联网
【智能体互联协议解析】需要“智能体名字系统”(ANS)吗?在上一篇,介绍智能体身份码的文章中,我们一起了解了智能体身份码的格式和示例:1.2.156.****.1.34C2.478BDF.3GF547.1
北邮刘老师6 小时前
网络·人工智能·大模型·智能体·智能体互联网
【智能体互联协议解析】身份码-智能体的身份证号智能体的身份码,是AIP标准系列中,可以说是除了体系架构外,大家最为关注的一个点。今天就对身份码,智能体的身份证号,做一个解析和分享。
万俟淋曦7 小时前
人工智能·深度学习·ai·机器人·大模型·论文·具身智能
【论文速递】2025年第40周(Sep-28-Oct-04)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准标题: The Dragon Hatchling: The Missing Link between the Transformer and Models of the Brain
万俟淋曦8 小时前
人工智能·深度学习·机器学习·机器人·大模型·论文·具身智能
【论文速递】2025年第38周(Sep-14-20)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准The field of 4D world modeling - aiming to jointly capture spatial geometry and temporal dynamics - has witnessed remarkable progress in recent years, driven by advances in large-scale generative models and multimodal learn
北邮刘老师10 小时前
网络·人工智能·大模型·智能体·智能体互联网
智能体,超越人类与机器的世界“理解者”【注:本文来自于与医学专家罗哲教授的对话整理而成,探讨智能体解决医疗AI中最难的关键问题:如何结合文字与数据,理解医生与病人的世界。】
万俟淋曦11 小时前
人工智能·ai·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第37周(Sep-07-13)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准Post-training language models (LMs) with reinforcement learning (RL) can enhance their complex reasoning capabilities without supervised fine-tuning, as demonstrated by DeepSeek-R1-Zero. However, effectively utilizing RL fo
七夜zippoe11 小时前
架构·大模型·oom·轻量·语义感
轻量级大模型在RAG系统中的集成方案目录摘要一、技术原理1.1 架构设计理念解析1.2 核心算法实现1.2.1 语义感知异构图索引1.2.2 轻量级拓扑增强检索
万俟淋曦11 小时前
人工智能·ai·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第42周(Oct-12-18)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准We propose QeRL, a Quantization-enhanced Reinforcement Learning framework for large language models (LLMs). While RL is essential for LLMs’ reasoning capabilities, it is resource-intensive, requiring substantial GPU memory
北邮刘老师12 小时前
数据库·人工智能·架构·大模型·智能体·智能体互联网
马斯克的梦想与棋盘:空天地一体的智能体互联网【摘要】本文首次大胆推测马斯克从StarShip(星舰)到StarLink(星链)再到StarNet(星网-星上智能体互联网)的逻辑和商业闭环。
七夜zippoe12 小时前
架构·langchain·大模型·kv·轻量
使用OpenLLM管理轻量级大模型服务目录摘要一、技术原理1.1 架构设计理念解析1.2 核心算法实现1.2.1 动态批处理优化1.2.2 量化压缩算法
万俟淋曦13 小时前
人工智能·深度学习·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第41周(Oct-05-11)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准Hierarchical Reasoning Model (HRM) is a novel approach using two small neural networks recursing at different frequencies. This biologically inspired method beats Large Language models (LLMs) on hard puzzle tasks such as Su
fanruitian13 小时前
大模型·qwen·ollama
windows安装离线大模型 ollama qwen傻瓜似的https://ollama.com/download下载安装笔记本显卡泰莱,跑大模型太费劲
喜欢吃豆14 小时前
人工智能·语言模型·自然语言处理·大模型
大语言模型(LLM)全栈技术深度综述:理论、系统与工程实践📚 项目推荐:notes-on-llms 我在系统整理大语言模型(LLM)相关知识的过程中,长期维护了一个公开文档仓库 notes-on-llms。 这个项目不是零散的论文笔记或 Prompt 技巧合集,而是从 模型原理 → 训练范式 → 推理优化 → Agent 架构 → 安全与对齐 → 多模态,系统性拆解 LLM 技术栈,构建一份 结构化的认知地图。 如果你已经接触过 LLM,希望从“会用模型”进阶到“理解模型系统”,这个仓库会更有参考价值。 🔗 项目地址: https://likebeans.g
程序猿追15 小时前
python·大模型·华为云
体验LongCat-Image-Edit图像编辑模型:在昇腾NPU上的部署与推理全流程分享作为一名对AI图像生成与编辑充满热情的开发者,我最近深度体验了美团最新开源的 LongCat-Image-Edit 模型。这款模型在图像编辑任务中展现出令人印象深刻的性能,尤其是在指令遵循精度和视觉一致性保持方面。
万俟淋曦15 小时前
人工智能·深度学习·机器学习·机器人·大模型·论文·具身智能
【论文速递】2025年第39周(Sep-21-27)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准标题: Qwen3-Omni Technical Report
Mr.朱鹏1 天前
java·python·学习·微服务·langchain·大模型·llm
大模型入门学习路径(Java开发者版)下《动手学深度学习》(李沐)吴恩达《ChatGPT Prompt Engineering for Developers》
Mr.朱鹏1 天前
java·开发语言·spring boot·spring·大模型·llm·transformer
大模型入门学习路径(Java开发者版)上学习资源:1. Zero-Shot提示2. Few-Shot提示3. Chain-of-Thought(思维链)
vv_5011 天前
人工智能·学习·langchain·大模型
大模型 langchain-组件学习(中)Memory组件是LangChain中用于管理和维护对话或交互历史的核心模块,它使 LLM 能够记住之前的交互信息,实现上下文感知的对话