大模型

CoderJia程序员甲12 分钟前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-11-29)生成于:2025-11-29共发现热门项目: 17 个榜单类型:日榜本期GitHub热榜显示Python生态持续引领AI应用创新。AI Agent开发成核心焦点,Google和火山引擎开源了ADK与VERL等强大工具链,显著降低了开发门槛。轻量化RAG技术取得突破,LightRAG和Memori等项目通过优化检索与记忆机制,大幅提升了AI响应效率。实战工具需求旺盛,舆情监控系统TrendRadar和智能客服方案call-center-ai展示了AI与传统行业的深度融合。开发者工具层面,Cursor破解方案
七夜zippoe10 小时前
性能优化·大模型·模型量化·ollama
使用Ollama在消费级硬件上运行大模型:从环境配置到企业级实战目录摘要1 技术原理与架构设计1.1 Ollama架构设计理念1.2 核心算法实现1.3 性能特性分析
模型启动机9 小时前
人工智能·ai·langchain·大模型·agentic ai
Langchain正式宣布,Deep Agents全面支持Skills,通用AI代理的新范式?Skills系统的引入,标志着AI代理从"工具集合"向"能力系统"的转变。这种转变不仅提高了效率,还为代理的持续学习和能力扩展打开了新的可能性。
nju_spy1 天前
人工智能·大模型·大模型推理·tot思维树·react推理行动·人工智能决策·ai推理引擎
ToT与ReAct:突破大模型推理能力瓶颈大模型知识渊博,却时常“有知识,欠智慧”。传统的推理方式如同单线程的直线,限制了其解决复杂问题的潜力。
KG_LLM图谱增强大模型1 天前
人工智能·大模型·知识图谱·智能体·知识图谱增强大模型·agenticai
[500页电子书]构建自主AI Agent系统的蓝图:谷歌重磅发布智能体设计模式指南谷歌资深工程师Antonio Gulli发布近500页技术指南,详述21种代理设计模式,帮助构建自主AI系统。涵盖从提示链到多代理协作的实用框架,适用于企业环境。已成亚马逊概率统计类新书榜首。
WWZZ20251 天前
深度学习·算法·目标检测·计算机视觉·机器人·大模型·具身智能
快速上手大模型:深度学习12(目标检测、语义分割、序列模型)目录1 目标检测1.1 边界框(Bounding box)1.2 代码1.3 常用算法1.3.1 R-CNN
世优科技虚拟人1 天前
人工智能·大模型·数字人·智慧展厅·展厅设计
2026数字展厅设计核心关键,AI数字人交互大屏加速智慧展厅升级改造随着数字经济规模持续扩大,展厅设计已从传统静态展示迈入“内容+技术+运营”一体化的智能新阶段。据行业数据显示,2025年中国展览展示系统市场规模将突破2600亿元,年复合增长率保持在20%左右。2026年,智慧展厅设计将逐步向“智能化、交互化、场景化”方向升级,成为连接用户、数据与商业价值的智能交互中枢。
喜欢吃豆2 天前
网络·人工智能·自然语言处理·大模型
使用 OpenAI Responses API 构建生产级应用的终极指南—— 状态、流式、异步与文件处理本文是一份面向开发者的全面技术指南,介绍如何使用 OpenAI Responses API 构建下一代 有状态、可观测、异步、具备文件处理能力的智能体级应用。 重点涵盖四大核心支柱:状态管理、流式传输、异步执行与文件处理。
楚国的小隐士3 天前
ai·大模型·通义千问·智谱清言
Qwen是“源神”?实际上GLM-4.6才是被低估的黑马在AI科技圈,Qwen因其开源模型数量位居世界第一、模型涵盖各种大小、开销低而表现不俗,被称为“源神(开源界的神)”。这也导致有些人在体验之后,觉得Qwen写的代码质量是国内第一,仅次于Claude、chatGPT、Gemini、grok这些国外大模型之后。但GLM却像是被遗忘了一样,网上对它知之甚少,唯一比较出名的就是编程套餐每个月20块钱,还被骂奸商。但殊不知,GLM-4.6却是一匹被低估的黑马,甚至不输外国模型。我今天就来试一试。
程序员鱼皮3 天前
前端·后端·ai·程序员·大模型·编程
又被 Cursor 烧了 1 万块,我麻了。。。大家好,我是程序员鱼皮。这段时间国外的大模型真是火到不行,像新出的 Gemini 3.0 和 Claude Opus 4.5,天天最强、天天炸裂,搞的我已经有些麻了。。。
north_eagle4 天前
大模型·prompt·rag
RAG 同 Prompt Engineering在生成式 AI 应用的开发中,Prompt Engineering 和 RAG 经常被相提并论。Prompt Engineering 关注的是**“如何提问”**,侧重于挖掘模型的推理能力和规范输出格式。
KG_LLM图谱增强大模型4 天前
人工智能·大模型·知识图谱·graphrag·本体论·图谱增强大模型
[经典之作]大语言模型与知识图谱的融合:通往智能未来的路线图本文提出了融合大语言模型(LLMs)与知识图谱(KGs)的前瞻性路线图,涵盖三大框架:KG增强的LLMs、LLM增强的KGs,以及协同LLMs+KGs。通过系统综述现有研究并指出未来方向,为两种互补技术的统一提供了全面指导。
九年义务漏网鲨鱼5 天前
深度学习·学习·大模型·智能体
【大模型学习】现代大模型架构(二):旋转位置编码和SwiGLU🧔 这里是九年义务漏网鲨鱼,研究生在读,主要研究方向是人脸伪造检测,长期致力于研究多模态大模型技术;国家奖学金获得者,国家级大创项目一项,发明专利一篇,多篇论文在投,蓝桥杯国家级奖项、妈妈杯一等奖。 ✍ 博客主要内容为大模型技术的学习以及相关面经,本人已得到B站、百度、唯品会等多段多模态大模型的实习offer,为了能够紧跟前沿知识,决定写一个“从零学习 RL”主题的专栏。这个专栏将记录我个人的主观学习过程,因此会存在错误,若有出错,欢迎大家在评论区帮助我指出。除此之外,博客内容也会分享一些我在本科期间的
GPUStack5 天前
大模型·vllm·ai网关·sglang·高性能推理
GPUStack v2:推理加速释放算力潜能,开源重塑大模型推理下半场关注🌟⌈GPUStack⌋ 💻 一起学习 AI、GPU 管理与大模型相关技术实践。2025 年是大模型推理技术发展的关键之年。自年初 DeepSeek R1 发布引发全民关注以来,推理框架加速需求暴涨,推理优化的战场骤然升温。以 vLLM、SGLang、MindIE 为代表的高性能推理引擎,以及 FlashInfer、FlashAttention、ATB 等底层加速库不断突破性能瓶颈,相比年初,部分前沿框架的推理性能提升已达 3 到 4 倍以上。
WWZZ20255 天前
人工智能·深度学习·算法·语言模型·自然语言处理·大模型·具身智能
快速上手大模型:深度学习13(文本预处理、语言模型、RNN、GRU、LSTM、seq2seq)目录1 文本预处理1.1 库1.2 读取数据集1.3 词元化1.4 词表2 语言模型2.1 定义2.2 代码
core5125 天前
sql·mysql·ai·大模型·qwen·text2sql
不借助框架实现Text2SQL相关阅读: Vanna实现Text2SQL:https://core815.blog.csdn.net/article/details/155195612 LangChain实现Text2SQL:https://core815.blog.csdn.net/article/details/155105220
有点不太正常5 天前
论文阅读·大模型·agent安全
《ShadowCoT: Cognitive Hijacking for Stealthy Reasoning Backdoors in LLMs》——论文阅读CoT通过生成逐步推理过程,大幅提升了 LLMs的准确性和可解释性,但推理链的拉长也暴露了新的攻击面 —— 中间推理步骤本身可能成为恶意操纵的载体。传统后门攻击多针对输入输出的 “表面层”(如注入触发词、篡改输出 tokens),而基于CoT的攻击需深入模型内部推理轨迹,现有方法缺乏对推理动态过程的直接干预,且易被检测。
爬点儿啥5 天前
人工智能·ai·langchain·大模型·agent·langgraph
[Ai Agent] 09 LangGraph 进阶:构建可控、可协作的多智能体系统博客配套代码发布于github:09 LangGraph 进阶相关Agent专栏:Ai Agent教学
WWZZ20256 天前
人工智能·深度学习·算法·目标检测·计算机视觉·大模型·具身智能
快速上手大模型:深度学习11(数据增强、微调、目标检测)目录1 数据增强(Data Augmentation)1.1 概念1.2 增强方法1.2.1 翻转1.2.2 切割
许泽宇的技术分享7 天前
人工智能·开源·大模型
从零到一,开源大模型的“民主化“之路:一份让AI触手可及的实战宝典"当技术的门槛被拆除,每个人都能成为AI时代的创造者"还记得2023年初ChatGPT横空出世时的震撼吗?那时候,大模型还是科技巨头的专属玩具,普通开发者只能望洋兴叹。但短短两年过去,开源大模型的浪潮已经彻底改变了游戏规则。