大模型

AI周红伟1 小时前
大数据·人工智能·大模型·智能体
大模型部署入门教程,消费级显卡跑通Qwen3.5-Plus,最低配置部署教程,不能在简单了一、先理清:消费级显卡跑Qwen3.5-Plus的最低门槛 二、零报错软件环境搭建(一键复制脚本) 三、模型获取:选对量化版,显存直接省一半 四、核心部署代码:消费级显卡专属适配 五、本地推理实测:对话效果直接看 六、高频问题快速解决 七、进阶优化:vLLM加速+WebUI可视化 7.1 vLLM加速部署 7.2 Gradio可视化WebUI
雪碧聊技术4 小时前
大模型·文生图·即梦ai·seedance2.0
提示词书写技巧各位 CSDN 的开发者伙伴、AI 技术爱好者、AIGC 与数字人领域的同路人,大家好!今天,我正式带着SeeDance 2.0,扎根 CSDN 这个国内最具活力的开发者社区,和所有深耕技术、热爱创作的你,开启一段关于 AI 舞蹈生成技术的探索与共建之旅。
天使Di María4 小时前
人工智能·深度学习·机器学习·大模型·迁移学习·脑机接口·脑电解码
脑电大模型系列——第二弹:BrainBERTPaper: BrainBERT: Self-Supervised Representation Learning for Intracranial Recordings
想你依然心痛4 小时前
大模型·测评·atomgit
AtomGit首发模型深度评测:多模态能力与场景适配性实战分析所有看上去是天才的人,都少不了勤勉的练习。所有的惊艳,都来自长久的准备。所有看起来的幸运 ,都源自坚持不懈的努力。
文艺倾年19 小时前
人工智能·分布式·大模型
【强化学习&SWE】如何无容器化进行强化学习训练😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本专栏《人工智能》旨在记录最新的科研前沿,包括大模型、智能体、强化学习等相关领域,期待与你一同探索、学习、进步,一起卷起来叭! 🚩Paper:SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents 💭开源代码:https://github.com/lblankl/SWE-MiniSandbox 💻时间:2026
Flying pigs~~1 天前
算法·机器学习·大模型·knn·k近邻算法·大数据处理
机器学习之KNN算法
雪碧聊技术1 天前
大模型·tools工具
14.Tools工具的介绍和使用目录一.期望实现的效果二.准备工作1.创建预约表2.定义实体类3.编写Mapper、Service、Controller这三层代码
lhxcc_fly1 天前
langchain·大模型·llm·openai·deepseek
0.LangChain--大模型篇导言:本系列开始记录自己学习LangChain与LangGraph AI应用开发框架的知识点。本文是开始学习LangChain所要了解到的前置知识--大模型的有关内容。
硅基捕手维克托1 天前
大模型·知识蒸馏·模型蒸馏·上下文蒸馏·在策略蒸馏·微软研究院·大模型蒸馏
在策略上下文蒸馏:OPCD 把上下文知识直接焊进参数里 | 微软研究院论文链接:https://arxiv.org/abs/2602.12275 发布时间:2026.02.12 机构:微软研究院
IvanCodes1 天前
人工智能·大模型·llm
Gemini 3.1 Pro 正式发布:一次低调更新,还是谷歌的关键反击?今天凌晨,谷歌发布了新一代模型——Gemini 3.1 Pro没有大型发布会,没有提前预热,甚至连宣传节奏都显得克制。
sg_knight2 天前
网络·ai·大模型·llm·claude·code·claude-code
如何为 Claude Code 配置代理与网络环境如果你在安装或首次运行 Claude Code 时遇到:那么大概率不是软件问题,而是网络环境没有配置正确。
laplace01232 天前
人工智能·大模型·agent·claude·rag·skills·icepop
IcePop技术这里的 IcePop 指的是一种基于重要性采样的技术,用于解决强化学习(RL)训练中的分布不匹配问题。 虽然“IcePop”这个名字在深度学习主流教材中不如“LayerNorm”那样耳熟能详,但在大模型 RLHF(基于人类反馈的强化学习)的语境下,它通常指的是重要性权重裁剪的一种变体或特定实现策略。 以下是关于 IcePop 技术的详细解释:
山顶夕景2 天前
大模型·llm·强化学习·rl·agentic rl
【LLM】ROLL团队的Agentic RL训练坑点首先在 ROLL 中构建了一套环境管理器,并清晰地划分了三个核心组件之间的交互边界:ROLL(训练框架)、iFlow CLI(Agent 框架) 和 ROCK(沙箱管理器)。
马克Markorg2 天前
python·大模型·agent·rag·企业级知识库的框架·rag 知识库
基于LLM的大模型的RAG(检索增强生成)实现对比在 RAG(检索增强生成)知识库构建领域,LlamaIndex 被许多开发者和企业认为是“更适合”或“更专注”的选择之一,尤其在与 LangChain 等通用框架对比时。下面从多个维度解释 为什么有人说 LlamaIndex 更适合做 RAG 知识库:
CoderJia程序员甲2 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-18)生成于:2026-02-18共发现热门项目: 13 个榜单类型:日榜本期GitHub热榜显示AI应用开发持续火爆,重点聚焦于智能体框架与工具链的实用化突破。以Superpowers为代表的智能体技能框架和OpenClaw跨平台AI助手,凸显了可复现的智能体工程方法论正走向成熟。同时,向量数据库Zvec凭借轻量高性能特性解决AI应用数据检索痛点,而Heretic等项目则致力于突破大语言模型的内容安全限制。媒体管理工具Seerr和自动化交易系统Hummingbot体现了AI在垂直领域的深度渗透。开发者正通过C
CoderJia程序员甲2 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-20)生成于:2026-02-20共发现热门项目: 8 个榜单类型:日榜本期GitHub趋势显示AI技术应用正全面渗透开发工作流,其中Agentic技能框架superpowers与跨平台AI助手openclaw引领自动化开发新风潮。开发者积极整合AI工具,如claude-code-telegram实现远程编程辅助,open-mercato打造AI增强型企业框架。同时,机器学习系统教程cs249r_book与模型去审查工具heretic备受关注,反映社区对AI系统底层原理与定制化需求的深耕。值得关注的是,free
DevilSeagull3 天前
人工智能·程序人生·langchain·大模型·llm·vibe coding
LangChain & LangGraph 介绍近十年来,低代码/无代码平台与 AI 辅助编程工具持续渗透软件开发领域。如今,一种名为 Vibe Coding(氛围编程) 的新型实践迅速崛起,深刻挑战了人们对"程序员职责边界"的既有认知。
CoderJia程序员甲3 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-19)生成于:2026-02-19共发现热门项目: 11 个榜单类型:日榜本期GitHub热榜显示AI应用开发正从模型层面向工具链和工程化深度演进,技术热点集中在智能体(Agent)与增强检索生成(RAG)的实践。开源项目如超级技能框架Superpowers和多功能AI助手工具Composio提供了可复用的Agent构建范式,而RAG优化技术仓库则详细拆解了提升回答准确性的核心方法。同时,轻量级向量数据库zvec和终端AI助手qwen-code凸显了高效、低门槛的本地化部署趋势。这些项目以代码为核心,提供了从理
Tadas-Gao3 天前
人工智能·深度学习·架构·大模型·llm·软件工程
校准之弧与演进之轮:大模型时代的软件工程范式革命2026年的今天,软件系统的核心矛盾正在发生深刻转移。传统软件工程建立在一个基本假设之上:系统的行为是确定的,给定相同的输入,必然产生相同的输出。然而,大语言模型的引入彻底颠覆了这一假设——我们不再构建纯粹的逻辑系统,而是在与一个概率性的、涌现性的、黑箱化的智能体共舞。(扩展阅读:从CI/CD到CC/CD:AI应用不是“盖”出来的,是“种”出来的——解码大模型时代的软件工程范式革命)
m0_488913013 天前
人工智能·搜索引擎·云原生·eureka·开源·大模型·产品经理
新手小白也能学会的Dify本地部署教程(超详细)首先打开Docker官网,点击按钮,选择Windows版本的Docker安装包,点击下载。下载完成后,打开安装包,一路点击下一步即可,该过程中Docker会自动拉取所需的内容。完成后打开cmd(cmd打开方法请看图),输入docker,如果下方出现Docker的命令提示就代表安装成功了。