大模型

davidson147124 分钟前
vscode·ai·大模型·claude
VSCode配置Claude Code点击设置点击在settings.json中编辑添加以下内容 记得修改成你的api key
山林竹笋1 小时前
人工智能·大模型·ai编程
大模型汇总(国外)
Okailon14 小时前
大模型·open webui·ai 客户端
Open WebUI 文档这是一个官方的、结构化的、用于指导用户从零开始使用 Open WebUI 的综合性在线文档中心 (Comprehensive Online Documentation)1。
Byron070719 小时前
大模型·智能体·claude code
从零开发Claude Code插件(Plugin)完整指南Claude Code插件是扩展其功能的核心方式,可封装可复用的技能(Skills)、智能体(Agents)、命令(Commands)等资源,实现跨项目、跨团队的功能共享,适用于标准化工作流程落地、团队协作效率提升等场景。本文结合成熟插件参考案例,从零讲解Claude Code插件的开发、配置、测试与扩展,帮助开发者快速上手插件开发。
AI、少年郎19 小时前
人工智能·python·ai·大模型·微调·大模型训练·minimind
MiniMind 第 4 篇:《数据工程|Tokenizer 训练 + 预训练 / SFT/DPO 全数据集处理》承接上一篇内容:我们拆解了 MiniMind 底层核心架构,吃透了 RMSNorm、SwiGLU、RoPE 三大组件的工程实现与优化逻辑。现在,终于轮到 LLM 最关键的「粮草」—— 数据工程。
weitingfu20 小时前
人工智能·gpt·大模型·bert·mamba·上下文·实战指南
从 BERT 到 GPT 再到 Mamba:LLM 架构的“三国演义“别被那些花里胡哨的论文标题吓到——所谓大语言模型架构演进,本质上就是一群工程师在解决同一个问题:怎么让机器读懂人话,而且读得更快、更准、更省电。
@atweiwei1 天前
开发语言·人工智能·ai·rust·大模型·llm·agent
LangChainRust:用 Rust 构建高性能 LLM 应用的完整指南LangChainRust 是 LangChain 的 Rust 实现,提供了 Agents、Chains、Memory、Tools、RAG 等核心模块,让你用 Rust 构建高性能的 AI 应用。
AI视觉网奇1 天前
人工智能·大模型
探索 InternVL3.5:从权重解析到多模态推理的全栈实践笔记目录切换模型:旗舰级性能表现InternVL3.5-241B 使用笔记除了在线测试,该模型也以开源形式提供,你可以通过以下方式使用或部署:
xixixi777771 天前
人工智能·gpt·安全·机器学习·架构·大模型·通信
智算中心建设新范式:GPT-6/Rubin架构+1.6T光模块+量子安全网关+AI安全沙箱,算力·效率·安全·成本的最优平衡当AI训练进入十万卡集群时代,智算中心不再只是GPU的堆叠,而是一场从芯片、互连、安全到运行底座的系统性工程。
CoderJia程序员甲1 天前
ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-15)生成于:2026-04-15共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
来两个炸鸡腿1 天前
人工智能·大模型·智能体
【Datawhale2604】Hello-agents task01 智能体经典范式构建ReAct 本质是一个闭环控制系统。输出 Thought+ActionFinish 答案ToolName input
竹之却1 天前
人工智能·大模型·检索增强·faiss·rag
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第6天-大模型RAG检索增强生成实战技术标签:人工智能、大模型、RAG、检索增强、LangChain、向量数据库、FAISS大模型训练数据存在时间截止点,无法获取训练后新增的知识,回答易出现过时、错误、幻觉。
m0_488913011 天前
人工智能·学习·机器学习·大模型·产品经理·llama·uml
万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!在AI领域,大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Llama之后的第三代模型,Llama-3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型。
xixixi777772 天前
开发语言·网络·人工智能·ai·大模型·php·通信
AI自主挖洞 + 通信网络扩散:全域风险指数级放大,如何构建密码-沙箱-终端联动闭环?当AI学会自主挖掘0day漏洞,并通过通信网络秒级扩散,传统“补丁式”安全已彻底失效。我们需要一场从终端到云端的防御范式革命。
guslegend2 天前
人工智能·架构·大模型·rag
第10节:设计高效混合检索架构,提升召回精度RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Flying pigs~~2 天前
运维·人工智能·docker·容器·大模型·agent·rag
检索增强生成RAG项目tools_01:Docker 极简实战一份写给「只做开发、不做运维」的 AI 工程师的 Docker 学习笔记!总之就是一个字:好!!!Docker 拉取镜像时需要访问 Docker Hub(registry-1.docker.io),但国内网络访问不稳定,即使(●'◡'●)上网了,Docker Desktop 也不会自动使用系统代理。
前端摸鱼匠2 天前
人工智能·深度学习·面试·大模型·transformer·求职招聘
【AI大模型春招面试题21】什么是Transformer的“预归一化”与“后归一化”?两者的差异及影响?你好!咱们直接切入正题。这道题在现在的架构演进(尤其是从 BERT 到 LLaMA 系列)背景下,属于必考题。它不仅仅考察你对归一化层位置的记忆,更考察你对深层网络训练稳定性、梯度流以及现代大模型架构设计哲学的理解。
人道领域2 天前
大数据·人工智能·chatgpt·大模型
2026年3月大模型全景深度解析:国产登顶、百万上下文落地、Agent工业化,AI实用时代全面来临[特殊字符]🔥个人主页:北极的代码(欢迎来访) 🎬作者简介:java后端学习者 ❄️个人专栏:苍穹外卖日记,SSM框架深入,JavaWeb ✨命运的结局尽可永在,不屈的挑战却不可须臾或缺!
CoderJia程序员甲2 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-14)生成于:2026-04-14共发现热门项目: 16 个榜单类型:日榜Token赞助:siliconflow
kcuwu.2 天前
大模型·提示词工程
大模型提示词工程基础博客你是不是也有过这样的经历: 对着 ChatGPT 问 “帮我写个文案”,结果 AI 给你写了一篇干巴巴的官方宣传稿,完全不是你想要的小红书种草风格? 问 AI 一个数学题,结果它给了你一个错误的答案,你还得自己再算一遍?