技术栈
大模型
davidson1471
24 分钟前
vscode
·
ai
·
大模型
·
claude
VSCode配置Claude Code
点击设置点击在settings.json中编辑添加以下内容 记得修改成你的api key
山林竹笋
1 小时前
人工智能
·
大模型
·
ai编程
大模型汇总(国外)
Okailon
14 小时前
大模型
·
open webui
·
ai 客户端
Open WebUI 文档
这是一个官方的、结构化的、用于指导用户从零开始使用 Open WebUI 的综合性在线文档中心 (Comprehensive Online Documentation)1。
Byron0707
19 小时前
大模型
·
智能体
·
claude code
从零开发Claude Code插件(Plugin)完整指南
Claude Code插件是扩展其功能的核心方式,可封装可复用的技能(Skills)、智能体(Agents)、命令(Commands)等资源,实现跨项目、跨团队的功能共享,适用于标准化工作流程落地、团队协作效率提升等场景。本文结合成熟插件参考案例,从零讲解Claude Code插件的开发、配置、测试与扩展,帮助开发者快速上手插件开发。
AI、少年郎
19 小时前
人工智能
·
python
·
ai
·
大模型
·
微调
·
大模型训练
·
minimind
MiniMind 第 4 篇:《数据工程|Tokenizer 训练 + 预训练 / SFT/DPO 全数据集处理》
承接上一篇内容:我们拆解了 MiniMind 底层核心架构,吃透了 RMSNorm、SwiGLU、RoPE 三大组件的工程实现与优化逻辑。现在,终于轮到 LLM 最关键的「粮草」—— 数据工程。
weitingfu
20 小时前
人工智能
·
gpt
·
大模型
·
bert
·
mamba
·
上下文
·
实战指南
从 BERT 到 GPT 再到 Mamba:LLM 架构的“三国演义“
别被那些花里胡哨的论文标题吓到——所谓大语言模型架构演进,本质上就是一群工程师在解决同一个问题:怎么让机器读懂人话,而且读得更快、更准、更省电。
@atweiwei
1 天前
开发语言
·
人工智能
·
ai
·
rust
·
大模型
·
llm
·
agent
LangChainRust:用 Rust 构建高性能 LLM 应用的完整指南
LangChainRust 是 LangChain 的 Rust 实现,提供了 Agents、Chains、Memory、Tools、RAG 等核心模块,让你用 Rust 构建高性能的 AI 应用。
AI视觉网奇
1 天前
人工智能
·
大模型
探索 InternVL3.5:从权重解析到多模态推理的全栈实践笔记
目录切换模型:旗舰级性能表现InternVL3.5-241B 使用笔记除了在线测试,该模型也以开源形式提供,你可以通过以下方式使用或部署:
xixixi77777
1 天前
人工智能
·
gpt
·
安全
·
机器学习
·
架构
·
大模型
·
通信
智算中心建设新范式:GPT-6/Rubin架构+1.6T光模块+量子安全网关+AI安全沙箱,算力·效率·安全·成本的最优平衡
当AI训练进入十万卡集群时代,智算中心不再只是GPU的堆叠,而是一场从芯片、互连、安全到运行底座的系统性工程。
CoderJia程序员甲
1 天前
ai
·
大模型
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-04-15)
生成于:2026-04-15共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
来两个炸鸡腿
1 天前
人工智能
·
大模型
·
智能体
【Datawhale2604】Hello-agents task01 智能体经典范式构建
ReAct 本质是一个闭环控制系统。输出 Thought+ActionFinish 答案ToolName input
竹之却
1 天前
人工智能
·
大模型
·
检索增强
·
faiss
·
rag
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第6天-大模型RAG检索增强生成实战
技术标签:人工智能、大模型、RAG、检索增强、LangChain、向量数据库、FAISS大模型训练数据存在时间截止点,无法获取训练后新增的知识,回答易出现过时、错误、幻觉。
m0_48891301
1 天前
人工智能
·
学习
·
机器学习
·
大模型
·
产品经理
·
llama
·
uml
万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!
在AI领域,大模型的发展正以前所未有的速度推进技术的边界。北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Llama之后的第三代模型,Llama-3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型。
xixixi77777
2 天前
开发语言
·
网络
·
人工智能
·
ai
·
大模型
·
php
·
通信
AI自主挖洞 + 通信网络扩散:全域风险指数级放大,如何构建密码-沙箱-终端联动闭环?
当AI学会自主挖掘0day漏洞,并通过通信网络秒级扩散,传统“补丁式”安全已彻底失效。我们需要一场从终端到云端的防御范式革命。
guslegend
2 天前
人工智能
·
架构
·
大模型
·
rag
第10节:设计高效混合检索架构,提升召回精度
RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Flying pigs~~
2 天前
运维
·
人工智能
·
docker
·
容器
·
大模型
·
agent
·
rag
检索增强生成RAG项目tools_01:Docker 极简实战
一份写给「只做开发、不做运维」的 AI 工程师的 Docker 学习笔记!总之就是一个字:好!!!Docker 拉取镜像时需要访问 Docker Hub(registry-1.docker.io),但国内网络访问不稳定,即使(●'◡'●)上网了,Docker Desktop 也不会自动使用系统代理。
前端摸鱼匠
2 天前
人工智能
·
深度学习
·
面试
·
大模型
·
transformer
·
求职招聘
【AI大模型春招面试题21】什么是Transformer的“预归一化”与“后归一化”?两者的差异及影响?
你好!咱们直接切入正题。这道题在现在的架构演进(尤其是从 BERT 到 LLaMA 系列)背景下,属于必考题。它不仅仅考察你对归一化层位置的记忆,更考察你对深层网络训练稳定性、梯度流以及现代大模型架构设计哲学的理解。
人道领域
2 天前
大数据
·
人工智能
·
chatgpt
·
大模型
2026年3月大模型全景深度解析:国产登顶、百万上下文落地、Agent工业化,AI实用时代全面来临[特殊字符]
🔥个人主页:北极的代码(欢迎来访) 🎬作者简介:java后端学习者 ❄️个人专栏:苍穹外卖日记,SSM框架深入,JavaWeb ✨命运的结局尽可永在,不屈的挑战却不可须臾或缺!
CoderJia程序员甲
2 天前
人工智能
·
ai
·
大模型
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2026-04-14)
生成于:2026-04-14共发现热门项目: 16 个榜单类型:日榜Token赞助:siliconflow
kcuwu.
2 天前
大模型
·
提示词工程
大模型提示词工程基础博客
你是不是也有过这样的经历: 对着 ChatGPT 问 “帮我写个文案”,结果 AI 给你写了一篇干巴巴的官方宣传稿,完全不是你想要的小红书种草风格? 问 AI 一个数学题,结果它给了你一个错误的答案,你还得自己再算一遍?