大模型

zhangfeng11334 小时前
人工智能·语言模型·大模型
国家超算中心 scnet.cn 跨用户文件分享流程总结 多个用户之间 文件共享 不需要反复下载上传一句话概括:网页端分享并记住文件名 → Linux 到 /root/public_data/other 找到 .tar.gz 包 → 解压到私有目录使用。
独断万古他化8 小时前
大模型·llm·api·sdk
大模型接入指南:API、本地部署与 SDK 三种接入如果需要自己写一个AI应用来实现相关AI行为,则需要自行接入LLM。 常见的原生LLM(不经过第三方平台或复杂的代理层,直接与大语言模型提供方进行交互的方法)接入方式有三种:【API远程调用】、【开源模型本地部署】和【SDK和官方客户端库】
翔云12345610 小时前
人工智能·ai·大模型
端侧推理:全面解析与深度洞察端侧推理(On-Device/Edge Inference) 是指将训练完成的AI模型部署在终端设备本地,直接在设备上完成数据处理、模型计算和结果输出的技术范式,无需或仅需少量云端交互。它是边缘计算与AI结合的核心应用,与传统云端推理形成互补的智能计算体系。
DogDaoDao13 小时前
人工智能·深度学习·程序员·大模型·github·ai编程·andrej-karpathy
【GitHub】andrej-karpathy-skills:让 AI 编程助手告别三大通病项目仓库:forrestchang/andrej-karpathy-skills Star 数:105,000+ ⭐ Fork 数:10,300+ 开源协议:MIT License 灵感来源:Andrej Karpathy 对 LLM 编码缺陷的深刻洞察
程序员小崔日记16 小时前
大模型·web开发·deepseek
DeepSeek V4,我在做项目和写软著材料时,顺手用了一段时间前阵子 DeepSeek 更新到了 V4。一开始我其实没太当回事。现在大模型更新太快了,几乎隔一段时间就来一次“版本升级”,但很多时候用起来差别并不大。
CoderJia程序员甲17 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-05-03)生成于:2026-05-03共发现热门项目: 8 个榜单类型:日榜Token赞助:siliconflow
guslegend21 小时前
人工智能·大模型·ai编程
第4节:应用架构与代码组织AI编程企业级实战上一节:第3节:动第一行代码前,你应该想清楚什么本节:第4节:应用架构与代码组织下一节:待更新
你可以叫我仔哥呀1 天前
人工智能·ai·大模型
Agent架构之ReAct随着AI的发展,大模型一词越来越多的出现在我们的生活工作中,一开始大家更多的是把大模型当成一个聊天机器人,但是随着AI的进一步发展,我们不再仅仅满足于和大模型聊天,所以一个更深一层的概念就出来了 —— Agent。
索木木1 天前
人工智能·机器学习·大模型·attention·训练·显存优化·aiinfra
Flash Attention反向梯度优化显存前面我有文章介绍子Flash Attention 针对长序列的正向优化,而其反向算子(Backward Pass)的优化由于涉及到复杂的梯度重计算和显存权衡,往往比正向过程更具挑战性。
哥本哈士奇(aspnetx)1 天前
大模型
SQL Server 图数据库学习笔记1:构建图数据库在AI开发中,知识图谱是非常火的一个领域,而提到图数据库大家都会第一时间想到Neo4J,其实在SQLServer中早已有支持,此篇将简单演示如何在SQLServer下构建图数据库,实现知识图谱的管理。
码点滴1 天前
人工智能·gpt·架构·大模型·deepseek
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?写在前面:这篇文章不是模型评测,是决策工具。你要回答的问题只有一个:给定我的业务场景和预算约束,哪个模型组合的预期收益最高? 本文从这个问题出发,给出可操作的判断框架。
翔云1234561 天前
人工智能·ai·大模型
vLLM全解析:定义、用途与竞品对比vLLM(Very Large Language Model inference) 是由加州大学伯克利分校LMSYS团队于2023年6月开源的高性能大模型推理与服务引擎,专注解决大模型部署中的显存效率低、吞吐量瓶颈、延迟高三大核心问题 。
翔云1234562 天前
ai·大模型
大模型训练框架全景解析(2026最新)大模型训练框架按功能定位可分为三类:关键技术趋势(2026)混合并行成为标配:数据并行+模型并行+流水线并行深度融合,3D并行成为千亿模型训练基础
不懒不懒2 天前
人工智能·分类·数据挖掘·大模型·ollama
【从零入门本地大模型:Ollama 安装部署 + Qwen2.5 实现零样本情感分类】目录一、准备工作二、安装 Ollama 客户端三、一键运行你的第一个大模型四、基于 Qwen2.5 实现零样本情感文本分类实战
翔云1234562 天前
人工智能·ai·大模型
大模型部署全流程深度解析大模型部署是将训练完成的模型转化为稳定、高效、可扩展推理服务的全链路工程,核心目标是在性能、成本、延迟、精度间取得最佳平衡。以下从8大维度展开,覆盖从前期规划到生产运维的完整闭环。
码点滴2 天前
人工智能·架构·大模型·deepseek-v4
DeepSeek-V4 全景地图:两款模型、三种模式,你该怎么选?核心主张:V4 不只是"更便宜的 GPT-4o"——它重新定义了"百万上下文"从奢侈品变为基础设施的临界点。读懂这篇文章,你能在正确的场景用正确的配置,成本节省 80% 以上。
翔云1234562 天前
人工智能·ai·大模型
vLLM 全部8种部署方式(按从简单到企业级排序,附适用场景+最简命令)适用:本地开发、调试、二次开发、嵌入RAG/Agent项目 特点:最灵活,可自定义推理逻辑、接入业务代码 最简用法
DogDaoDao2 天前
人工智能·深度学习·开源·大模型·github·ai编程·opeclaw
【GitHub】OpenClaw:开源个人AI助手的新标杆OpenClaw(官网:https://openclaw.ai)是一个功能强大的开源个人AI助手项目,其Slogan为"Your own personal AI assistant. Any OS. Any Platform. The lobster way. 🦞"。截至目前,该项目在GitHub上已获得超过 367,000 Stars,成为全球排名第6的热门开源项目,Fork数超过75,000,拥有来自全球2,000多位贡献者的参与。