技术栈
ai
16Miku
4 分钟前
人工智能
·
ai
·
autodl
·
vllm
·
部署大模型
·
qwen3-8b
Qwen3-8B vLLM 部署实践教程(AutoDL 平台)
实践日期:2025年12月23日 vLLM 版本:0.8.5.post1 模型:Qwen3-8B 平台:AutoDL(RTX 4090 24GB) 参考教程:https://github.com/datawhalechina/self-llm/blob/master/models/Qwen3/02-Qwen3-8B-vLLM 部署调用.md
星月昭铭
24 分钟前
java
·
spring boot
·
后端
·
ai
Spring Boot写一个/v1/chat/completions接口给Cherry Studio流式调用
最近看了一下Spring AI Alibaba项目,也拿了官方的示例跑起来,发现官方示例里面流式接口返回值是Flux,就研究了一下。 然后结合之前的代码,再问了问AI ,写一个/v1/chat/completions接口,用Cherry Studio调试起来也方便。
全栈技术负责人
39 分钟前
前端
·
ai
Ling框架:针对AIGC工作流中JSON数据流式处理的解决方案
演讲首先探讨了在复杂的 AIGC(生成式人工智能)工作流中,JSON 数据格式的重要性及其面临的挑战。
itachi-uchiha
40 分钟前
ai
通识性AI知识点:AI学习框架(从ML到LLM的核心概念)
通过上图,你可以建立起一个清晰的学习框架。接下来,我们深入探讨其中一些最核心且最容易混淆的概念。这个层面的概念描述了AI学习的“输入-处理-输出”全过程:
哥布林学者
1 小时前
深度学习
·
ai
吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (四)YOLO 的完整传播过程
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下:本篇为第四课的第三周内容,3.9到3.10的内容,同时也是本周理论部分的最后一篇。
itachi-uchiha
1 小时前
ai
通识性AI知识点:Token和Context
简单理解:如果把AI大模型想象成一个正在阅读的人,那么 Token(令牌)是它读到的“每一个字词”,而Context(上下文/上下文长度)是它“一次性能记住和参考的前面内容的范围”。
陈橘又青
3 小时前
人工智能
·
后端
·
ai
·
架构
·
restful
·
数据
·
vllm
vLLM-Ascend推理部署与性能调优深度实战指南:架构解析、环境搭建与核心配置
在生成式人工智能(Generative AI)从实验室走向大规模生产环境的进程中,推理引擎(Inference Engine)的效率起着决定性作用。长期以来,NVIDIA GPU 凭借完善的 CUDA 生态主导了这一领域。然而,随着 AI 算力需求的指数级增长,算力供应的多元化已成为行业共识。华为昇腾(Ascend)系列 AI 处理器,特别是 Atlas 800 A2(搭载 Ascend 910B 芯片)系列,凭借其在 FP16/BF16 混合精度计算上的强劲性能,逐渐成为国产化算力集群的首选。
小北方城市网
4 小时前
前端
·
javascript
·
vue.js
·
ai
·
性能优化
·
正则表达式
·
json
第7课:Vue 3应用性能优化与进阶实战——让你的应用更快、更流畅
在前 6 课中,我们已经完成了 Vue 3 应用的 “从开发到上线” 全流程,得到了一个功能完整、可公开访问的待办应用。但在实际开发中,“能运行” 只是基础,“运行得快、体验流畅” 才是企业级应用的核心要求 —— 比如页面加载慢、列表滚动卡顿、操作响应延迟等问题,都会直接影响用户体验。本节课将聚焦性能优化核心方案和进阶实战,从 “加载阶段”“运行阶段”“大型数据渲染” 三个关键场景切入,教你用 Vue 3 专属优化手段解决性能瓶颈,让你的应用从 “能用” 升级为 “好用、快用”。
慢慢慢时光
5 小时前
ai
claude code使用
其实很早就知道claude code,但是一方面公司代码都在内网,有灵码插件;另一方面感觉IDE更加直观,总是没动力去尝试,随着跟AI更多深入的思考和国产大模型的性能迅速提升和性价比,感觉跟当年的vim一样,要赶紧用起来了
DO_Community
5 小时前
运维
·
ai
·
自动化
·
devops
从零开始,用 n8n 设计可扩展的自动化工作流
自动化已经成为现代软件开发与运维中不可或缺的一部分。从在不同工具之间同步数据,到触发复杂的业务流程,团队越来越依赖工作流自动化平台来减少人工操作与错误。n8n(读作 “n-eight-n”)是一款强大的开源工作流自动化工具,可用于连接各类应用、服务和 API,构建灵活、可扩展的自动化流程。
程序员鱼皮
5 小时前
计算机
·
ai
·
程序员
·
大模型
·
互联网
·
编程
女友怒骂国内不能用Claude Code,于是我给她做了一个
大家好,我是程序员鱼皮。最近女友开始学习 AI 编程了(被我带的),她听说 Claude Code 这个 AI 编程工具很牛掰,结果试了下发现得要国外的 Claude 账号才能登陆。
小真zzz
5 小时前
开发语言
·
人工智能
·
ai
·
powerpoint
·
ppt
当前集成Nano Banana Pro模型的AI PPT工具排名与分析
以下为综合评分榜,大家可以快速了解各工具的核心定位。ChatPPT官网:www.chatppt.cn 点此预约,获得免费体验资格
De-Alf
5 小时前
笔记
·
学习
·
ai
Megatron-LM学习笔记(5)Model Linear线性层
在GPT Model中,初始化了Transformer模型头尾、MTP多token预测模块以及中间所需的Embedding和Rotary Embedding。在那之后,传入transformer的decoder,正式进行Attention以及MLP的层层叠叠计算。非常朴实无华。 
信仰JR
5 小时前
运维
·
docker
·
ai
Linux系统使用Docker安装Ollama
当前我在有网环境使用Docker的方式部署Ollama,使用Ollama部署大模型,之后导出镜像和数据在无网的内网环境使用。
带刺的坐椅
7 小时前
java
·
ai
·
springboot
·
web
·
solon
·
flow
·
mcp
超越 SpringBoot 4.0了吗?OpenSolon v3.8, v3.7.4, v3.6.7 发布
(听说隔壁的 Spring 7 和 SpringBoot 4 最近出了几个大 Bug了?!)历时 8 年磨砺,1.7 万次代码提交,9个分仓库,几百个模块,20多万代码量, 1200 万次半年下载量 —— OpenSolon(即 Solon)正在重新定义 Java 企业级应用开发的性价比。
模型启动机
7 小时前
人工智能
·
ai
·
chatgpt
·
大模型
对话奥特曼:OpenAI的真实未来蓝图
在一次深度对谈中,山姆·奥特曼勾勒了OpenAI的长期蓝图:真正的护城河不是模型智商,而是“记忆”。通过可自主选择的深度记忆、不断增强的情感互动,以及多设备协同的上下文计算,ChatGPT正从工具演变为长期陪伴者。
itachi-uchiha
7 小时前
ai
通识性AI知识点:AI工具选型指南
挑选AI就像选工具,得看它能做什么、怎么用。目前主流AI可以分为两大类和四小类,具体看下表:接下来,我们详细看看它们在核心差异与选择建议上的体现。
我很哇塞耶
7 小时前
大数据
·
人工智能
·
ai
·
大模型
2025年加倍投入AI的九大品牌
到2025年,生成式AI已成为品牌营销、创意和产品开发的核心工具。联合利华、美泰、多邻国、Klarna、CaliBBQ、通用汽车、Intuit、可口可乐和迪士尼等企业通过AI提升内容生产效率、降低成本、增强创意,同时探索广告、产品设计和客户互动新模式。
芷栀夏
7 小时前
人工智能
·
ai
·
ai编程
AI Ping新旗舰模型实战解析:GLM-4.7与MiniMax M2.1
在AI工程化落地加速的当下,开发者对大模型的场景适配性、稳定性与效率提出了更高要求。国内领先的大模型评测与聚合平台AI Ping,近期重磅上线GLM-4.7与MiniMax M2.1两款旗舰模型,精准覆盖不同工程场景核心需求。本文将从模型核心能力、实测性能、场景适配、落地实操四大维度,深度解析两款模型的差异与价值,为开发者提供清晰的选型与落地参考。
视觉&物联智能
7 小时前
人工智能
·
安全
·
ai
·
自动化
·
aigc
·
agi
·
deepseek
【杂谈】-自动化优先于人工智能:为智能系统筑牢安全根基
这一趋势的背后有着清晰的原因。人工智能在降低成本、提升效率以及优化公民或客户体验方面展现出了巨大的潜力。它有望对从客户服务到合规管理等各个领域带来全方位的变革。然而,在这股现代化的浪潮中,许多组织却忽视了一个关键问题:那些处理最敏感信息的系统,往往恰恰是最缺乏人工智能应用准备的系统。