技术栈
大模型部署
Daydream.V
7 天前
人工智能
·
langchain
·
ollama
·
functioncalling
·
大模型部署
从零搭建 AI Agent:LLM Agent+Function Calling+Dify 本地部署 + Coze 实战全攻略
随着大模型技术快速发展,LLM Agent与Function Calling已成为 AI 应用落地的核心能力。传统 LLM 仅能处理文本生成,存在信息滞后、缺乏行动力、逻辑不精确三大痛点,而 Agent 通过自主规划、记忆、工具调用实现复杂任务,Function Calling 则打通大模型与外部世界的连接。
七牛云行业应用
10 天前
人工智能
·
docker
·
github
·
ai实战
·
大模型部署
·
claude opus 4.7
·
api接入
GPT-5.5 Instant vs Grok 4 完整对比【2026年5月最新】:哪个大模型更适合开发者?
GPT-5.5 Instant 和 Grok 4 是截至 2026 年 5 月最受关注的两款主流大语言模型,分别由 OpenAI 和 xAI 推出。两者均在 2026 年 5 月密集更新,GPT-5.5 Instant 于 5 月 5 日正式向所有 ChatGPT 用户开放,Grok 4 则以百亿至千亿参数规模跻身性能榜前列。选哪个,取决于你的具体使用场景。
Rabbit_QL
11 天前
大模型部署
【大模型换机器部署失败原因排查】一次 `Illegal instruction` 排查:原来是虚拟机没暴露 AVX 指令集
昨天在重新构建服务时,遇到了一个非常“底层”的问题。最开始看日志,还以为是业务代码、依赖或者容器环境的问题,结果一路排查下去,最后发现问题根本不在 Python,而在虚拟机 CPU 指令集。
AAI机器之心
16 天前
人工智能
·
macos
·
langchain
·
llm
·
知识库
·
大模型部署
在 macOS 上本地部署 Ollama + LLaMA3(附教程)
在 macOS 上本地部署 Ollama + LLaMA3 非常简单,以下是完整步骤:一、系统要求1.macOS 12+
liu****
1 个月前
人工智能
·
python
·
langchain
·
langgraph
·
大模型部署
LangGraph-AI应用开发框架(三)
要点1:回顾AIMessage消息结构要点2:构造ToolMessage要点3:在State中访问messages
handsomestWei
1 个月前
昇腾
·
ascend
·
huawei
·
大模型部署
·
deepseek
华为昇腾DeepSeek模型部署
适用于华为昇腾 310P3 服务器,基于 MindIE 服务化部署 DeepSeek-R1 系列模型,并通过 curl 调用 OpenAI 兼容接口进行对话验证。
liu****
2 个月前
人工智能
·
python
·
langchain
·
大模型部署
LangChain-AI应用开发框架(二)
目录一.认识嵌入模型1. 什么是嵌入模型?2. 嵌入模型应用场景3.主流的嵌入模型二.嵌入模型接入方式
YoanAILab
2 个月前
大模型部署
·
ai平台
·
ai工程
·
ai基础设施
·
ai项目实战
大模型平台是怎么跑起来的?从 GPU 到 API 全链路拆解(工程视角)
很多人在接触大模型时,通常只关注:但在实际工程项目中,更关键的问题是:❓ 模型是怎么“跑起来”的?从 GPU 到最终 API 服务,中间到底经历了什么?
长路 ㅤ
3 个月前
向量数据库
·
大模型部署
·
langchain4j
·
智能体agent
·
ai后端技术
长路的AI领域技术博客汇总文档
博主介绍:✌目前全网粉丝4W+,csdn博客专家、Java领域优质创作者,博客之星、阿里云平台优质作者、专注于Java后端技术领域。
小C哈哈哈
3 个月前
人工智能
·
lm studio
·
大模型部署
·
deepseek
·
本地部署模型
告别联网限制与隐私担忧:在自家电脑跑一个专属的DeepSeek AI
很多人不明白本地部署AI大模型的意思,今天我就用通俗易懂的语言给大家讲一讲。说白了就是把原本在别人服务器(电脑里)里的 AI 大模型,安装在你自己的电脑设备上运行,全程不用连外网、不用依赖别人的电脑服务,所有的 AI 计算、数据处理都在你自己的设备里完成。
一切皆有可能!!
4 个月前
人工智能
·
大模型
·
昇腾
·
大模型部署
昇腾atlas 300I duo部署Qwen3-8B完整实战:从选型到成功运行
使用之前需要先安装固件和驱动 选择合适的版本型号 一直跟着执行,在安装驱动时候,上面的创建驱动文件不知道是过时了,一直没成功,换到官网手动下载了驱动。另外在执行命令时是使用sudo bash 而不是sudo sh
阿尔的代码屋
4 个月前
qwen
·
modelscope
·
大模型实战
·
ollama
·
大模型部署
[大模型实战 01] 本地大模型初体验:Ollama 部署与 Python 调用指南
核心摘要 (TL;DR)官网地址:https://ollama.com/Ollama 是目前最火的本地大模型部署工具。 简单来说,它能帮咱们快速拉取模型文件,让模型在本地直接运行并进行对话。同时,它还能把模型打包成一个标准的接口,通过端口开放给咱们写的 Python 脚本调用。
虚神界熊孩儿
4 个月前
vscode
·
大模型部署
·
大模型本地部署
OpenStation + VSCode :本地大模型赋能编码效率的实战指南
作为每天和 VSCode 朝夕相处的开发者,代码补全、文档查询、bug 调试是日常工作的核心环节,但传统开发模式中,这些操作往往伴随着频繁切屏、网络延迟或隐私泄露风险。直到用 OpenStation 部署本地大模型并集成到 VSCode 后,才发现开发效率能实现质的飞跃 —— 既保留了 VSCode 的轻量化体验,又获得了专属本地大模型的智能辅助能力。
极智-996
4 个月前
人工智能
·
python
·
github
·
ai智能体
·
大模型部署
·
语音ai
GitHub 热榜项目-日榜精选(2026-01-24)| AI智能体工具、Python生态等 | remotion、VibeVoice、goose等
📅 热榜时间:2026-01-24 🏷️ 核心标签:#GitHub #开源项目 #AI智能体 #视频开发 #语音AI #大模型部署 #Python学习 📊 统计摘要:本期热榜包含 13 个 项目。(GitHub)
XMoyas
4 个月前
大模型部署
·
大模型服务
·
英伟达显卡驱动安装
·
openai sdk访问
大模型服务:个人工作学习中关于模型部署、访问等常用资源的整理
【202601更新】记录大模型推理服务部署和使用过程中的一些资源,包括但不限于部署环境、部署框架常用优化、模型调用、多模态对话模型、多模态向量模型等(非特殊说明,均为Linux环境、Nvidia显卡)
雪碧聊技术
4 个月前
大模型调用
·
大模型部署
3.大模型使用
目录一.大模型部署1.自己部署自己部署——本地机器部署1)如何让大模型跑起来?2)下载ollama3)使用ollama部署大模型
A尘埃
5 个月前
语言模型
·
大模型部署
大模型部署方式(本地化部署+云端部署+混合部署+边缘段部署)
适用场景:企业对数据隐私要求高(如金融、医疗)、需低延迟响应(如实时对话)、或有固定算力资源(自有GPU集群)
猫先生Mr.Mao
7 个月前
人工智能
·
机器人
·
大模型
·
自动驾驶
·
agi
·
大模型部署
·
分布式推理框架
2025年10月AGI月评|OmniNWM/X-VLA/DreamOmni2等6大开源项目:自动驾驶、机器人、文档智能的“技术底座”全解析
〔更多精彩AI内容,尽在 「魔方AI空间」 ,引领AIGC科技时代〕本文作者:猫先生知识库主页:https://oizxc9sdhbc.feishu.cn/wiki/FGS5wST0Hiy6xJklyPTcTVOqnAd
余衫马
8 个月前
c++
·
人工智能
·
llm
·
llama
·
大模型部署
llama.cpp:本地大模型推理的高性能 C++ 框架
llama.cpp是由Georgi Gerganov发起的纯C/C++开源框架,专注于在本地设备(如普通PC、树莓派、嵌入式终端)上实现低资源、高性能的大语言模型(LLM)推理。其核心目标是打破云端依赖,让开发者能在消费级硬件上本地运行Meta LLaMA、Mistral、Gemma等主流开源模型,兼顾隐私保护与推理效率。
ShiMetaPi
8 个月前
resnet
·
ai大模型
·
大模型部署
·
bm1684x
·
图片ai
【ShiMetaPi】边缘计算高并发视频流AI分析应用:BM1684X算力盒子上的ResNet部署指南
深度神经网络(DNN)的性能通常随网络层数增加而提升,但当层数超过一定阈值时,会出现 “退化问题”(Degradation Problem):网络准确率饱和甚至下降,并非由于过拟合或梯度消失 / 爆炸,而是深层网络难以优化。