9、【AI】【Agent】联网使用大模型(DashScope&ModelStudio)

【声明】本博客所有内容均为个人业余时间创作,所述技术案例均来自公开开源项目(如Github,Apache基金会),不涉及任何企业机密或未公开技术,如有侵权请联系删除

背景

上篇 blog
【AI】【Agent】联网使用大模型(一)

分析了上下文长度会显著影响到 token 生成速度的场景,另外,在硬件条件受限的情况下,只能优先选择小模型,通过减少参数量,减少数据从内存搬运到 CPU 缓存的影响,并指出了两个提升方向:联网使用大模型,或本地硬件升级 GPU,选定联网使用大模型之后,进一步分析了 token 的收费方式,并详细解释了网页版/APP版本(免费)和 API 调用(收费)两种模式的区别,下面继续

Agent

下面将以阿里云为例,对大模型进行部署配置和 API 调用

阿里云有 DashScope灵积 )和百炼Model Studio / Bailian)两个基于通义大模型的服务平台可供选择,两个平台在定位,目标用户,功能深度和使用方式上有诸多区别,下面详细分析下

首先官方入口如下

平台 官网首页 控制台(需登录)
DashScope(灵积) https://www.aliyun.com/product/dashscope https://dashscope.console.aliyun.com
百炼(Model Studio) https://www.aliyun.com/product/bailian https://bailian.console.aliyun.com

首先是 DashScope(灵积):大模型 API 原子能力平台 ,提供通义千问,通义万相,语音识别等原始模型 API ,适合开发者直接集成到应用中,定位是模型即服务(MaaS)底层接口,让用户像调用函数一样调用大模型

这里上面提到了通义千问,通义万相和语音识别三种模型,其特点和区别如下

模型名称 英文名 核心能力 输入 → 输出 典型用途
通义千问 Qwen / Qwen-VL(多模态版 文本理解与生成 文字 → 文字 写代码,回答问题,写报告等
通义万相 Tongyi Wanxiang AI 绘画 & 图像生成 文字/图 → 图 画插画,设计海报,老照片上色等
语音识别 FunASR / Paraformer 语音转文字 语音 → 文字 会议记录,字幕生成,语音助手等

上面提到的多模态(Multimodel)也是当前 AI 领域最热门的概念之一,这里的模态指的是信息的表现形式,而多模态则表示的是模型能够同时理解和处理多种类型的信息,常见的模态包括

模态 例子
文本(Text) 这是一只猫
图像(Image) 🐱 的照片
语音(Audio) 猫的声音
视频(Video) 猫咪跑动的短视频

总结一下

  • 单模态模型:只能处理一种模态(比如纯文本的 Qwen)
  • 多模态模型:能够跨模态理解和生成(比如 Qwen-VL 能够看图说话)

接下来是百炼(Model Studio):一站式企业级大模型应用开发平台 ,在 DashScope 的基础上,该平台封装了智能体(Agent),知识库(RAG),工作流,低代码工具链等,让非专业开发者也能构建 AI 应用,其定位是大模型操作系统(Model OS),让用户无需写代码,也能打造专属 AI 助手

下面对比下 DashScope(灵积)和百炼(Model Studio)的核心区别

维度 DashScope(灵积) 百炼(Model Studio)
目标用户 开发者,技术团队 企业用户,产品经理,业务人员
使用方式 调用 HTTP/SDK API 可视化拖拽 + 低代码配置 + API
核心能力 原始模型推理(文本,图像,语音等) Agent 应用,RAG 知识库,插件集成,多模态工作流
是否需要编程 必须写代码 支持无代码搭建
模型底层调用 直接访问 Qwen 系列模型 底层仍调用 DashScope API(已整合)
典型场景 OpenCoder,LangChain,自研 Agent 等 智能客服,企业知识问答,营销文案生成等

可以把百炼看做 DashScope 的高级封装版,百炼 = DashScope(能力底座)+ 应用层工具链


OK,本篇先到这里,如有疑问,欢迎评论区留言讨论,祝各位功力大涨,技术更上一层楼!!!更多内容见下篇 blog
【AI】【Agent】联网使用大模型(ModelStudio)

相关推荐
纤纡.9 小时前
基于 PyTorch 手动实现 CBOW 词向量训练详解
人工智能·pytorch·python·深度学习
大学有意思9 小时前
2026深度解析广西英华国际职业学院新能源汽车技术专业
人工智能·机器人
踩着两条虫9 小时前
AI驱动的Vue3应用开发平台深入探究(十八):扩展与定制之集成第三方库
vue.js·人工智能·低代码·重构·架构
恋猫de小郭9 小时前
Claude Code 源码里有意思设定:伪造、投毒、卧底、封号
前端·人工智能·ai编程
kailp9 小时前
无需本地显卡!跑GPT-SoVITS-V2Pro完整教程
人工智能·gpt·ai·大模型·云计算
饼干哥哥9 小时前
n8n已死!我用Kimi跑通了Claude Skills,直接替代工作流
人工智能
爱写代码的汤二狗9 小时前
第4章 载体选择:网站、小程序还是App?
人工智能·驱动开发·创业创新
纤纡.9 小时前
从单图风格迁移到实时视频四宫格滤镜:OpenCV DNN 实战全解析
人工智能·opencv·dnn
LingYi_09 小时前
语义分割-yolo26seg
人工智能·深度学习
测试小张z9 小时前
AI智能客服测试点
人工智能·ai