Qwen通义千问大模型

千问介绍

Qwen(通义千问)是阿里巴巴 Qwen 团队研发的开源大语言与多模态模型系列,主打中文优化、全尺寸覆盖与多模态能力,当前最新稳定版为 Qwen3,面向通用与垂直场景的全栈模型,支持文本、图像、音频、工具调用、智能体等任务,中文表现突出,同时覆盖多语言Qwen

核心能力

  • 文本能力:理解、生成、翻译(100 + 语言)、对话、逻辑推理Qwen。
  • 多模态能力:图像理解(Qwen‑VL)、音频处理、代码生成(支持 200 + 语言)。
  • 长上下文:最新版本支持超长上下文(最高 1000 万 tokens),适配长文档处理。
  • Agent 与工具调用:双模式切换,复杂任务工具集成能力突出Qwen

部署与开源生态

  • 开源与获取:全系列模型开源(含 MoE),可通过 Hugging Face 等平台下载,支持商用(需遵循许可协议)。
  • 部署方式
    • 本地部署:适配 GPU/CPU,支持 LoRA 微调。
    • 云端服务:阿里云通义千问 API / 服务,低代码集成。
    • 工具链:支持 Transformers、vLLM、LangChain 等主流框架。
  • 应用场景:企业服务(金融、医疗、教育等)、智能助手、内容生成、代码辅助(通义灵码)等。

大模型下载:

ollama pull xxx

我们可以从ollama上下载,也可以从modelscope下载,也可以从huggingface下载对应的千问大模型

视觉大模型Qwen-VL:

文本理解与生成、视觉内容感知与推理、长上下文支持、空间关系及动态视频理解,以及与人工智能代理的交互能力等

让qwen-vl模型识别图片:

让非vl模型识别图片:提示模型不支持

编程调用vl视觉大模型:

python 复制代码
from langchain_ollama import ChatOllama
from langchain_core.messages import SystemMessage, HumanMessage

def test_qwen_vl():
    llm = ChatOllama(
        model="qwen3-vl:8b",
        base_url="http://localhost:11434",  # Ollama 默认服务地址
        temperature=0,
    )
    messages = [
        # 可选:系统指令,定义模型行为
        SystemMessage(content="你是一个专业的多模态分析助手,需精准识别图片内容并按要求回答。"),
        HumanMessage(
            content=[
                {"type": "text", "text": SystemMessage},
                {
                    "type": "image_url",
                    "image_url": {"url": "/Users/johnny/Desktop/duoradream.png"}  # 适配 Ollama 图片格式
                }
            ]
        )
    ]
    # 调用模型并返回结果
    try:
        response = llm.invoke(messages)
        return response.content
    except Exception as e:
        return f"调用失败:{str(e)}"


if __name__ == '__main__':
    print(test_qwen_vl())


输出:
图片中展示的是日本经典动漫《哆啦A梦》中的主角**哆啦A梦**。它有着标志性的蓝色身体、白色脸部、红色鼻子和铃铛项圈,此刻正坐在开满粉色与白色花朵的花丛中,闭着眼睛露出满足的微笑。周围飘落着粉色花瓣,背景是晴朗的蓝天与蓬松的白云,整体画面充满春日的生机与梦幻感,营造出温馨治愈的氛围。
相关推荐
canonical_entropy13 小时前
AI Agent 的演进之路:从对话到自主代理操作系统
低代码·aigc·agent
EdisonZhou14 小时前
MAF快速入门(18)Agent Skill 快速开始
llm·aigc·agent
cpuimage14 小时前
AIGC图像困局
aigc·stable_diffusion
刘贺同学19 小时前
Day12-龙虾哥打工日记:OpenClaw 子 Agent 到底看到了什么?
aigc·ai编程
程序员鱼皮21 小时前
离大谱,我竟然在 VS Code 里做了个视频!
github·aigc·ai编程
树獭叔叔21 小时前
13-KV Cache与位置编码表:大模型推理加速的核心技术
后端·aigc·openai
是一碗螺丝粉1 天前
LangChain 链(Chains)完全指南:从线性流程到智能路由
前端·langchain·aigc
lnix1 天前
当“大龙虾”养在本地:我们离“反SaaS”的AI未来还有多远?
人工智能·aigc
可夫小子1 天前
OpenClaw安装技能的三种方式
aigc