语言模型

Ztopcloud极拓云视角12 小时前
人工智能·笔记·gpt·ai·语言模型
Gemini 3.1 Pro vs GPT-5.4 Pro:API成本1/3、性能差多少?选型实测笔记2026年4月,三大AI旗舰同台竞技的局面算是彻底成型了:OpenAI GPT-5.4 Pro、Google Gemini 3.1 Pro、Anthropic Claude Sonnet 4.6,基本撑起了整个企业级AI调用市场。
小超同学你好13 小时前
人工智能·深度学习·语言模型·架构·transformer
Transformer 23. Qwen 3.5 架构介绍:混合线性/全注意力、MoE 与相对 Qwen 1 / 2 / 3 的演进摘要:本文说明 Qwen3.5 开放权重系列的文本骨干(公开权重多为 图文统一 的 ForConditionalGeneration,含 Vision Encoder;数学与实现细节以 text_config 为主)。相对 Qwen3 及更早代际,Qwen3.5 的硬变化是 高效混合架构:在堆叠的 Decoder 层中 交替使用「线性注意力类子层(配置名 linear_attention)」与「标准因果全注意力子层(full_attention)」,典型节奏为 每 4 层中 3 层线性、1 层全注意力(f
财经资讯数据_灵砚智能16 小时前
大数据·人工智能·python·信息可视化·语言模型·自然语言处理·ai编程
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月6日关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)
33三 三like17 小时前
语言模型·架构·知识图谱
GraphRAG 架构在养老志愿服务推荐中的创新应用:当知识图谱遇见大语言模型传统推荐算法存在冷启动适应性差、推荐可解释性弱等问题,GraphRAG 融合知识图谱检索与大语言模型推理优势,实现 “检索 - 生成 - 排序” 全流程优化,适配养老场景中老年人需求个性化、服务安全性要求高的特点。
沪漂阿龙17 小时前
人工智能·机器学习·语言模型·聚类
大语言模型时代的无监督学习:聚类与降维全解析从K-Means到PCA,一篇讲透无监督学习的核心算法在工业4.0时代,数据每天都在以惊人的速度增长。然而,现实情况往往是:数据堆积如山,标签却寥寥无几。获取标注数据需要大量的人工成本和时间投入,这在许多场景下几乎不可行。这正是无监督学习大显身手的地方。
Omics Pro18 小时前
人工智能·语言模型·自然语言处理·数据挖掘·数据分析
Cell|全球微生物群落整合数据库・MicrobeAtlas包含240万份经统一分析的微生物群落样本・可通过功能丰富的网站在全球范围内追踪微生物类群及群落
diving deep19 小时前
人工智能·语言模型·自然语言处理
从零构建大模型--理解大语言模型主要分为预训练 pre-training 与微调 fine-tuning两个阶段。 理解一个计算机概念始终可以从输入输出的角度理解,输入是什么,输出是什么,然后你就能描述这个概念实现的作用是什么!不要过于只注重具象理解
小超同学你好19 小时前
人工智能·语言模型
LangGraph 23. 生产环境下智能体如何节约成本:多智能体拆分、提示缓存与查询路由摘要(Summary):本文基于生产案例,讨论单体 LangGraph 智能体在长系统提示(约 2 万 token)、大量工具与无缓存条件下导致的 LLM 成本与延迟问题,并归纳四类改造:按任务域拆分多智能体、Prompt Caching(约 5 分钟窗口)、将轻量子任务下沉为调用小模型的工具、以及 Query Router 做上下文感知的查询路由,使问候与轻追问不再进入重型智能体。案例报告成本约降 70%–75%,并补充「何时需要完整智能体、何时不必」的架构取舍。
lifallen20 小时前
java·大数据·人工智能·python·语言模型·flink
Flink Agent 与 Checkpoint:主循环闭环与 Mailbox 事件驱动模型本解析聚焦于 ActionExecutionOperator.java 中的 processElement、processEvent、processActionTaskForKey 等核心方法。这部分代码解决的工程问题是:如何在一个流式处理引擎的单线程算子中,既能保证同一个实体的多步大模型推理(耗时极长)严格有序,又能保证成千上万个不同实体的推理能极限并发,且不阻塞系统的容错屏障(Checkpoint Barrier)?
码上掘金20 小时前
人工智能·深度学习·语言模型
基于深度学习与大语言模型的皮肤病智能辅助诊断系统资源下载皮肤病作为医学领域高发、常见的一大类疾病,由于其种类繁多且病理外观相似度较高,在实际临床诊断中对医生的专业经验有较高要求。同时,对于偏远地区或医疗资源不足的场景,人们在患有皮肤异常时往往难以第一时间获得准确的病理分析。
这张生成的图像能检测吗20 小时前
人工智能·深度学习·语言模型·智能制造·故障诊断
(论文速读)FD-LLM:将振动信号编码为文本表示来将振动信号与大型语言模型进行对齐论文题目:Large language models for explainable fault diagnosis of machines(用于机器可解释故障诊断的大型语言模型)
lifallen20 小时前
java·大数据·人工智能·语言模型·flink
Flink Agent:ActionTask 与可续跑状态机 (Coroutine/Continuation)本解析聚焦于 ActionTask.java 及其子类(JavaActionTask、PythonActionTask、PythonGeneratorActionTask)。这部分代码解决的工程问题是:当一个用户编写的 Action 函数内部包含了网络阻塞调用时,如何将这个原本必须“一气呵成”的函数,硬生生“劈成两半”,让它在前半段执行完后挂起让出线程,并在网络返回后从断点处继续执行后半段?
workflower1 天前
运维·人工智能·语言模型·自动化·集成测试·软件工程·软件需求
注塑机行业目前自动化现状分析现代注塑机普遍采用数字控制系统,可实时监测并调整温度、压力、流量等关键参数,实现生产过程的精准控制 部分高端注塑机集成物联网、人工智能技术,具备自适应控制功能,能根据原材料特性、工艺条件自动优化参数,降低废品率 远程监控与维护服务逐渐普及,操作人员可通过互联网远程访问设备状态,及时处理潜在问题
LoserChaser1 天前
人工智能·ai·语言模型
OpenClaw 指令大全:分类详解与使用指南书接上文:OpenClaw(2026.3.7)+Termux+智谱-安卓手机部署与配置指南 OpenClaw 提供了丰富的命令行工具,分为终端CLI命令和聊天斜杠命令两大类。以下是基于2026年3月最新资料的完整分类介绍。
大模型任我行1 天前
人工智能·语言模型·自然语言处理·论文笔记
英伟达:解耦训练与推演的服务架构📖标题:ProRL Agent: Rollout-as-a-Service for RL Training of Multi-Turn LLM Agents 🌐来源:arXiv, 2603.18815v1
小超同学你好1 天前
人工智能·语言模型
面向 LLM 的程序设计 4:API 版本化与演进——在「模型会记忆旧文档」前提下的兼容策略人会照旧说明书办事,模型也一样。 它见过的文档、缓存里的接口描述、网页上没刷新的说明、向量库里还没更新的片段,都可能比真实系统更旧。于是系统已经升级了,它还在用老地址、老字段名、老例子去调用。
豆沙糕2 天前
人工智能·语言模型
企业级AI Agent工具调用实战:从装饰器注册到注册表调度(生产环境版)前言:AI Agent的核心能力之一是“智能调用工具”——将自然语言请求转化为具体工具执行指令,实现与业务系统(数据库、机器学习模型等)的交互。本文聚焦企业生产环境中,AI Agent如何调用具体工具,从工具定义、装饰器注册、执行逻辑,到调度优化,全程围绕“生产可用、高可扩展、低耦合”展开,拆解新手常踩的坑,提供企业级代码示例,适合Python后端、AI Agent开发者快速落地工具调用模块。
q_30238195562 天前
运维·人工智能·语言模型·chatgpt·kubernetes·文心一言·devops
告别kubectl命令地狱!MCP-K8s让AI成为你的智能运维助手作为一名云原生运维从业者,你是否也曾陷入这样的困境:为了记全kubectl各种复杂参数熬夜背文档,排查Pod故障时在海量日志中逐行检索,部署一个简单服务还要反复调试YAML配置?当Kubernetes成为容器编排的事实标准,其强大的功能背后,是运维人员日益沉重的技术负担。而今天,MCP-K8s的出现彻底改写了这一局面——它通过AI自然语言交互,将复杂的K8s集群管理转化为"聊天式操作",让运维效率实现质的飞跃。本文将结合实战案例,深度解析MCP-K8s的核心原理与应用场景,带你解锁AI时代自动化运维的全新
2301_764441332 天前
人工智能·语言模型·自然语言处理·命令模式
Dify工作流中实现查询优化(QO):将查询复杂度分类法与QOL框架融入工作流在Dify工作流中实现查询优化(QO)的核心在于将查询复杂度分类法与QOL框架融入工作流设计,通过合理配置节点实现从用户输入到联网检索再到结果反馈的全流程优化。以下是结合理论与Dify特性的实用实现方案:
这张生成的图像能检测吗2 天前
人工智能·语言模型·故障诊断·车床技术
(论文速读)基于微调大语言模型的数控车床故障诊断论文题目:Fault diagnosis for Computer Numerical Control lathes based on the fine-tuned large language model(基于微调大语言模型的数控车床故障诊断)