语言模型

Zzj_tju2 小时前
人工智能·语言模型
Prompt Engineering 为什么不够了:从“写好提示词”到“构建可靠上下文系统”系列:生产级 LLM 应用方法论 01 日期:2026-06-10 适合读者:刚开始用大模型的产品/运营同学、正在做 LLM 应用落地的工程师、关注 LLM 系统论文与技术路线的研究生读者。
生成论实验室3 小时前
人工智能·语言模型·系统架构·机器人·自动驾驶·agi·安全架构
六十四卦态势操作系统技术白皮书版本:V1.0 日期:2026年6月 作者:周林东 公司:莆田字序生命科技有限公司本文提出一种全新的操作系统范式:以六十四卦完备态势空间为内核,以事件关系网络为语法,以降U动力学为驱动的态势操作系统(Situational Operating System,简称SOS)。与传统操作系统管理硬件“资源”不同,态势操作系统管理的是系统内外的“事件”,并实时判断当前情境,自主调度资源、切换策略、保障安全。本文将从理论基础、系统架构、核心优势、应用场景及技术路线图等方面,系统阐述这一操作系统的设计蓝图。
羊羊小栈3 小时前
人工智能·语言模型·毕业设计·知识图谱·创业创新·neo4j·大作业
基于GraphRAG的医疗健康知识诊断系统(Neo4j_大语言模型)b站演示视频与部署教程视频(点击这里) https://www.bilibili.com/video/BV1BKJK6wEkJ/?share_source=copy_web&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1
workflower4 小时前
人工智能·算法·机器学习·设计模式·语言模型·自然语言处理·重构
基于机器学习的设备故障预测分析方法数据准备(Data preparation)——数据处理(Merging data sources)——特征工程(Feature engineering: lag feature, static feature)——建模(Modeling: Bin-class, regression, multi-class)——训练、仿真(Training, Simulation)——决策(Decision)
Omics Pro5 小时前
数据库·人工智能·机器学习·语言模型·自然语言处理·chatgpt
中医临床决策5款大语言模型,谁主沉浮?中医临床决策需整合辨证论治、体质评估与个体化方药,难以标准化与质控。大语言模型具备医学知识整合与临床推理能力,但其在中医领域的应用,尤其在辨证与组方方面,仍未被充分探索。
有来有去95275 小时前
人工智能·深度学习·语言模型·gpu算力·vllm
【训推框架】Vime-大规模 LLM/VLM 强化学习训练框架Versatile Infrastructure for Model Evolution — 基于 Megatron + vLLM 的大规模 LLM/VLM 强化学习训练框架
开维游戏引擎15 小时前
android·游戏·语言模型·游戏引擎·ai编程
AI自动生成游戏时,deepseek和mimo对比vscode+cline+skill自动生成游戏时,免费版本的deepseek和mimo生成游戏质量对比,以deepseek-v4-flash和xiaomi/mimo-v2.5为例。
文艺倾年1 天前
人工智能·python·语言模型·自然语言处理·面试·职场和发展·大模型
【强化学习】强化学习基本概念,20W字总结(一)😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【强化学习】强化学习基本概念,20W字总结(一),期待与你一同探索、学习、进步,一起卷起来叭!
MartinYeung51 天前
人工智能·学习·语言模型
[论文学习]大型语言模型中个人可识别资讯(PII)的机器遗忘技术:UnlearnPII 基准与 PERMU_tok 方法的深度分析Machine Unlearning of Personally Identifiable Information in LLMs 核心问题与动机
生成论实验室1 天前
人工智能·语言模型·机器人·自动驾驶·安全架构
认知芯片:让判断力在物理定律上运行——AI芯片的第三条路CPU、GPU、NPU,无论架构怎么变,本质都是同一件事:执行计算指令。它们比拼的是谁算得快、谁功耗低、谁晶体管密度高。摩尔定律、韬定律,都是围绕“计算”展开的。
黄狗操作员1 天前
语言模型·云计算·运维开发·gpu算力
NCCL 2.29 官方文档参数解读Broadcast属于1对多的通信原语,一个数据发送者,多个数据接收者,可以在集群内把一个节点自身的数据广播到其他节点上。如下图所示,圈圈表示集群中的训练加速卡节点,相同的颜色的小方块则代表相同的数据。当主节点 0 执行Broadcast时,数据即从主节点0被广播至其他节点。
来自于狂人1 天前
人工智能·算法·语言模型·自然语言处理
第5章 记忆管理——让Agent记住事情第4章我们给Agent加上了工具调用能力。它现在能查数据库、查天气、计算数字了。但你用着用着会发现一个尴尬的问题:这Agent怎么聊着聊着就忘了事呢?
皮皮蟹虾饺1 天前
人工智能·语言模型·自然语言处理
MiniMind:从零训练大语言模型全流程实战指南大语言模型(Large Language Model, LLM)的出现,引发了全球范围内对 AI 的空前关注。无论是 ChatGPT、DeepSeek 还是 Qwen,都以惊艳的效果让人真切感受到这场技术浪潮的冲击力。然而,动辄数百亿参数的模型规模,使得它们对个人设备而言不仅难以训练,甚至连部署都显得遥不可及。
ai_coder_ai1 天前
运维·语言模型·自动化
在自动化脚本中如何调用大语言模型?在自动化技术与人工智能深度融合的当下,单纯的流程化自动化脚本已难以应对复杂的交互、问答、内容生成等场景。将大语言模型能力嵌入自动化脚本,能够让传统自动化工具拥有语义理解、智能应答、内容创作、问题分析等高级能力,极大拓展自动化脚本的应用边界。本文从技术原理、前期准备、接口详解、实操案例、参数调优与应用拓展等维度,详细讲解在冰狐智能辅助自动化脚本中对接大语言模型的完整流程,帮助开发者和脚本使用者顺利实现自动化与 AI 能力的结合。
皮皮蟹虾饺1 天前
人工智能·语言模型·自然语言处理
MiniMind 预训练详解:从零训练一个 64M 参数的语言模型📌 本文亮点:深入解析 MiniMind 预训练的每一步细节——模型架构、数据准备、训练脚本、超参配置、Loss 曲线与训练指标,帮你真正理解 LLM 预训练的全过程!
带娃的IT创业者1 天前
人工智能·macos·语言模型·视觉语言模型·apple silicon·mlx·mac本地推理
深度解析:当 MLX 遇上视觉语言模型,Mac 本地推理的新范式在当今的人工智能开发领域,"本地化"与"隐私优先"正逐渐成为继云端大模型之后的下一个战场。对于长期身处 Apple 生态的开发者而言,Apple Silicon 芯片的强大算力往往在日常开发中被低估。直到最近,一个名为 mlx-vlm 的项目在技术社区引发了热烈讨论,它不仅展示了在 Mac 上运行视觉语言模型的可能性,更以极高的效率和易用性,为中级开发者提供了一个探索多模态 AI 的绝佳入口。这不仅仅是一个工具的发布,更标志着个人计算机正在从单纯的代码编辑器转变为强大的 AI 工作站。
羊羊小栈1 天前
前端·人工智能·语言模型·自然语言处理·毕业设计·大作业
基于混合检索RAG的食品生产质量问答系统(BGE_BM25_大语言模型)b站演示视频与部署教程视频(点击这里) https://www.bilibili.com/video/BV1phJs6oEB4/?share_source=copy_web&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1
毒爪的小新2 天前
linux·人工智能·ai·语言模型·vllm
Linux 环境极速部署 vLLM:从零搭建生产级大模型推理服务vLLM 是一个开源的、高性能的大语言模型推理与服务框架,吞吐量可达传统方案的8-20倍。GPU:NVIDIA 显卡(推荐 RTX 3090/4060/4090 或 A100/H100)
如此这般英俊2 天前
人工智能·python·语言模型
手搓Claude Code-第三章 permission第三章,shareAI讲述了给模型加权限的过程。完整代码见 https://github.com/shareAI-lab/learn-claude-code/blob/main/s03_permission/code.py   我们的任务是:   1,了解check_deny_list, check_rules, ask_user三道闸门组成的permission   2,滤清楚权限检查的逻辑
MartinYeung52 天前
学习·安全·语言模型
[论文学习]大型语言模型(LLM)安全与隐私-基于善、恶、丑的深度分析A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly