技术栈
推理
SunStriKE
15 天前
llm
·
源码阅读
·
推理
SgLang代码细读-3. Cache
因为kv cache有MHA,MLA,DoubleSparse 等多种自定义类型,需要进行一步抽象将框架和cache类型做隔离, 所以有了2级内存池的设计. 一级保存和cache类型无关的数据(token位置),跟具体业务隔离,二级给出抽象类接口, 不同的cache类型按需继承实现interface, 就能通过配置来进行管理.
小草cys
16 天前
分布式
·
部署
·
推理
·
deepseek
EXO分布式部署deepseek r1
EXO 是一个支持分布式 AI 计算的框架,可以用于在多个设备(包括 Mac Studio)上运行大语言模型(LLM)。以下是联调 Mac Studio 512GB 的步骤:
SunStriKE
17 天前
深度学习
·
llm
·
源码阅读
·
推理
SgLang代码细读-2.forward过程
Forward的主要过程围绕着 run_batch->TPModelWorker->ModelRunner->Model->layer->AttentionBackend->process_batch_result 这个链条展开
SunStriKE
18 天前
llm
·
推理
SgLang代码细读-1.从req到batch
sglang/python/sglang/srt/entrypoints/http_server.py launch_server 主要分4个步骤:
文慧的科技江湖
1 个月前
人工智能
·
开源
·
储能
·
训练
·
光伏
·
推理
图文结合 - 光伏系统产品设计PRD文档 -(慧哥)慧知开源充电桩平台
版本号:1.0 修订日期:2023年10月 作者:功能描述:实时采集并展示电站运行数据
OpenBayes
2 个月前
人工智能
·
深度学习
·
数据集
·
llama
·
视频生成
·
推理
·
蛋白质突变
OpenBayes 一周速览|1分钟生成完整音乐,DiffRhythm人声伴奏一键搞定; Stable Virtual Camera重塑3D视频创作
5 个数据集:* 302 例罕见病病例数据集* DRfold2 RNA 结构测试数据集* NaturalReasoning 自然推理数据集
文慧的科技江湖
2 个月前
人工智能
·
架构
·
开源
·
训练
·
推理
AI平台如何实现推理?数算岛是一个开源的AI平台(主要用于管理和调度分布式AI训练和推理任务。)
数算岛是一个开源的AI平台,主要用于管理和调度分布式AI训练和推理任务。它基于Kubernetes构建,支持多种深度学习框架(如TensorFlow、PyTorch等)。以下是数算岛实现模型推理的核心原理、架构及具体实现步骤:
iisugar
3 个月前
人工智能
·
学习
·
剪枝
·
量化
·
推理
AI学习第二天--大模型压缩(量化、剪枝、蒸馏、低秩分解)
目录1. 量化:压缩大象的“脂肪”比喻技术逻辑2. 剪枝:修剪大象的“无效毛发”比喻技术逻辑3. 知识蒸馏:让大象“师从巨象”
k layc
3 个月前
人工智能
·
深度学习
·
语言模型
·
自然语言处理
·
rag
·
推理
【论文解读】人大发表《Search-o1 — Agentic Search-Enhanced Large Reasoning Models》
近年来,大规模推理模型(Large Reasoning Models, LRMs)如 OpenAI-o1 展现出长链式思考(chain-of-thought)能力,能够通过分步推理解决复杂问题。然而,这些模型在长链推理过程中常常因知识不足而产生不确定性和错误,尤其是在遇到专业领域知识空缺时。为此,论文提出了 Search-o1 框架,其核心思想是:
CM莫问
4 个月前
人工智能
·
算法
·
语言模型
·
自然语言处理
·
大模型
·
推理
·
deepseek
<论文>DeepSeek-R1:通过强化学习激励大语言模型的推理能力
本文跟大家来一起阅读DeepSeek团队发表于2025年1月的一篇论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning | Papers With Code》,新鲜的DeepSeek-R1推理模型,作者规模属实庞大。
Hi20240217
5 个月前
人工智能
·
pytorch
·
python
·
rk3588
·
onnx
·
推理
RK3588-NPU pytorch-image-models 模型编译测试
羊羊洒洒_Blog
5 个月前
人工智能
·
语言模型
·
自然语言处理
·
openai
·
推理
·
o1
【翻译】审慎对齐:推理使更安全的语言模型成为可能
原文:https://arxiv.org/abs/2412.16339 出自OpenAI随着大规模语言模型对安全关键领域的影响越来越大,确保它们可靠地遵守定义良好的原则仍然是一个基本挑战。本文提出慎思校准,一种新的范式,直接教模型安全规范,并训练它在回答之前明确地回忆和准确地推理规范。我们使用这种方法来对齐OpenAI的o系列模型,并实现了对OpenAI安全政策的高度精确遵守,而不需要人工编写思维链或答案。审慎对齐提升了帕累托边界,提高了对越狱的鲁棒性,同时降低了过度拒绝率,还提高了分布外泛化能力。通过对
martian665
5 个月前
人工智能
·
数理逻辑
·
推理
·
决策系统
【人工智能离散数学基础】——深入详解数理逻辑:理解基础逻辑概念,支持推理和决策系统
数理逻辑(Mathematical Logic)是数学的一个分支,研究形式逻辑系统及其应用。它不仅为数学提供了严谨的基础,还在计算机科学、人工智能(AI)、哲学等领域中发挥着重要作用。数理逻辑的核心在于形式化推理和证明,支持复杂的推理和决策系统的构建。本文将深入探讨数理逻辑的基础概念,解析其在推理和决策系统中的应用,并通过示例代码帮助读者更好地理解这些概念。
山顶夕景
6 个月前
大模型
·
agent
·
推理
·
rewoo
【LLM-Agent】ReWOO模式和ReAct的区别
论文:《ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models》
SpikeKing
8 个月前
人工智能
·
swift
·
modelscope
·
多模态大模型
·
推理
·
mllm
·
微调框架
LLM - 配置 ModelScope SWIFT 测试 Qwen2-VL 模型推理(Infer) 教程 (1)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142827217
摩尔线程
8 个月前
人工智能
·
语言模型
·
llama
·
推理
·
kuae
在 MTT GPU 上使用 llama.cpp 推理
大语言模型因其出色的自然语言理解和生成能力而迅速被广泛使用,llama.cpp 大幅降低了进行大语言模型推理的门槛,MTT GPU 同样也是 llama.cpp 支持的运行平台,能够充分利用硬件的性能来助力用户的大语言模型应用。
网络研究院
9 个月前
人工智能
·
语言模型
·
自然语言处理
·
openai
·
技术
·
推理
·
能力
解码 OpenAI 的 o1 系列大型语言模型
OpenAI 表示,其 Strawberry 项目已升级为新的大型语言模型 (LLM) 系列,公司将其命名为 OpenAI o1。
人工智能培训咨询叶梓
9 个月前
人工智能
·
数学
·
ai
·
语言模型
·
自然语言处理
·
多模态
·
推理
全球和局部精细化:提升大模型推理能力的新方法
人工智能咨询培训老师叶梓 转载标明出处尽管大模型在数学、科学或编程任务上表现出优异的推理精细化能力,但它们在没有外部反馈的情况下,很难识别何时何地需要精细化。为了解决这一问题,来自Meta的FAIR团队和佐治亚理工学院的研究者们提出了一种新的方法——全球和局部精细化(Global and Local Refinements),旨在提升LLMs在没有外部反馈的情况下的自我精细化能力。
伊织code
1 年前
部署
·
llama
·
推理
·
recipes
llama-recipes
使用可组合的FSDP和PEFT方法 微调Meta Llama3,以覆盖单/多节点GPU的脚本。 支持用于摘要和问答等应用程序的默认和自定义数据集。 支持许多直接的推理解决方案,例如用于本地或云部署的 HF TGI、VLLM。 展示WhatsApp 和 Messenger 的 Meta Llama3的演示应用程序。
大数据AI人工智能培训专家培训讲师叶梓
1 年前
人工智能
·
深度学习
·
算法
·
语言模型
·
自然语言处理
·
推理
·
旅行规划
智能旅行规划的未来:大模型与形式化验证的融合
我们在做旅行规划时面对众多的目的地选择、复杂的交通连接、预算限制以及个人偏好等多重因素,即使是最有经验的旅行者也可能会陷入选择困境。传统的旅行规划方法往往依赖于人工操作,这不仅耗时耗力,而且难以保证计划的最优性和可执行性。