语言模型

高性能服务器7 小时前
大数据·语言模型·llm·aigc·gpu算力·智算中心·ai算力
英伟达 2025 CES:GPU与智算中心协同驱动 GPU算力智能变革2025年1月7日,英伟达CEO黄仁勋在 2025 CES 上的演讲再次将 AI 算力推到聚光灯下,揭示了智算中心与 GPU 协同驱动智能变革的新路径。
一叶青枫13 小时前
ui·docker·语言模型·容器
解决Docker中使用 Open WebUI识别不到本地ollama中的模型1. 识别不到本地ollama中模型的原因:Docker中的Open WebUI没有连接到本地ollama的端口。
Natsuagin13 小时前
windows·ai·语言模型
在Windows上轻松部署本地大语言模型:Ollama与Open-WebUI的完整指南欢迎来到本教程!本文将详细介绍如何在 Windows 系统 上安装和使用 Ollama 和 Open-WebUI,这两个强大的工具将帮助您轻松管理和运行大型语言模型。Ollama 简化了模型的下载与部署,而 Open-WebUI 则提供了一个直观的图形用户界面,使用户能够更方便地与模型进行交互。
GOSIM 全球开源创新汇15 小时前
图像处理·人工智能·语言模型
可部署于所有设备上的开源加速 Stable-Diffusion.cpp:让 AI 图像生成更快、更高效!在 AI 生成图像领域,Stable Diffusion 已经成为一个里程碑式的工具,凭借其强大的图像生成能力,被广泛应用于艺术创作、商业设计等领域。然而,生成高质量图像的过程常常需要付出大量的时间和内存,这对于硬件资源有限的设备来说是一大挑战。
feifeikon17 小时前
人工智能·语言模型·自然语言处理
大模型GUI系列论文阅读 DAY1:《基于大型语言模型的图形用户界面智能体:综述》图形用户界面(Graphical User Interfaces, GUIs)长期以来一直是人机交互的核心,为用户提供了直观且以视觉为驱动的方式来访问和操作数字系统。传统上,GUI交互的自动化依赖于基于脚本或规则的方法,这些方法在固定工作流中虽行之有效,但缺乏动态和实际应用场景中所需的灵活性和适应性。大型语言模型(Large Language Models, LLMs),尤其是多模态模型的出现,开启了GUI自动化的新纪元。这些模型在自然语言理解、代码生成、任务泛化以及视觉处理方面展现出卓越能力,为新一代“
GISer Liu17 小时前
人工智能·python·gpt·深度学习·机器学习·语言模型·transformer
Transformer详解:Attention机制原理Hello,大家好,我是GISer Liu😁,一名热爱AI技术的GIS开发者,本系列文章是作者参加DataWhale2025年1月份学习赛,旨在讲解Transformer模型的理论和实践。😲
三月七(爱看动漫的程序员)18 小时前
前端·人工智能·语言模型·自然语言处理·prompt·知识图谱
One Prompt is not Enough: Automated Construction of a Mixture-of-Expert Prompts一个提示是不够的:自动构建专家提示的混合论文地址:https://ar5iv.org/html/2407.00256 项目地址:https://github.com/turningpoint-ai/mixture-of-prompts
从零开始学习人工智能1 天前
人工智能·语言模型·自然语言处理
“提升大语言模型推理与规划能力的策略:思维链提示与由少至多提示”思维链提示(Chain-of-Thought Prompting)和由少至多提示(Least-to-Most Prompting)是两种提升大语言模型在推理和规划任务上表现的有效方法。下面详细介绍这两种方法的原理和应用:
XianxinMao1 天前
人工智能·算法·语言模型
《多模态语言模型:一个开放探索的技术新领域》这个领域目前正处于快速发展阶段,技术路径和标准仍在探索中,开放和透明将是推动其发展的关键因素。从多个角度展开分析:
三月七(爱看动漫的程序员)2 天前
数据库·人工智能·深度学习·学习·语言模型·自然语言处理
Active Prompting with Chain-of-Thought for Large Language Models大型语言模型的思维链主动提示论文地址:https://arxiv.org/abs/2302.12246 项目地址:https://github.com/shizhediao/active-prompt
UQI-LIUWJ2 天前
人工智能·语言模型·自然语言处理
论文略读:ASurvey of Large Language Models for Graphs2024 KDD、设计 LLMs 能够理解的prompt将图转换为特定方式的序列,并通过微调方法对齐图 token 序列和自然语言 token 序列
AI趋势预见2 天前
人工智能·深度学习·神经网络·语言模型·自然语言处理·金融·llm
基于金融新闻的大型语言模型强化学习在投资组合管理中的应用“Financial News-Driven LLM Reinforcement Learning for Portfolio Management”
Space655362 天前
人工智能·语言模型·自然语言处理
论文速读|NoteLLM: A Retrievable Large Language Model for Note Recommendation.WWW24论文地址:https://arxiv.org/abs/2403.01744 bib引用:Keywords:Large Language Model; Recommendation; Hashtag Generation
hao_wujing2 天前
人工智能·语言模型·自然语言处理
通过视觉语言模型蒸馏进行 3D 形状零件分割大家读完觉得有帮助记得关注和点赞!!!对应英文要求比较高,特此说明!This paper proposes a cross-modal distillation framework, PartDistill, which transfers 2D knowledge from vision-language models (VLMs) to facilitate 3D shape part segmentation. PartDistill addresses three major challenges
XianxinMao2 天前
人工智能·语言模型·自然语言处理
《多模态语言模型的局限性与生态系统发展现状分析》推理能力问题技术实现挑战评测标准问题应用场景局限技术改进生态建设重点总体来看,多模态语言模型虽有局限,但这更多是技术成熟度的问题,而非根本性障碍。通过各方共同努力,这些问题有望逐步得到解决。
古月居GYH2 天前
人工智能·语言模型·自然语言处理
工业界主流大语言模型后训练技术综述:偏好对齐与能力提升在人工智能领域,大语言模型的发展日新月异,其性能优化成为研究焦点。本文聚焦工业界主流开源大语言模型(LLM)的后训练技术,着重剖析训练算法与数据处理环节,探寻模型性能提升的核心要素。
是小白_鸭2 天前
ai·语言模型·自然语言处理
(RAG系列) FastGPT工作流的http请求模块使用fastgpt v4.8.10question接收传入的变量,msg集合则是包含返回的变量,fastgpt的工作流的http请求模块填写 url -> http://xxxx:5000/deal_response
是小白_鸭2 天前
ai·语言模型·自然语言处理
(RAG系列) FastGPT通过API调用工作流问答fastgpt v4.8.10注意两个参数stream 是否流式输出detail 是否体现工作流过程细节
i鹰斯坦爱吃红烧you3 天前
人工智能·pytorch·python·深度学习·语言模型·自然语言处理·transformer
探索 Transformer²:大语言模型自适应的新突破目录一、来源:论文链接:https://arxiv.org/pdf/2501.06252代码链接:SakanaAI/self-adaptive-llms
蜉蝣1号3 天前
人工智能·ai·语言模型·aigc
【已解决】我和ollama运行的qwen2.5大模型通信,总是返回GGGG?和大模型通信的时候,总是返回 GGG 之类的乱码。 curl查询返回到结果: 既然curl通信不行,直接在控制台聊天呢? 话都说不明白,我火了,结果一查,我熄火了,是ollama的锅。