大模型

世优科技虚拟人19 分钟前
人工智能·大模型·人机交互·数字人·智能交互
AI数字人企业产品图谱解析:2D/3D数字人AI交互开发技术指南在人工智能与虚拟技术快速融合的今天,数字人已从概念走向规模化应用,其产品形态、开发流程及交互技术的演进,正深刻影响着政务、文旅、教育、医疗等行业的服务模式与用户体验。本文将从第三方视角,梳理当前数字人领域的关键技术路径与产品逻辑。
程序员鱼皮2 小时前
计算机·ai·程序员·大模型·互联网·编程
女友怒骂国内不能用Claude Code,于是我给她做了一个大家好,我是程序员鱼皮。最近女友开始学习 AI 编程了(被我带的),她听说 Claude Code 这个 AI 编程工具很牛掰,结果试了下发现得要国外的 Claude 账号才能登陆。
七夜zippoe2 小时前
架构·大模型·多模态·轻量·qwen3
轻量级多模态模型实战:从Qwen3-VL-4B到企业级应用目录🎯 摘要一、技术原理深度解析1.1 架构设计理念:轻量级与高性能的平衡术1.1.1 混合架构设计
喜欢吃豆3 小时前
人工智能·语言模型·架构·大模型·deepseek
深度解析DeepSeek大语言模型架构演进——从多头注意力机制到 DeepSeek 核心技术体系 (DeepSeek-MoE, MTP, MLA)——从多头注意力机制到 DeepSeek 核心技术体系 (DeepSeek-MoE, MTP, MLA)
Elwin Wong3 小时前
人工智能·大模型·llm
关于熵的一些概念及其计算最近在看 verl 的源码学习强化学习的相关实现,看到了一个计算熵的函数,感觉挺有意思:在人工智能深度学习领域,模型训练有很多数学的理论做支撑,但从数学公式转化为具体的代码实现,往往不能直接按原公式的计算逻辑编写代码进行计算,因为数学是比较理想的,而真正要把数据放到计算机中进行处理,则需要考虑很多问题,比如计算是否稳定、数值会不会溢出等等,因此通常需要对原公式做一些转换,熵的计算就是如此,当然还有很多其他的例子,比如 softmax 的计算等等。本文就借此机会聊聊与熵相关的一些内容。
南太湖小蚂蚁3 小时前
人工智能·大模型·人机交互
基于LangChain1.0的人机交互式大模型调用方法LangChain 是一款开源框架,内置智能体架构,且可与任意模型或工具集成。LangChain1.0是一个非常大的革新,比如create_agent可以方面的创建ReAct模式的智能体,中间件的推出可以实现人机交互、动态系统提示词、动态注入上下文等等,通过向工作流中预埋中间件,能够实现工作流的高效拓展和可定制化。
模型启动机4 小时前
人工智能·ai·chatgpt·大模型
对话奥特曼:OpenAI的真实未来蓝图在一次深度对谈中,山姆·奥特曼勾勒了OpenAI的长期蓝图:真正的护城河不是模型智商,而是“记忆”。通过可自主选择的深度记忆、不断增强的情感互动,以及多设备协同的上下文计算,ChatGPT正从工具演变为长期陪伴者。
我很哇塞耶4 小时前
大数据·人工智能·ai·大模型
2025年加倍投入AI的九大品牌到2025年,生成式AI已成为品牌营销、创意和产品开发的核心工具。联合利华、美泰、多邻国、Klarna、CaliBBQ、通用汽车、Intuit、可口可乐和迪士尼等企业通过AI提升内容生产效率、降低成本、增强创意,同时探索广告、产品设计和客户互动新模式。
hzp66614 小时前
大数据·大模型·llm·aigc·数据存储
新兴存储全景与未来架构走向报告的主要逻辑和核心内容可以概括为下图:报告重点分析了四种有潜力的新兴存储技术,它们的定位和特点各不相同:
我很哇塞耶16 小时前
人工智能·ai·大模型
OpenAI最新发布,企业级AI智能体的强化微调实践在2025年QCon AI NYC大会上,OpenAI的Will Hang和Wenjie Zi共同呈现了一场关于企业级AI智能体优化的深度分享。他们重点介绍了Agent RFT(强化微调)这一创新方法,这是一种专门为工具使用型AI智能体设计的强化学习微调技术,旨在显著提升智能体在多步骤任务中的表现。
暴风鱼划水17 小时前
人工智能·语言模型·大模型·llm
大型语言模型(入门篇)B简单来说,可以将大型语言模型(LLM)想象成一位知识渊博、功能多样的助手,能够理解并生成人类语言。然而,像任何助手一样,它需要指令才能明白你需要它完成什么样的任务。这个指令,即你提供给LLM以引导其行为的文本,被称为提示词。 交互通常遵循以下流程: 提示词可以有多种形式,例如:
娃乐呵20 小时前
语言模型·大模型·excel·数据处理
免费的大批量Excel文档大模型处理数据工具我们提出了一种可以利用大模型批量对Excel条目做分类、汇总等操作的工具。工具地址:基于大模型批量分析Excel文件
小女孩真可爱1 天前
人工智能·pytorch·深度学习·学习·大模型
大模型学习记录(九)-------AgentAgent(智能代理)是一种能够自主执行任务、做出决策并与环境交互的智能系统。在AI领域,Agent通常指的是结合了大语言模型(LLM)和工具调用能力的智能实体,能够理解用户意图,规划执行步骤,并通过调用外部工具来完成复杂任务。
CoderJia程序员甲1 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-23)生成于:2025-12-23共发现热门项目: 17 个榜单类型:日榜本期GitHub热榜凸显AI技术全面渗透各领域的强劲趋势,尤其聚焦于智能体实战应用与效率提升工具。以EXO为代表的项目让分布式AI集群平民化,结合Anthropic Skills和PentestGPT等项目,显示AI智能体正从概念走向可部署的实用工具,赋能网络安全与自动化渗透测试。同时,Google的LangExtract和vLLM-Omni等项目推动了大模型的高效推理与多模态信息抽取,解决了实际生产中的性能瓶颈问题。DeepAudit等
我很哇塞耶1 天前
人工智能·ai·大模型
打破模态壁垒!DSE:以文档截图为核心的多模态检索范式2024年EMNLP上,滑铁卢大学团队提出的文档截图嵌入(Document Screenshot Embedding, DSE) 范式,为这一痛点提供了颠覆性解决方案。该方法将任意文档转化为截图作为统一输入,无需任何内容提取预处理,直接通过视觉语言模型编码为密集向量,完美保留文档的文本、图像、布局等全部信息。
KG_LLM图谱增强大模型2 天前
人工智能·大模型·知识图谱·向量存储·多模态
[谷歌最新白皮书]嵌入与向量存储:打开AI多模态数据处理的钥匙本文深入探讨嵌入技术与向量数据库在现代机器学习中的核心作用。嵌入将文本、图像、音频等异构数据转换为统一的向量表示,实现高效的语义搜索和检索。文章详细介绍了嵌入的原理、类型、向量搜索技术及实际应用场景,特别强调了在检索增强生成(RAG)等前沿应用中的价值。
人工智能培训2 天前
人工智能·深度学习·神经网络·大模型·dnn·具身智能·智能体
DNN案例一步步构建深层神经网络(3)
模型启动机2 天前
人工智能·ai·大模型·ocr
告别OCR与分块!ICLR 2025 ColPali实现视觉文档检索精度&速度双碾压来自Illuin Technology、巴黎中央理工-高等电力学院、苏黎世联邦理工学院等机构的团队,在2025年ICLR会议上提出了颠覆性解决方案——ColPali模型与ViDoRe基准测试,直接通过文档图像生成嵌入向量,完美融合文本与视觉信息,彻底简化检索流程并实现性能飞跃。
人工智能培训2 天前
人工智能·深度学习·神经网络·大模型·dnn·ai大模型·具身智能
国内外知名大模型及应用近年来,随着人工智能技术的迅猛发展,大模型(Large Models)已成为推动科技进步的重要引擎。大模型通常指参数量巨大、训练数据广泛、具备强大泛化能力的深度学习模型,尤其在自然语言处理(NLP)、计算机视觉和多模态任务中表现突出。国内外科技企业与研究机构纷纷投入资源研发大模型,推动其在多个领域的实际应用。本文将系统梳理国内外知名的大模型及其典型应用场景。
CoderJia程序员甲2 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-22)生成于:2025-12-22共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI与安全技术深度融合成为主导趋势,分布式AI集群项目exo让开发者能用日常设备构建私有AI基础设施,PentestGPT和PayloadsAllTheThings凸显AI赋能网络安全实战的迫切需求。同时模型优化工具unsloth和ComfyUI-GGUF推动大模型高效部署,而crawl4ai和SurfSense则展现LLM与多源数据整合的能力,这些项目共同指向AI技术正朝着实用化、平民化和高性能方向发展,为开发者