大模型

合合技术团队11 小时前
大数据·人工智能·算法·大模型·多模态
论文解读-对话中的多模态情感识别综述尽管基于文本的情感识别方法已经取得了显著的成就,但现实世界中的对话系统往往需要比单一模态所能提供的更加细腻的情感理解。因此,多模态情感识别(MERC)成为了提升人机交互自然性和情感理解的关键方向。其目标是通过整合文本、语音和视觉信号等不同模态的信息,准确地识别情感。本综述系统地概述了MERC,包括其动机、核心任务、代表性方法和评估策略。论文进一步探讨了最近的趋势,指出了关键挑战,并概述了未来的发展方向。随着对情感智能系统兴趣的增长,本综述为MERC研究的进展提供了及时的指导。
iioSnail11 小时前
spring boot·大模型·llm·mcp
Spring Boot 集成 Spring AI:实现可被大模型调用的 MCP Server项目代码: Github大家都知道利用大模型可以做Agent,让用户通过和大模型对话来实现工具调用。但是,很多企业想自己实现一个调用自己业务系统的大模型却不知道如何做。
KG_LLM图谱增强大模型1 天前
大数据·人工智能·算法·大模型·知识图谱·多模态
Vgent:基于图的多模态检索推理增强生成框架GraphRAG,突破长视频理解瓶颈沙特阿卜杜拉国王科技大学和Meta AI研究团队提出Vgent框架,通过构建视频语义图谱和结构化推理机制,显著提升大型视频语言模型在长视频理解任务中的表现,在MLVU基准测试中获得3.0%-5.4%的性能提升。
Thexhy1 天前
java·ai·大模型
Java大模型后端开发全流程指南用 Java 做大模型后端,整体可以理解为两件事:把“模型能力”包装成一个可靠的服务(API)让业务方(Web/小程序/APP/内部系统)能安全、高效地调用它
哥本哈士奇(aspnetx)1 天前
大模型
利用AI Agent,辅助销售团队制定培训和考试内容前段时间有朋友问,是否能利用AI技术来辅助销售团队进行培训。 这里我就用LangChain来构建一个简单的模型,构建一个AI Agent,来简单演示下实现的思路。 AI Agent也就是我们所说的智能体,相比大模型,它可以让大模型的手伸出来,来进行信息获取甚至一些实质的操作。 通过此篇你可以观察到,通过AI Agent,你给它一堆工具之后,它是否能正确的依次使用每一个工具,并且是否跟我们人工的思考方式是一样的。
九年义务漏网鲨鱼1 天前
前端·react.js·大模型·智能体
【Agentic RL 专题】五、深入浅出Reasoning and Acting (ReAct)🧔 这里是九年义务漏网鲨鱼,研究生在读,主要研究方向是人脸伪造检测,长期致力于研究多模态大模型技术;国家奖学金获得者,国家级大创项目一项,发明专利一篇,多篇论文在投,蓝桥杯国家级奖项、妈妈杯一等奖。 ✍ 博客主要内容为大模型技术的学习以及相关面经,本人已得到B站、百度、唯品会等多段多模态大模型的实习offer,为了能够紧跟前沿知识,决定写一个“从零学习 RL”主题的专栏。这个专栏将记录我个人的主观学习过程,因此会存在错误,若有出错,欢迎大家在评论区帮助我指出。除此之外,博客内容也会分享一些我在本科期间的
武子康2 天前
人工智能·深度学习·机器学习·ai·大模型·qwen·全模态
AI研究-129 Qwen2.5-Omni-7B 要点:显存、上下文、并发与成本Qwen2.5-Omni目前开源提供的是7亿参数(7B)版本。相对于GPT-4等数千亿参数的闭源模型,7B的规模非常小巧,这带来了低资源占用和易部署的优势。在FP16精度下模型权重约需14GB显存,使用INT4量化后可压缩到<4GB,使普通PC甚至高端手机都有能力运行。
冻感糕人~2 天前
java·人工智能·学习·语言模型·大模型·agent·大模型学习
Agent框架协议“三部曲”:MCP、A2A与AG-UI的协同演进纵观当前AI行业发展态势,基础模型训练领域正逐渐呈现集中化趋势,头部企业凭借资源优势形成显著优势;而在AI应用创新层面,却展现出百花齐放的活力,各类突破性应用持续涌现。在一个完整的AI应用体系中,用户、AI Agent与外部工具构成核心交互三角,如何实现三者间高效顺畅的通信,成为决定系统效能的关键所在。
九年义务漏网鲨鱼3 天前
人工智能·深度学习·算法·大模型·强化学习
【大模型面经】千问系列专题面经🧔 这里是九年义务漏网鲨鱼,研究生在读,主要研究方向是人脸伪造检测,长期致力于研究多模态大模型技术;国家奖学金获得者,国家级大创项目一项,发明专利一篇,多篇论文在投,蓝桥杯国家级奖项、妈妈杯一等奖。 ✍ 博客主要内容为大模型技术的学习以及相关面经,本人已得到B站、百度、唯品会等多段多模态大模型的实习offer,为了能够紧跟前沿知识,决定写一个“从零学习 RL”主题的专栏。这个专栏将记录我个人的主观学习过程,因此会存在错误,若有出错,欢迎大家在评论区帮助我指出。除此之外,博客内容也会分享一些我在本科期间的
WWZZ20253 天前
人工智能·深度学习·算法·机器人·大模型·卷积神经网络·具身智能
快速上手大模型:深度学习7(实践:卷积层)核心是将输入图像X中所有像素与每个输出像素相连,MLP思想。式中表示隐藏层中位置(i,j)处的像素,表示输入图像(k,l)处的像素,
山顶夕景3 天前
大模型·llm·强化学习·rl
【RL】ORPO: Monolithic Preference Optimization without Reference ModelL ORPO = E ( x , y w , y l ) [ L SFT + λ ⋅ L OR ] \mathcal{L}_{\text{ORPO}} = \mathbb{E}_{(x, y_w, y_l)} \left[ \mathcal{L}_{\text{SFT}} + \lambda \cdot \mathcal{L}_{\text{OR}} \right] LORPO=E(x,yw,yl)[LSFT+λ⋅LOR]
彡皮3 天前
开发语言·qt·大模型·千问7b
基于Qt,调用千问7B大模型,实现智能对话之前在工作中,没有接触过大模型,只是经常使用AI来解决问题。 换工作之后,前几天看了同事做的一个系统,集成大模型,将AI应用到了工作中,当时第一感觉是,我是不是落后了一个世纪。。。 于是从他们的只言片语中,去查阅相关资料,因为我对Qt比较熟悉,因此基于Qt,做了一个简单的智能模型对话框。
CoderJia程序员甲3 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-11-16)生成于:2025-11-16共发现热门项目: 18 个榜单类型:日榜本期GitHub热榜显示AI应用开发依然是绝对焦点,开发者正致力于将前沿AI技术转化为开箱即用的解决方案。舆情监控工具TrendRadar和谷歌的AI工具包adk-go引领了这股潮流,它们强调用AI解决信息过载和复杂流程自动化等实际问题。同时,轻量化RAG框架LightRAG和大模型记忆引擎Memori的流行,反映出社区对提升AI应用性能与效率的迫切需求。微软的AI呼叫中心项目则展示了AI在具体业务场景的深度集成。总体而言,榜单揭示了AI
哥本哈士奇3 天前
大模型
实现AI和BI整合的初步思路和探索-Part3前两篇探索了用code和dify的实现思路,实现起来均有一定的门槛。那么市面上有没有什么开源的现成产品已经对这个方向进行了探索呢?最近还真搜罗到了两个不错的产品,一个是飞致云下的SQLBot,还有一个是WrenAI。
是Dream呀4 天前
人工智能·大模型·aigc·音视频·deepseek
一个账号调用N个AI模型!从LLM到视频生成的丝滑解决方案前言:你是否遇到过这样的情况?项目需要接入多个AI模型,结果发现每个模型都要单独注册账号、申请API密钥、学习不同的SDK、写一大堆适配代码。OpenAI、DeepSeek、Claude、Qwen……光是维护这些平台的账号和代码就让人头大,更别提频繁切换测试时的效率损失了。
zhangbaolin4 天前
langchain·大模型·长期记忆·深度智能体·短期记忆
深度智能体-长短期记忆创建深度智能体时,如果不配置持久化存储,缺省使用基于状态的持久化后端。此时,文件系统保存在状态中,对话结束保存在其中的数据将丢失。为了跨线程共享数据,可以使用混合持久化后端,把不同路径的文件分别保存在状态中或者本地文件系统或数据库中。
宁渡AI大模型4 天前
人工智能·ai·大模型·qwen
从生成内容角度介绍开源AI大模型为了将大模型能力与公司现有工作流程深度融合,从而提升整体工作效率,公司计划在本地部署开源大模型。本调研报告旨在系统评估当前主流开源大模型,为本地化部署提供选型依据。
哥本哈士奇(aspnetx)4 天前
大模型
实现AI和BI整合的初步思路和探索-Part3前两篇探索了用code和dify的实现思路,实现起来均有一定的门槛。那么市面上有没有什么开源的现成产品已经对这个方向进行了探索呢?最近还真搜罗到了两个不错的产品,一个是飞致云下的SQLBot,还有一个是WrenAI。
DogDaoDao4 天前
人工智能·语言模型·架构·大模型·transformer·循环神经网络·对抗网络
大语言模型四大核心技术架构深度解析2017年,Google团队在《Attention Is All You Need》中提出的Transformer架构彻底改变了序列建模范式。与传统循环神经网络(RNN)逐 token 处理不同,Transformer 通过自注意力机制实现了序列的并行处理,这一突破使其成为 BERT、GPT 等革命性模型的基础。
三条猫4 天前
人工智能·机器学习·3d·ai·大模型·cad
AI 大模型如何给 CAD 3D 模型“建立语义”?这几年,大模型逐渐把文字、图像、视频都“读懂”了,但唯独在 CAD 3D 模型面前吃了瘪。原因其实很简单: 图像是像素,文字是字符,而 3D 模型是 几何 + 拓扑 + 工程意图 的混合物。 它不是自然生成的,而是人类设计出来的结果。