大模型

Thexhy1 小时前
java·ai·大模型
Java大模型后端开发全流程指南用 Java 做大模型后端,整体可以理解为两件事:把“模型能力”包装成一个可靠的服务(API)让业务方(Web/小程序/APP/内部系统)能安全、高效地调用它
哥本哈士奇(aspnetx)5 小时前
大模型
利用AI Agent,辅助销售团队制定培训和考试内容前段时间有朋友问,是否能利用AI技术来辅助销售团队进行培训。 这里我就用LangChain来构建一个简单的模型,构建一个AI Agent,来简单演示下实现的思路。 AI Agent也就是我们所说的智能体,相比大模型,它可以让大模型的手伸出来,来进行信息获取甚至一些实质的操作。 通过此篇你可以观察到,通过AI Agent,你给它一堆工具之后,它是否能正确的依次使用每一个工具,并且是否跟我们人工的思考方式是一样的。
九年义务漏网鲨鱼9 小时前
前端·react.js·大模型·智能体
【Agentic RL 专题】五、深入浅出Reasoning and Acting (ReAct)🧔 这里是九年义务漏网鲨鱼,研究生在读,主要研究方向是人脸伪造检测,长期致力于研究多模态大模型技术;国家奖学金获得者,国家级大创项目一项,发明专利一篇,多篇论文在投,蓝桥杯国家级奖项、妈妈杯一等奖。 ✍ 博客主要内容为大模型技术的学习以及相关面经,本人已得到B站、百度、唯品会等多段多模态大模型的实习offer,为了能够紧跟前沿知识,决定写一个“从零学习 RL”主题的专栏。这个专栏将记录我个人的主观学习过程,因此会存在错误,若有出错,欢迎大家在评论区帮助我指出。除此之外,博客内容也会分享一些我在本科期间的
武子康11 小时前
人工智能·深度学习·机器学习·ai·大模型·qwen·全模态
AI研究-129 Qwen2.5-Omni-7B 要点:显存、上下文、并发与成本Qwen2.5-Omni目前开源提供的是7亿参数(7B)版本。相对于GPT-4等数千亿参数的闭源模型,7B的规模非常小巧,这带来了低资源占用和易部署的优势。在FP16精度下模型权重约需14GB显存,使用INT4量化后可压缩到<4GB,使普通PC甚至高端手机都有能力运行。
冻感糕人~11 小时前
java·人工智能·学习·语言模型·大模型·agent·大模型学习
Agent框架协议“三部曲”:MCP、A2A与AG-UI的协同演进纵观当前AI行业发展态势,基础模型训练领域正逐渐呈现集中化趋势,头部企业凭借资源优势形成显著优势;而在AI应用创新层面,却展现出百花齐放的活力,各类突破性应用持续涌现。在一个完整的AI应用体系中,用户、AI Agent与外部工具构成核心交互三角,如何实现三者间高效顺畅的通信,成为决定系统效能的关键所在。
九年义务漏网鲨鱼2 天前
人工智能·深度学习·算法·大模型·强化学习
【大模型面经】千问系列专题面经🧔 这里是九年义务漏网鲨鱼,研究生在读,主要研究方向是人脸伪造检测,长期致力于研究多模态大模型技术;国家奖学金获得者,国家级大创项目一项,发明专利一篇,多篇论文在投,蓝桥杯国家级奖项、妈妈杯一等奖。 ✍ 博客主要内容为大模型技术的学习以及相关面经,本人已得到B站、百度、唯品会等多段多模态大模型的实习offer,为了能够紧跟前沿知识,决定写一个“从零学习 RL”主题的专栏。这个专栏将记录我个人的主观学习过程,因此会存在错误,若有出错,欢迎大家在评论区帮助我指出。除此之外,博客内容也会分享一些我在本科期间的
WWZZ20252 天前
人工智能·深度学习·算法·机器人·大模型·卷积神经网络·具身智能
快速上手大模型:深度学习7(实践:卷积层)核心是将输入图像X中所有像素与每个输出像素相连,MLP思想。式中表示隐藏层中位置(i,j)处的像素,表示输入图像(k,l)处的像素,
山顶夕景2 天前
大模型·llm·强化学习·rl
【RL】ORPO: Monolithic Preference Optimization without Reference ModelL ORPO = E ( x , y w , y l ) [ L SFT + λ ⋅ L OR ] \mathcal{L}_{\text{ORPO}} = \mathbb{E}_{(x, y_w, y_l)} \left[ \mathcal{L}_{\text{SFT}} + \lambda \cdot \mathcal{L}_{\text{OR}} \right] LORPO=E(x,yw,yl)[LSFT+λ⋅LOR]
彡皮2 天前
开发语言·qt·大模型·千问7b
基于Qt,调用千问7B大模型,实现智能对话之前在工作中,没有接触过大模型,只是经常使用AI来解决问题。 换工作之后,前几天看了同事做的一个系统,集成大模型,将AI应用到了工作中,当时第一感觉是,我是不是落后了一个世纪。。。 于是从他们的只言片语中,去查阅相关资料,因为我对Qt比较熟悉,因此基于Qt,做了一个简单的智能模型对话框。
CoderJia程序员甲2 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-11-16)生成于:2025-11-16共发现热门项目: 18 个榜单类型:日榜本期GitHub热榜显示AI应用开发依然是绝对焦点,开发者正致力于将前沿AI技术转化为开箱即用的解决方案。舆情监控工具TrendRadar和谷歌的AI工具包adk-go引领了这股潮流,它们强调用AI解决信息过载和复杂流程自动化等实际问题。同时,轻量化RAG框架LightRAG和大模型记忆引擎Memori的流行,反映出社区对提升AI应用性能与效率的迫切需求。微软的AI呼叫中心项目则展示了AI在具体业务场景的深度集成。总体而言,榜单揭示了AI
哥本哈士奇2 天前
大模型
实现AI和BI整合的初步思路和探索-Part3前两篇探索了用code和dify的实现思路,实现起来均有一定的门槛。那么市面上有没有什么开源的现成产品已经对这个方向进行了探索呢?最近还真搜罗到了两个不错的产品,一个是飞致云下的SQLBot,还有一个是WrenAI。
是Dream呀2 天前
人工智能·大模型·aigc·音视频·deepseek
一个账号调用N个AI模型!从LLM到视频生成的丝滑解决方案前言:你是否遇到过这样的情况?项目需要接入多个AI模型,结果发现每个模型都要单独注册账号、申请API密钥、学习不同的SDK、写一大堆适配代码。OpenAI、DeepSeek、Claude、Qwen……光是维护这些平台的账号和代码就让人头大,更别提频繁切换测试时的效率损失了。
zhangbaolin3 天前
langchain·大模型·长期记忆·深度智能体·短期记忆
深度智能体-长短期记忆创建深度智能体时,如果不配置持久化存储,缺省使用基于状态的持久化后端。此时,文件系统保存在状态中,对话结束保存在其中的数据将丢失。为了跨线程共享数据,可以使用混合持久化后端,把不同路径的文件分别保存在状态中或者本地文件系统或数据库中。
宁渡AI大模型3 天前
人工智能·ai·大模型·qwen
从生成内容角度介绍开源AI大模型为了将大模型能力与公司现有工作流程深度融合,从而提升整体工作效率,公司计划在本地部署开源大模型。本调研报告旨在系统评估当前主流开源大模型,为本地化部署提供选型依据。
哥本哈士奇(aspnetx)3 天前
大模型
实现AI和BI整合的初步思路和探索-Part3前两篇探索了用code和dify的实现思路,实现起来均有一定的门槛。那么市面上有没有什么开源的现成产品已经对这个方向进行了探索呢?最近还真搜罗到了两个不错的产品,一个是飞致云下的SQLBot,还有一个是WrenAI。
DogDaoDao3 天前
人工智能·语言模型·架构·大模型·transformer·循环神经网络·对抗网络
大语言模型四大核心技术架构深度解析2017年,Google团队在《Attention Is All You Need》中提出的Transformer架构彻底改变了序列建模范式。与传统循环神经网络(RNN)逐 token 处理不同,Transformer 通过自注意力机制实现了序列的并行处理,这一突破使其成为 BERT、GPT 等革命性模型的基础。
三条猫3 天前
人工智能·机器学习·3d·ai·大模型·cad
AI 大模型如何给 CAD 3D 模型“建立语义”?这几年,大模型逐渐把文字、图像、视频都“读懂”了,但唯独在 CAD 3D 模型面前吃了瘪。原因其实很简单: 图像是像素,文字是字符,而 3D 模型是 几何 + 拓扑 + 工程意图 的混合物。 它不是自然生成的,而是人类设计出来的结果。
小新学习屋4 天前
chatgpt·大模型·提示工程
大模型-提示工程分为两种:基础大预言模型(Base LLM)、指令微调大语言模型(Instruction Tuned LLM)。
zhangbaolin4 天前
langchain·大模型·人机交互·深度智能体
深度智能体-人机回环与图和智能体一样,在深度智能体中也需要对一些有潜在风险的工具调用进行检查和确认,可以在创建深度智能体时通过interrupt_on来对不同的工具配置不同的检查策略。对于工具—策略键值对,如果策略为True,则允许所有的策略(approve, edit, reject),如果策略为False,则不允许工具有中断,策略为allowed:{},则可以更细粒度控制策略。本文将对深度智能体的人机回环进行详细介绍。
zhangbaolin4 天前
中间件·langchain·大模型·深度智能体
深度智能体的中间件与langchian agent一样,深度智能体也使用中间件,不过二者是有区别的,langchain agent的中间件是通过在模型调用、工具调用时插入实现对智能体运行的细粒度控制,而深度智能体的中间件则抽象层次更高,主要支持规划、持久化和创建子智能体。深度智能体支持模块化的中间件架构,当深度智能体被创建时自带以上所说的三种中间件,待办列表中间件(TodoListMiddleware),文件系统中间件( FilesystemMiddleware)和子智能体中间件(SubAgentMiddleware),同