大模型

小小工匠11 小时前
计算机视觉·大模型·skyvern
LLM - 大模型与计算机视觉融合:Skyvern核心技术架构揭秘长期以来,网页自动化一直困扰着开发者和数据工程师。无论是使用 Selenium、Puppeteer,还是更现代的 Playwright,这些工具的强大之处毋庸置疑,但都不可避免地深陷复杂的 DOM 结构、XPath 或 CSS Selector 操作之中。一旦网站结构发生变化,自动化脚本极易失效率低下。如今,随着大语言模型(LLM)和计算机视觉(Computer Vision)的浪潮席卷全行业,自动化领域也迎来了革命性的变革。本文将带领大家认识一款 Github 超过 17.6k star 的开源新星——
Keep_Trying_Go12 小时前
人工智能·pytorch·语言模型·大模型·多模态·lightning
LightningCLI教程 + 视频讲解视频讲解1:Bliibili视频讲解视频讲解2:https://www.douyin.com/video/7575471066336873747
模型启动机12 小时前
人工智能·ai·大模型·ocr·deepseek
DeepSeek OCR vs Qwen-3 VL vs Mistral OCR:谁更胜一筹?在数字化转型加速推进的当下,企业对高效AI文档处理系统的需求日益迫切。然而,面对市场上多款功能相近的光学字符识别(OCR)模型,开发人员在选型过程中往往面临决策困境。模型在处理速度、识别精度、成本控制等关键维度的表现,直接影响文档处理系统的整体效能与业务落地价值,因此筛选兼具高效性与适配性的模型成为核心诉求。
山顶夕景13 小时前
大模型·多模态·视频生成·sora
【LLM-video】HunyuanVideo-1.5视频生成模型解决视频生成中的高效推理和高视觉质量问题:1、轻量级高性能架构:提出了一个高效的架构,集成了一个83亿参数的扩散变压器(DiT)和一个3D因果VAE,实现了空间维度上的16倍压缩和时间轴上的4倍压缩。
CoderJia程序员甲13 小时前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-11-20)生成于:2025-11-20共发现热门项目: 18 个榜单类型:日榜本期GitHub热榜显示AI应用开发势头强劲,开发焦点从底层模型转向高效能、易部署的终端解决方案。热点项目如TrendRadar实现了AI舆情分析即开即用,LightRAG优化了RAG检索速度,Google的adk-go和微软的AI呼叫中心则推动智能体构建平民化。技术趋势凸显AI正深度融入工作流,开发者致力于降低技术壁垒,通过Docker、MCP工具链和轻量化设计,让复杂AI能力快速解决信息过滤、智能对话等实际问题,赋能高效开发。
星云数灵14 小时前
人工智能·ai·大模型·生成式ai·ai赋能·传媒科技·传媒ai
AI赋能传媒科技创新研究报告传统传媒行业长期面临内容生产成本高、传播效率低、用户互动弱等结构性痛点。随着AI技术的深度渗透,传媒机构正从单纯的内容发布者转变为集内容创作、智能分发、用户运营于一体的综合服务平台。这一转型不仅提升了内容生产的自动化水平,也增强了对用户需求的动态响应能力。
WWZZ20251 天前
人工智能·深度学习·神经网络·算法·机器人·大模型·具身智能
快速上手大模型:深度学习5(实践:过、欠拟合)目录1 调用库2 生成数据集3 格式转换4 检查数据是否正确生成及转换5 模型训练及测试6 拟合情况6.1正常拟合
core5121 天前
langchain·大模型·qwen·text2sql
LangChain实现Text2SQL1.代码实现2.实现效果 3.建表语句
帮帮志2 天前
人工智能·ai·语言模型·大模型·智能
01.【AI大模型对话】通过简化大语言模型(LLM)技术来实现对话提示:帮帮志会陆续更新非常多的IT技术知识,希望分享的内容对您有用。本章分享的是springboot的使用。前后每一小节的内容是存在的有:学习and理解的关联性。【帮帮志系列文章】:每个知识点,都是写出代码和运行结果且前后关联上的去分析和说明(能大量节约您的时间)。
模型启动机2 天前
人工智能·ai·大模型
黄仁勋GTC开场:「AI-XR Scientist」来了!读了那么多 paper,会做实验么?LabOS: 当 AI 不仅会思考,更能 “看见”、“指导” 并“操作”真实实验,一个人类与机器智能共同进化的科学发现新时代,正悄然开启。
WWZZ20252 天前
人工智能·深度学习·神经网络·算法·机器人·大模型·具身智能
快速上手大模型:深度学习10(卷积神经网络2、模型训练实践、批量归一化)(1)减小batch size(最有效);(2)降低输入分辨率resize;(3)减少模型复杂度 / 层数 / 通道数;
WWZZ20252 天前
人工智能·深度学习·神经网络·算法·机器人·大模型·具身智能
快速上手大模型:深度学习9(池化层、卷积神经网络1)目录1 作用2 代码2.1 最大/平均池化层2.2 填充和步幅2.3 多个通道3 卷积神经网络算法3.1 背景
大千AI助手2 天前
数据结构·人工智能·机器学习·二叉树·大模型·平衡二叉树·大千ai助手
平衡二叉树:机器学习中高效数据组织的基石本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
九年义务漏网鲨鱼2 天前
人工智能·深度学习·算法·架构·大模型·强化学习
【多模态大模型面经】现代大模型架构(一): 组注意力机制(GQA)和 RMSNorm🧔 这里是九年义务漏网鲨鱼,研究生在读,主要研究方向是人脸伪造检测,长期致力于研究多模态大模型技术;国家奖学金获得者,国家级大创项目一项,发明专利一篇,多篇论文在投,蓝桥杯国家级奖项、妈妈杯一等奖。 ✍ 博客主要内容为大模型技术的学习以及相关面经,本人已得到B站、百度、唯品会等多段多模态大模型的实习offer,为了能够紧跟前沿知识,决定写一个“从零学习 RL”主题的专栏。这个专栏将记录我个人的主观学习过程,因此会存在错误,若有出错,欢迎大家在评论区帮助我指出。除此之外,博客内容也会分享一些我在本科期间的
CoderJia程序员甲3 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-11-15)生成于:2025-11-15共发现热门项目: 18 个榜单类型:日榜本期GitHub热榜显示AI应用开发和智能代理技术仍是核心焦点,信息处理与自动化工具需求旺盛。以多平台热点AI分析工具和高效RAG框架为代表的轻量化方案显著提升了开发效率,AI智能体构建工具包则为复杂任务提供了代码优先的灵活控制能力。开源教材库和面试指南等资源型项目持续热门,反映出开发者对实用知识和技能提升的强烈需求。同时,AI工具破解和云原生中间件的流行,也体现了社区对技术可及性与生产级部署的高度关注。
喜欢吃豆3 天前
中间件·架构·langchain·大模型
LangChain v1.0 技术研究报告:架构范式向智能体中间件与图运行时的演进LangChain v1.0 的发布标志着大语言模型(LLM)应用开发领域的一次根本性变革。此版本并非单纯的功能迭代,而是对框架核心哲学的重构。它超越了 v0.1 及更早版本定义的线性“链式(Chain)”架构,确立了以 智能体工作流(Agentic Workflows)、中间件驱动的定制化(Middleware-driven Customization) 以及 基于图的运行时(Graph-based Runtime) 为核心的新一代基础标准。
合合技术团队4 天前
大数据·人工智能·算法·大模型·多模态
论文解读-对话中的多模态情感识别综述尽管基于文本的情感识别方法已经取得了显著的成就,但现实世界中的对话系统往往需要比单一模态所能提供的更加细腻的情感理解。因此,多模态情感识别(MERC)成为了提升人机交互自然性和情感理解的关键方向。其目标是通过整合文本、语音和视觉信号等不同模态的信息,准确地识别情感。本综述系统地概述了MERC,包括其动机、核心任务、代表性方法和评估策略。论文进一步探讨了最近的趋势,指出了关键挑战,并概述了未来的发展方向。随着对情感智能系统兴趣的增长,本综述为MERC研究的进展提供了及时的指导。
iioSnail4 天前
spring boot·大模型·llm·mcp
Spring Boot 集成 Spring AI:实现可被大模型调用的 MCP Server项目代码: Github大家都知道利用大模型可以做Agent,让用户通过和大模型对话来实现工具调用。但是,很多企业想自己实现一个调用自己业务系统的大模型却不知道如何做。
KG_LLM图谱增强大模型4 天前
大数据·人工智能·算法·大模型·知识图谱·多模态
Vgent:基于图的多模态检索推理增强生成框架GraphRAG,突破长视频理解瓶颈沙特阿卜杜拉国王科技大学和Meta AI研究团队提出Vgent框架,通过构建视频语义图谱和结构化推理机制,显著提升大型视频语言模型在长视频理解任务中的表现,在MLVU基准测试中获得3.0%-5.4%的性能提升。