人工智能

余俊晖37 分钟前
人工智能·算法·ocr·grpo
RLVR训练多模态文档解析模型-olmOCR 2技术方案(模型、数据和代码均开源)OLMOCR1.0: allenai开源多模态的文档智能解析大模型(OLMOCR)方法、效果浅析往期相关:
这张生成的图像能检测吗38 分钟前
人工智能·计算机视觉·图像生成·1024程序员节·开放词汇·3d重建
(论文速读)开放词汇3D场景理解的掩蔽点-实体对比论文题目:Masked Point-Entity Contrast for Open-Vocabulary 3D Scene Understanding(开放词汇3D场景理解的掩蔽点-实体对比)
大象耶2 小时前
论文阅读·人工智能·深度学习·计算机网络·机器学习
计算机视觉六大前沿创新方向1. 动态场景重建与可编辑建模基于4D高斯泼溅(4D-GS)实现动态场景的语义化重建与编辑,结合文本引导的3D资产生成流程,推动神经渲染技术向结构化、可控制方向演进。
TMT星球3 小时前
人工智能
加速进化发布Booster K1,打造AI时代的苹果公司10月24日程序员节,“2025加速进化生态大会”在北京国家速滑馆举办。大会现场,加速进化正式发布了入门级具身智能开发硬件平台——Booster K1,首批100台限时售价2.99万元。
tangchen。3 小时前
人工智能·计算机视觉·目标跟踪
YOLOv4 :兼顾速度与精度!YOLOv4 是一款在目标检测领域兼顾 “实时速度” 与 “检测精度” 的经典模型,虽更换了作者,但延续了 YOLO 系列的核心优势,尤其在细节优化和训练门槛降低上表现突出 —— 单 GPU 即可完成高质量训练,无需依赖复杂的多设备环境。
郑清3 小时前
java·人工智能·后端·ai·1024程序员节·springaialibaba
Spring AI Alibaba 10分钟快速入门本文案例源码笔记见:https://gitee.com/zhengqingya/java-workspace
学术头条3 小时前
人工智能·深度学习·计算机视觉
用视觉压缩文本!清华、智谱推出Glyph框架:通过视觉-文本压缩扩展上下文窗口长上下文(Long Context)建模,已成为大模型行业的前沿研究趋势,是使得大语言模型(LLM)具备真实生产力的关键。
Mrliu__3 小时前
人工智能·opencv·计算机视觉
Opencv(一): 用Opencv了解图像我们每天浏览的图片、视频,在计算机眼中并非“画面”,而是一串有规律的数字和数组。本文从底层原理到实操细节,逐点拆解计算机处理图像的核心逻辑,帮你建立“数字视角”理解图像。
墨香幽梦客4 小时前
大数据·人工智能
掌控制造脉络:电子元器件行业常用ERP系统概览与参考指南电子元器件制造行业面临着产品迭代迅速、供应链复杂多变以及对品质管控要求严苛等多重挑战。在这样的经营环境下,一套合适的企业资源规划(ERP)系统,能够帮助企业优化生产流程、管理库存并作出基于数据的决策。本文旨在对2025年市场上几款备受关注的、常出现在行业排行榜前十名中的常用ERP系统进行综合分析,为电子元器件制造企业提供一个客观的参考视角。
大模型知识营地5 小时前
人工智能
详解 astream 方法与 stream_mode,构建高级人机交互 Agent在之前的教程中,我们构建了基础的 AI Agent。但你可能已经发现,无论是使用 invoke() 还是用于调试的 astream_log(),用户体验都存在延迟——在Agent完成所有思考和工具调用之前,用户只能看到一个等待状态。 要构建一个能够与前端实时交互、提供良好用户体验的生产级应用,我们必须掌握 LangGraph 的核心流式传输机制 astream 方法及其 stream_mode 参数。这为我们提供了对图(Graph)执行过程中各个节点产生的数据进行精细化控制的能力。 本篇文章将完全摒弃伪代
知行力6 小时前
人工智能·百度·1024程序员节
百度PaddleOCR-VL:基于0.9B超紧凑视觉语言模型,支持109种语言,性能超越GPT-4o等大模型原文:https://mp.weixin.qq.com/s/zba1UAyqoKaTvOUIr6P_vg
deephub6 小时前
人工智能·python·大语言模型·1024程序员节·vllm
vLLM 性能优化实战:批处理、量化与缓存配置方案很多团队把它vLLM 当 demo 跑,但是其实这没把它系统能力发挥出来。这篇文章将介绍怎么让 vLLM 真正干活——持续输出高令牌/秒,哪些参数真正有用,以及怎么在延迟和成本之间做取舍。
云飞云共享云桌面6 小时前
运维·服务器·网络·人工智能·自动化·制造
东莞精密机械制造工厂5个SolidWorks设计共享一套软件在东莞这座制造业重镇,精密机械制造工厂正面临着数字化转型的关键挑战。作为典型的技术密集型企业,这些工厂每天需要处理大量复杂的三维设计任务,而SolidWorks作为行业标准的三维CAD软件,其正版授权费用高昂、硬件投入大、协作效率低等问题日益凸显。云飞云共享云桌面的出现,为这些企业提供了一种创新的解决方案。
Theodore_10226 小时前
人工智能·深度学习·机器学习·计算机视觉·线性回归·1024程序员节
机器学习(9)正则化在多特征模型中(例如多项式回归),当特征数量较多时,模型容易过拟合(Overfitting)。为此我们可以在代价函数中加入一个正则化项(Regularization Term),用于“惩罚”过大的参数,使模型更加平滑、泛化性更强。
莫叫石榴姐6 小时前
人工智能·机器学习·制造
半导体晶圆制造关于设备制程几个核心概念及映射关系目录一、基本定义(先明确术语)二、层级关系与映射逻辑1. 从生产流角度(逻辑流)2. 从设备执行角度(物理流)
Theodore_10226 小时前
人工智能·深度学习·机器学习·梯度下降·1024程序员节
机器学习(10)L1 与 L2 正则化详解在机器学习中,我们常常会遇到“过拟合”的问题。也就是说,模型在训练数据上表现得非常好,但在测试数据上却一塌糊涂。为了防止模型“记住”数据而不是“学习”规律,我们通常会在训练时加入一种约束,让模型不要太复杂——这就是正则化(Regularization)。
2501_927283586 小时前
运维·人工智能·机器人·自动化·制造·agv
WMS市场中的专业力量:为何天津荣联汇智是制造企业的重点关注对象在当今智能制造浪潮下,制造企业的仓库早已不再是简单的储物空间,而是连接生产与销售的关键枢纽。一个高效的WMS仓库管理系统能够帮助企业实现库存精准化管理、作业效率提升和成本有效控制,成为企业数字化转型中的重要一环。在众多WMS解决方案提供商中,天津荣联汇智智能科技有限公司凭借其深厚的行业积淀和技术实力,展现出独特的竞争优势。
梵得儿SHI6 小时前
人工智能·语言模型·prompt·提示词工程·结构化输出·engineering·ai交互
大型语言模型基础之 Prompt Engineering:打造稳定输出 JSON 格式的天气预报 Prompt在大型语言模型 (LLM) 如 GPT、Claude、文心一言等快速发展的今天,我们与 AI 的交互方式正在发生深刻变革。Prompt Engineering(提示词工程)作为连接人类意图与 AI 能力的桥梁,其重要性日益凸显。
赋创小助手6 小时前
服务器·人工智能·科技·ai·架构·边缘计算·1024程序员节
“短小精悍”的边缘AI算力利器:超微SYS-E403-14B-FRN2T服务器评测企业部署边缘服务器系统来满足工作负载对确定性延迟、易于维护和扩展空间的需求,而超微(Supermicro)的SYS-E403-14B-FRN2T恰好完美契合这些要求。这款短机身系统提供了一系列专为壁挂、机柜和浅深度机架设计的功能,特别专注于本地AI推理、视频分析、物联网和多接入边缘计算。开箱即用,它提供三个PCIe Gen5 x16 FHFL插槽、双10GbE网口,以及一个直观的存储布局——前置支持热插拔的NVMe硬盘位,并辅以内部固定的SATA硬盘位。
叶庭云6 小时前
人工智能·大语言模型·hugging face·1024程序员节·llms·开源模型文件结构·deepseek-v3.1
一文了解开源大语言模型文件结构,以 Hugging Face DeepSeek-V3.1 模型仓库为例🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/在当前 AI 技术讨论中经常提及 “大语言模型(Large Language Model,LLM)开源”,但它到底 “开” 出来什么?一个开源 LLM 究竟包含哪些核心组成部分?本文将介绍 DeepSeek-V3.1 模型文件由哪些部分组成,有助于理解大语言模型开源的具体内容和运行流程。