机器学习

sp_fyf_20244 分钟前
人工智能·深度学习·学习·机器学习·语言模型·自然语言处理
【大语言模型】从失败中学习:在微调大型语言模型作为智能体时整合负例大型语言模型在作为智能体与外部环境(如搜索引擎等工具)交互方面已取得成功。然而,LLMs 在预训练或对齐阶段主要是针对语言生成而非工具使用进行优化的,这限制了它们作为智能体的有效性。为了解决这个问题,先前的工作通常先收集 LLM 与环境之间的交互轨迹,但仅使用那些成功完成任务的轨迹来微调较小的模型。这种做法使得微调数据变得稀缺,且获取数据既困难又昂贵。丢弃失败的轨迹也导致了数据和资源的大量浪费,并限制了微调过程中的潜在优化路径。
hero_heart22 分钟前
人工智能·yolo·机器学习
YOLO 图像识别及C++配置yolo识别速度较快,如何使用yolo进行训练,预测和c++工程使用,本篇文章将详细讲一讲。一.下载YOLO
sp_fyf_202442 分钟前
人工智能·深度学习·神经网络·机器学习·语言模型·数据挖掘·音视频
【大语言模型】 AVGen-Bench:一个用于文本到音频-视频生成的多粒度、任务驱动型评估基准文本到音频-视频(T2AV)生成正迅速成为媒体创作的核心接口,然而其评估体系仍然支离破碎。现有的基准测试主要在隔离状态下评估音频和视频,或依赖粗糙的嵌入相似度,无法捕捉真实场景提示词所要求的细粒度联合正确性。为此,我们引入了AVGen-Bench,一个面向T2AV生成的任务驱动型基准测试,其特点是涵盖了11个真实世界类别的高质量提示词。为了支持全面的评估,我们提出了一个多粒度评估框架,该框架结合了轻量级专家模型和多模态大语言模型(MLLMs),能够实现从感知质量到细粒度语义可控性的评估。我们的评估揭示了模
落羽的落羽1 小时前
linux·服务器·c++·人工智能·python·算法·机器学习
【算法札记】练习 | Week1题目链接开胃小菜,依次枚举区间内的每个数,每个数判断每一位是否为2,对每个数不断%10,/10。题目链接
sp_fyf_20241 小时前
人工智能·深度学习·机器学习·语言模型·自然语言处理
【大语言模型】 是什么在驱动表示层操控?——关于操控模型拒绝机制的案例研究将操控向量(Steering Vectors)应用于大语言模型(LLMs)是一种高效且有效的模型对齐技术,但我们对其工作原理缺乏可解释的理解——具体来说,操控向量影响了哪些内部机制,以及这如何导致不同的模型输出。为了探究操控向量有效性背后的因果机制,我们对“拒绝”(refusal)这一概念进行了全面的案例研究。我们提出了一个多token激活修补(multi-token activation patching)框架,并发现当应用于同一层时,不同的操控方法利用了功能上可互换的电路(functionally i
AI科技星1 小时前
人工智能·学习·算法·机器学习·数据挖掘
基于v≡c第一性原理:密度的本质与时空动力学宇宙中所有物质与时空的运动,都遵循一条最底层的公理——时空绝对速度恒等于光速c(v≡c)。这条公理并非对狭义相对论的颠覆,而是对其核心结论的本源延伸;它不仅重构了我们对时空的底层认知,更从第一性原理出发,彻底揭示了“密度”的终极本质,以及引力、质量、基本相互作用的底层动力学逻辑。
kishu_iOS&AI1 小时前
人工智能·算法·机器学习·聚类
机器学习 —— 聚类算法目录一、概念二、聚类算法分类1.根据聚类颗粒度分类2.实现方式三、质心 和 簇第一步 ->第二步 ->
FluxMelodySun1 小时前
人工智能·算法·机器学习
机器学习(三十一) 半监督SVM与图半监督学习我们知道 SVM 试图找到最大间隔划分超平面。半监督支持向量机 (Semi-Supervised Support Vector Machine,简称S3VM) 试图找到能将两类有标记样本分开,且穿过数据低密度区域的划分超平面 -- 显然,这里的基本假设是"低密度分隔" (low-density separation),这是聚类假设在考虑了线性超平面划分后的推广。
管二狗赶快去工作!1 小时前
人工智能·机器学习
体系结构论文(108):Large Language Models for EDA: Future or Mirage?一、INTRO我认为这篇文章最值得反复看的图就是 Fig.1。Fig.1 把 survey 覆盖的话题放进了四象限里,并用四种 modality transformation 来解释:
kishu_iOS&AI1 小时前
人工智能·算法·机器学习·逻辑回归
机器学习 —— 逻辑回归(混淆矩阵)目录模型的预测结果与实际标签的对比情况精确率(Precision)召回率(Recall)F1-score
逻辑君9 小时前
人工智能·深度学习·神经网络·机器学习
认知神经科学研究报告【20260010】认知神经科学研究报告系列暂时告一段落,我说说我的心得体会: 最大的想法就是AI的涌现现象让我感到一种莫名其妙的担忧。
YBAdvanceFu12 小时前
人工智能·python·机器学习·数据挖掘·多智能体·智能体
从零构建智能体:深入理解 ReAct Plan Solve Reflection 三大经典范式摘要:通过亲手"造轮子",我们不仅掌握了 ReAct、Plan-and-Solve 和 Reflection 的核心原理,更深刻理解了它们各自的适用场景和工程挑战。本文包含完整代码实现和调试经验分享,适合对 Agent 开发感兴趣的开发者阅读。
AI应用实战 | RE14 小时前
人工智能·算法·机器学习·langchain
012、检索器(Retrievers)核心:从向量库中智能查找信息昨天深夜调试一个RAG应用,用户反馈“回答总偏离主题”。跟踪日志发现,检索器返回的前三条结果里,有两条压根不相关。这让我重新审视向量检索——看似简单的similarity_search背后,藏着不少门道。
liliangcsdn14 小时前
人工智能·机器学习·全文检索
MCP协议的深度分析与应用示例Anthropic于2024年发布的Model Context Protocol(MCP)是目前LLM和Agent工具的基础。
小鱼~~15 小时前
机器学习
守护进程和僵尸进程这是操作系统中两个完全不同的概念,一个是有意设计的特殊进程类型,另一个是进程结束后的临时状态。守护进程是运行在后台、不与终端交互、持续提供服务的进程。
Frank学习路上16 小时前
人工智能·机器学习·自动驾驶
【AI技能】跟着费曼学自动驾驶😏★,°:.☆( ̄▽ ̄)/$:.°★ 😏 探智求真,学以致用。 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下,下次更新不迷路🥞
克里斯蒂亚诺·罗纳尔达18 小时前
深度学习·学习·机器学习
智能体学习16——学习与适应(Learning-and-Adaptation)-深入解读LLM 学会了"说话",但说的内容不一定符合人类期望。对齐就是让模型"说人话、办人事"。直觉:想象你在调水温,PPO 说"每次只能转一点点,别一下从冷水转到开水"。ε 就是"每次最多转多少"的限制。
call me by ur name18 小时前
android·开发语言·人工智能·机器学习·ai·kotlin
ERNIE 5.0 Technical Report论文解读本报告介绍ERNIE 5.0——一款原生自回归基座模型,专为文本、图像、视频与音频的统一多模态理解与生成而设计。模型基于超稀疏混合专家(MoE)架构与模态无关专家路由机制,所有模态以统一的下一组令牌预测目标从零开始联合训练。
lisw0518 小时前
人工智能·机器学习
《计算机辅助设计与图形学学报》分析评介!《计算机辅助设计与图形学学报》是中国计算机辅助设计和计算机图形学领域第一个公开出版的学术期刊,创刊于1989年,经过36年的发展已成为国内CAD&CG领域的权威学术平台。
xiaoyaohou1119 小时前
算法·机器学习·剪枝
003、轻量化改进(一):网络剪枝原理与实战上周在客户现场调试YOLO模型,设备是某国产边缘计算盒子,算力只有2TOPS。原本在服务器上跑得飞快的YOLOv8n,移植上去直接卡成幻灯片——帧率不到3FPS。客户经理在旁边站着,现场安静得能听见散热风扇的哀嚎。