元数据

程序员三明治13 天前
java·人工智能·后端·llm·元数据·rag·向量化
【AI】从文本到向量:理解Embedding的作用到这一步,知识库里的每个 chunk 已经有了清晰的上下文信息。但还有一个核心问题没有解决:这些内容仍然是自然语言,计算机并不能真正理解它们的含义。
SL-staff17 天前
源码分析·规则引擎·元数据·决策表·jvs-rules·规则流·可视化设计器
JVS-Rules决策表与规则流设计实战(附源码分析)规则引擎的核心价值在于将业务决策从代码中解耦,实现规则的热部署与可视化维护。本文以JVS-Rules为例,深入解析决策表(Decision Table)与规则流(Rule Flow)的设计原理与实现细节,包含元数据模型、规则编译、执行引擎、源码片段及性能优化策略。通过一个完整的贷款审批案例,展示如何将复杂的if-else逻辑转换为可配置的规则,并对比硬编码与规则引擎的维护成本差异。
程序员三明治19 天前
人工智能·llm·知识库·元数据·rag·java后端
RAG 元数据的作用与管理:让知识库回答可追溯、可过滤、可维护上一篇我们聊了 RAG 中的文本分块(Chunking):如何把长文档拆成适合检索的小块。分块解决的是“长文本如何变成可检索单元”的问题,但它没有回答另一个关键问题:这些文本块从哪里来、属于哪个业务范围、当前是否生效、谁可以查看、出了问题怎么回溯。
luoyayun36120 天前
qt·ffmpeg·音视频·元数据·获取音视频文件属性
Qt + FFmpeg 实战:获取音视频文件基础属性、流信息和元数据在音视频工具开发中,文件信息解析是非常基础但又非常重要的一步。无论是做播放器、转码工具、音频分析工具,还是媒体管理软件,都需要先知道一个文件里包含什么内容。
Aloudata2 个月前
大数据·人工智能·数据治理·元数据·数据血缘
AI 时代如何通过主动元数据构建高质量、可追溯的语义底座?摘要:随着大模型与AI应用的爆发,传统元数据管理在精度、实时性和自动化方面面临挑战。以算子级血缘为核心的主动元数据平台,通过实现自动化资产盘点、全链路风险防控和主动模型治理,正驱动数据治理从“人治”转向“机治”,为DataOps和RAG等AI应用提供高质量、可追溯的语义底座。本文深度解析了这一技术范式及其在金融行业的实践价值。
Aloudata2 个月前
数据库·sql·数据治理·数据管理·元数据·数据血缘
PL/SQL 存储过程血缘解析指南:攻克数据治理的「最后堡垒」摘要:PL/SQL存储过程因动态SQL、临时表、复杂逻辑嵌套,成为传统数据血缘工具的解析盲区,准确率常低于80%,导致数据治理链路黑盒化。本文深入分析其技术瓶颈,并系统介绍如何通过算子级血缘技术,实现对存储过程内部逻辑的白盒化透视,将解析准确率提升至99%以上,为自动化资产盘点、精准变更影响分析和DataOps协同提供可信的技术基石。
AllData公司负责人2 个月前
数据库·实时数仓·元数据·streampark·数据血缘·openmetadata
AllData数据中台集成开源项目OpenMetaData,建设元数据与数据血缘平台!AllData数据中台通过集成开源项目OpenMetaData构建元数据管理平台,元数据管理平台是通过全面的元数据采集、强大的存储与检索、深度的分析与治理、灵活的应用与共享、高扩展性与定制化以及直观的用户体验,为企业提供了一站式的元数据管理解决方案。
Henb9292 个月前
元数据
# 元数据管理平台设计:构建企业级数据资产地图痛点一:数据找不到痛点二:血缘不清楚痛点三:口径不一致量化价值:公司: 某电商平台 规模: 日订单 100 万 +,数据团队 50 人 数据规模: Hive 表 3000+,日增作业 500+
没有bug.的程序员4 个月前
java·低代码·架构·插件化·元数据·扩展机制
低代码平台后端引擎:元数据驱动架构、插件化内核与 Java 扩展机制前言:别让“低代码”成了只会画 UI 的空中楼阁在当今的企业级软件开发中,低代码(Low-Code)早已不再是一个单纯的营销概念。它代表了软件工程从“手工编织”向“工业化装配”的范式转移。然而,市面上大多数关于低代码的讨论都集中在前端拖拽,而忽略了真正决定平台生命力的灵魂——后端引擎(Backend Engine)。
Aloudata5 个月前
大数据·数据库·数据治理·元数据·数据血缘
数据治理新解法:基于算子级血缘的主动元数据如何破解数仓重构难题?本文首发于 Aloudata 官方技术博客:《数仓重构不敢动刀?主动元数据如何帮你「看清」15 层依赖链路》转载请注明出处。
Aloudata5 个月前
数据挖掘·自动化·apache·元数据·数据血缘
数据治理选型对比:Apache Atlas vs 商业平台在存储过程解析与自动化治理的实测分析本文首发于 Aloudata 官方技术博客:《选型对比:Apache Atlas vs 商业元数据平台存储过程解析能力实测》转载请注明出处。
Aloudata5 个月前
金融·数据治理·元数据·noetl·数据血缘
金融数据治理新范式:如何用算子级血缘与主动元数据 10分 钟定位 EAST 报送异常?本文首发于 Aloudata 官方技术博客:《EAST 报送前夜数据异常:如何用主动元数据 10 分钟定位根因?》 转载请注明出处。
Aloudata5 个月前
数据库·数据挖掘·数据治理·元数据·数据血缘
破解监管溯源难题:从表级血缘到算子级血缘的数据治理升级摘要:在金融强监管背景下,传统表级血缘因精度不足,无法满足监管对指标口径和字段来源的精准追溯要求,导致数据团队陷入低效的“考古式”排查。本文深入探讨了数据治理中“最后一公里”的困局,并介绍了如何通过算子级血缘和主动元数据技术,实现监管指标的自动化盘点与精准溯源,将盘点周期从数月缩短至小时级,有效支撑 DataOps 流程与合规风控。
Aloudata5 个月前
数据挖掘·数据治理·元数据·数据血缘
告别 90% 误报率:基于算子级血缘实现精准数据治理与变更影响分析本文首发于 Aloudata 官方技术博客:《变更影响分析误报率 90%?因为你还在用表级血缘做「假分析」》载请注明出处。
Aloudata5 个月前
sql·自动化·数据治理·元数据·数据血缘
EAST 口径文档自动化生成:破解 SQL 过滤条件解析难题,实现 20 倍效率提升本文首发于 Aloudata 官方技术博客:《一表痛、EAST、1104 报表口径文档自动生成:解析 SQL 过滤条件,一键溯源与保鲜》转载请注明出处。
北京地铁1号线5 个月前
知识图谱·元数据·graphrag
1.3 元数据(Metadata)管理在RAG中,元数据是“关于数据块的数据”。它不仅仅是附加信息,而是实现精准检索、可信溯源和高效过滤的关键。
wxl7812276 个月前
元数据·rag
保险类文档 RAG 全流程实现方案整页为单 Chunk:将单页保险文档作为 1 个检索单元(Chunk),保留内容逻辑关联性;元数据对齐:文档入库的元数据字段与提问提取的元数据字段完全一致,确保过滤检索精准;
腾飞开源7 个月前
人工智能·元数据·检索增强生成·spring ai·chatclient·对话记忆·流式api
04_Spring AI 干货笔记之对话客户端 APIChatClient 提供了用于与 AI 模型通信的流式 API,支持同步和流式两种编程模型。关于 ChatClient 中命令式与响应式编程模型结合使用的说明,请参阅本文档末尾的实现说明。
ITVV7 个月前
元数据
元数据 Unity Catalog v0.3.0 安装以下图片来自网络检查 JAVA 版本,需要 17执行命令(编译加启动)首先停止start-uc-server
ITVV7 个月前
ui·元数据
元数据 Unity Catalog v0.3.0 UI需要先启动UC server (./bin/start-uc-server)浏览器打开地址: http://192.168.71.129:3000/