技术栈
元数据
程序员三明治
13 天前
java
·
人工智能
·
后端
·
llm
·
元数据
·
rag
·
向量化
【AI】从文本到向量:理解Embedding的作用
到这一步,知识库里的每个 chunk 已经有了清晰的上下文信息。但还有一个核心问题没有解决:这些内容仍然是自然语言,计算机并不能真正理解它们的含义。
SL-staff
17 天前
源码分析
·
规则引擎
·
元数据
·
决策表
·
jvs-rules
·
规则流
·
可视化设计器
JVS-Rules决策表与规则流设计实战(附源码分析)
规则引擎的核心价值在于将业务决策从代码中解耦,实现规则的热部署与可视化维护。本文以JVS-Rules为例,深入解析决策表(Decision Table)与规则流(Rule Flow)的设计原理与实现细节,包含元数据模型、规则编译、执行引擎、源码片段及性能优化策略。通过一个完整的贷款审批案例,展示如何将复杂的if-else逻辑转换为可配置的规则,并对比硬编码与规则引擎的维护成本差异。
程序员三明治
19 天前
人工智能
·
llm
·
知识库
·
元数据
·
rag
·
java后端
RAG 元数据的作用与管理:让知识库回答可追溯、可过滤、可维护
上一篇我们聊了 RAG 中的文本分块(Chunking):如何把长文档拆成适合检索的小块。分块解决的是“长文本如何变成可检索单元”的问题,但它没有回答另一个关键问题:这些文本块从哪里来、属于哪个业务范围、当前是否生效、谁可以查看、出了问题怎么回溯。
luoyayun361
20 天前
qt
·
ffmpeg
·
音视频
·
元数据
·
获取音视频文件属性
Qt + FFmpeg 实战:获取音视频文件基础属性、流信息和元数据
在音视频工具开发中,文件信息解析是非常基础但又非常重要的一步。无论是做播放器、转码工具、音频分析工具,还是媒体管理软件,都需要先知道一个文件里包含什么内容。
Aloudata
2 个月前
大数据
·
人工智能
·
数据治理
·
元数据
·
数据血缘
AI 时代如何通过主动元数据构建高质量、可追溯的语义底座?
摘要:随着大模型与AI应用的爆发,传统元数据管理在精度、实时性和自动化方面面临挑战。以算子级血缘为核心的主动元数据平台,通过实现自动化资产盘点、全链路风险防控和主动模型治理,正驱动数据治理从“人治”转向“机治”,为DataOps和RAG等AI应用提供高质量、可追溯的语义底座。本文深度解析了这一技术范式及其在金融行业的实践价值。
Aloudata
2 个月前
数据库
·
sql
·
数据治理
·
数据管理
·
元数据
·
数据血缘
PL/SQL 存储过程血缘解析指南:攻克数据治理的「最后堡垒」
摘要:PL/SQL存储过程因动态SQL、临时表、复杂逻辑嵌套,成为传统数据血缘工具的解析盲区,准确率常低于80%,导致数据治理链路黑盒化。本文深入分析其技术瓶颈,并系统介绍如何通过算子级血缘技术,实现对存储过程内部逻辑的白盒化透视,将解析准确率提升至99%以上,为自动化资产盘点、精准变更影响分析和DataOps协同提供可信的技术基石。
AllData公司负责人
2 个月前
数据库
·
实时数仓
·
元数据
·
streampark
·
数据血缘
·
openmetadata
AllData数据中台集成开源项目OpenMetaData,建设元数据与数据血缘平台!
AllData数据中台通过集成开源项目OpenMetaData构建元数据管理平台,元数据管理平台是通过全面的元数据采集、强大的存储与检索、深度的分析与治理、灵活的应用与共享、高扩展性与定制化以及直观的用户体验,为企业提供了一站式的元数据管理解决方案。
Henb929
2 个月前
元数据
# 元数据管理平台设计:构建企业级数据资产地图
痛点一:数据找不到痛点二:血缘不清楚痛点三:口径不一致量化价值:公司: 某电商平台 规模: 日订单 100 万 +,数据团队 50 人 数据规模: Hive 表 3000+,日增作业 500+
没有bug.的程序员
4 个月前
java
·
低代码
·
架构
·
插件化
·
元数据
·
扩展机制
低代码平台后端引擎:元数据驱动架构、插件化内核与 Java 扩展机制
前言:别让“低代码”成了只会画 UI 的空中楼阁在当今的企业级软件开发中,低代码(Low-Code)早已不再是一个单纯的营销概念。它代表了软件工程从“手工编织”向“工业化装配”的范式转移。然而,市面上大多数关于低代码的讨论都集中在前端拖拽,而忽略了真正决定平台生命力的灵魂——后端引擎(Backend Engine)。
Aloudata
5 个月前
大数据
·
数据库
·
数据治理
·
元数据
·
数据血缘
数据治理新解法:基于算子级血缘的主动元数据如何破解数仓重构难题?
本文首发于 Aloudata 官方技术博客:《数仓重构不敢动刀?主动元数据如何帮你「看清」15 层依赖链路》转载请注明出处。
Aloudata
5 个月前
数据挖掘
·
自动化
·
apache
·
元数据
·
数据血缘
数据治理选型对比:Apache Atlas vs 商业平台在存储过程解析与自动化治理的实测分析
本文首发于 Aloudata 官方技术博客:《选型对比:Apache Atlas vs 商业元数据平台存储过程解析能力实测》转载请注明出处。
Aloudata
5 个月前
金融
·
数据治理
·
元数据
·
noetl
·
数据血缘
金融数据治理新范式:如何用算子级血缘与主动元数据 10分 钟定位 EAST 报送异常?
本文首发于 Aloudata 官方技术博客:《EAST 报送前夜数据异常:如何用主动元数据 10 分钟定位根因?》 转载请注明出处。
Aloudata
5 个月前
数据库
·
数据挖掘
·
数据治理
·
元数据
·
数据血缘
破解监管溯源难题:从表级血缘到算子级血缘的数据治理升级
摘要:在金融强监管背景下,传统表级血缘因精度不足,无法满足监管对指标口径和字段来源的精准追溯要求,导致数据团队陷入低效的“考古式”排查。本文深入探讨了数据治理中“最后一公里”的困局,并介绍了如何通过算子级血缘和主动元数据技术,实现监管指标的自动化盘点与精准溯源,将盘点周期从数月缩短至小时级,有效支撑 DataOps 流程与合规风控。
Aloudata
5 个月前
数据挖掘
·
数据治理
·
元数据
·
数据血缘
告别 90% 误报率:基于算子级血缘实现精准数据治理与变更影响分析
本文首发于 Aloudata 官方技术博客:《变更影响分析误报率 90%?因为你还在用表级血缘做「假分析」》载请注明出处。
Aloudata
5 个月前
sql
·
自动化
·
数据治理
·
元数据
·
数据血缘
EAST 口径文档自动化生成:破解 SQL 过滤条件解析难题,实现 20 倍效率提升
本文首发于 Aloudata 官方技术博客:《一表痛、EAST、1104 报表口径文档自动生成:解析 SQL 过滤条件,一键溯源与保鲜》转载请注明出处。
北京地铁1号线
5 个月前
知识图谱
·
元数据
·
graphrag
1.3 元数据(Metadata)管理
在RAG中,元数据是“关于数据块的数据”。它不仅仅是附加信息,而是实现精准检索、可信溯源和高效过滤的关键。
wxl781227
6 个月前
元数据
·
rag
保险类文档 RAG 全流程实现方案
整页为单 Chunk:将单页保险文档作为 1 个检索单元(Chunk),保留内容逻辑关联性;元数据对齐:文档入库的元数据字段与提问提取的元数据字段完全一致,确保过滤检索精准;
腾飞开源
7 个月前
人工智能
·
元数据
·
检索增强生成
·
spring ai
·
chatclient
·
对话记忆
·
流式api
04_Spring AI 干货笔记之对话客户端 API
ChatClient 提供了用于与 AI 模型通信的流式 API,支持同步和流式两种编程模型。关于 ChatClient 中命令式与响应式编程模型结合使用的说明,请参阅本文档末尾的实现说明。
ITVV
7 个月前
元数据
元数据 Unity Catalog v0.3.0 安装
以下图片来自网络检查 JAVA 版本,需要 17执行命令(编译加启动)首先停止start-uc-server
ITVV
7 个月前
ui
·
元数据
元数据 Unity Catalog v0.3.0 UI
需要先启动UC server (./bin/start-uc-server)浏览器打开地址: http://192.168.71.129:3000/