元数据 Unity Catalog v0.3.0 安装

架构

以下图片来自网络

支持

架构

功能

生态

目录对象模型

安装

克隆 Unity Catalog 源码

bash 复制代码
git clone git@github.com:unitycatalog/unitycatalog.git

检查 JAVA 版本,需要 17

执行命令(编译加启动)

bash 复制代码
# 服务启动默认使用 8080 端口
./bin/start-uc-server

# 在特定端口启动
./bin/start-uc-server -p <port_number>
./bin/start-uc-server -port <port_number>

打包

首先停止start-uc-server

打包

bash 复制代码
./build/sbt createTarball

解压安装

bash 复制代码
tar -xvf /opt/module/unitycatalog/target/unitycatalog-0.3.0-SNAPSHOT.tar.gz -C /opt/module/unitycatalog-0.3.0-SNAPSHOT

管理

配置

配置文件

vim ./etc/conf/server.properties

bash 复制代码
server.env=dev
## Identity Provider authorization parameters
# examples:
# authorization=enable
# authorization-url=https://accounts.google.com/o/oauth2/auth
# token-url=https://oauth2.googleapis.com/token
# client-id=111122223333-abab1212cdcd3434.apps.googleusercontent.com
# client-secret=GOCSPX-ababfoobarcdcd-5q
server.authorization=disable
server.authorization-url=
server.token-url=
server.client-id=
server.client-secret=
server.redirect-port=
# D-Days H-Hours M-Minutes S-Seconds (P5D = 5 days,PT5H = 5 hours, PT5M = 5 minutes, PT5S = 5 seconds)
server.cookie-timeout=P5D

## Experimental Feature Flags
# Enable MANAGED table (experimental feature)
# Default: false (disabled)
server.managed-table.enabled=false

# Define the model storage root.  Cloud storage or file based allowed.
# If no root specified, the current working directory of the server is used.

#storage-root.models=s3://my-s3-bucket/root
#storage-root.models=abfs://file_system@account_name.dfs.core.windows.net/root
#storage-root.models=gs://my-gc-bucket/root
storage-root.models=file:///tmp/ucroot

# Define the managed table storage root. Cloud storage or file based allowed.
# If no root specified, defaults to file:///tmp/ucroot
# Managed tables will be stored under this root in the path: {storage-root.tables}/tables/{tableId}

#storage-root.tables=s3://my-s3-bucket/tables
#storage-root.tables=abfs://file_system@account_name.dfs.core.windows.net/tables
#storage-root.tables=gs://my-gc-bucket/tables
storage-root.tables=file:///tmp/ucroot

## S3 Storage Config (Multiple configs can be added by incrementing the index)
s3.bucketPath.0=
s3.region.0=
s3.awsRoleArn.0=
# Optional (If blank, it will use DefaultCredentialsProviderChain)
s3.accessKey.0=
s3.secretKey.0=
# Test Only (If you provide a session token, it will just use those session creds, no downscoping)
s3.sessionToken.0=

## ADLS Storage Config (Multiple configs can be added by incrementing the index)
adls.storageAccountName.0=
adls.tenantId.0=
adls.clientId.0=
adls.clientSecret.0=

## GCS Storage Config (Multiple configs can be added by incrementing the index)
gcs.bucketPath.0=
# Optional (If blank, it will use Default Application chain to find credentials)
gcs.jsonKeyFilePath.0=

日志

日志文件 etc/logs/server.log

配置日志级别 etc/conf/server.log4j2.properties

验证 Server

bash 复制代码
# 1. 列出所有 catalogs(应返回 {"catalogs": [...]})
curl http://127.0.0.1:8080/api/2.1/unity-catalog/catalogs

# 2. 创建一个 catalog(可选)
curl -X POST http://127.0.0.1:8080/api/2.1/unity-catalog/catalogs \
  -H "Content-Type: application/json" \
  -d '{"name": "test_catalog", "comment": "Test"}'

# 3. 再次列出 catalogs
curl http://127.0.0.1:8080/api/2.1/unity-catalog/catalogs
相关推荐
程序员三明治2 小时前
RAG 元数据的作用与管理:让知识库回答可追溯、可过滤、可维护
人工智能·llm·知识库·元数据·rag·java后端
luoyayun3611 天前
Qt + FFmpeg 实战:获取音视频文件基础属性、流信息和元数据
qt·ffmpeg·音视频·元数据·获取音视频文件属性
Aloudata1 个月前
AI 时代如何通过主动元数据构建高质量、可追溯的语义底座?
大数据·人工智能·数据治理·元数据·数据血缘
Aloudata2 个月前
PL/SQL 存储过程血缘解析指南:攻克数据治理的「最后堡垒」
数据库·sql·数据治理·数据管理·元数据·数据血缘
AllData公司负责人2 个月前
AllData数据中台集成开源项目OpenMetaData,建设元数据与数据血缘平台!
数据库·实时数仓·元数据·streampark·数据血缘·openmetadata
Henb9292 个月前
# 元数据管理平台设计:构建企业级数据资产地图
元数据
没有bug.的程序员3 个月前
低代码平台后端引擎:元数据驱动架构、插件化内核与 Java 扩展机制
java·低代码·架构·插件化·元数据·扩展机制
Aloudata4 个月前
数据治理新解法:基于算子级血缘的主动元数据如何破解数仓重构难题?
大数据·数据库·数据治理·元数据·数据血缘
Aloudata4 个月前
数据治理选型对比:Apache Atlas vs 商业平台在存储过程解析与自动化治理的实测分析
数据挖掘·自动化·apache·元数据·数据血缘
Aloudata4 个月前
金融数据治理新范式:如何用算子级血缘与主动元数据 10分 钟定位 EAST 报送异常?
金融·数据治理·元数据·noetl·数据血缘