大数据

梦里不知身是客1129 分钟前
大数据·flume
flume的数据模型介绍Flume的数据模型围绕三个核心组件构建:Source(数据源)、Channel(通道) 和 Sink(数据出口),形成单向数据流管道。以下是详细说明:
winfield8211 小时前
大数据·人工智能
推荐/搜索系统的召回、精排、粗排、打散这四个环节都是做什么的?这四个环节是 推荐/搜索系统的核心召回排序流程,目的是从海量候选集里筛选出用户最可能感兴趣的内容,同时保证结果的多样性,整体流程遵循 “从多到少、从粗到精” 的原则。以下是每个环节的详细职责、目标和实现逻辑:
写代码的【黑咖啡】1 小时前
大数据
大数据中的数据同步预处理:保障数据质量的第一道防线在大数据平台建设中,数据同步是连接源系统与数据仓库(或数据湖)的核心流程。无论是从业务数据库(如 MySQL、Oracle)抽取数据,还是从日志系统、第三方 API 获取信息,原始数据往往存在噪声、不一致、敏感信息泄露等问题。
Hello.Reader1 小时前
大数据·sql·flink
Flink SQL Time Travel用 FOR SYSTEM_TIME AS OF 查询历史快照Time Travel(时间旅行)用于查询表在某个历史时间点的“数据与表结构状态”。你可以指定一个时间点,让 Flink 返回该时间点对应的表数据,适合做:
2501_924794901 小时前
大数据·人工智能·重构
企业AI转型为何难?——从“不敢用”到“用得稳”的路径重构2024年IDC数据显示,全球中小企业对AI的投入同比增长18%,但实际落地效果却呈现显著分化:头部企业通过定制化解决方案实现智能化升级,而大量中小型企业在AI应用中仍面临“想用但不敢用”的困境。
Tezign_space2 小时前
大数据·人工智能·内容运营
小红书内容运营工具怎么选?专业视角拆解优质工具核心标准在小红书成为品牌 “种草主阵地” 的当下,内容运营的效率与质量直接决定品牌曝光与转化效果。但多数品牌面临 “优质内容产出慢、关键词适配差、数据优化无依据” 等痛点,单纯依赖人工运营已难以应对平台高频更新与用户精细化需求。而一款好用的小红书内容运营工具,能通过 AI 赋能打通 “创作 - 优化 - 分发 - 复盘” 全链路,让品牌在小红书的运营从 “碰运气” 变为 “可复制”。本文结合实测数据与实战案例,拆解工具核心价值、选型标准与优质工具实践,为品牌提供清晰指引。
康实训2 小时前
大数据·人工智能·实训室·养老实训室·实训室建设
养老实训室建设标准指南一、养老实训室建设定位与基本原则养老实训室建设应遵循"科学性、实用性、前瞻性"的基本原则,打造符合行业发展需求的专业化实训平台。
semantist@语校3 小时前
大数据·数据库·人工智能·python·百度·prompt·知识图谱
第五十五篇|从解释约束到结构化认知:京都国际学院的语言学校Prompt工程化实践系列延续:500 所日本语言学校结构数据工程 关键词:京都国际学院、结构化Prompt、解释约束、语言学校数据工程、语校网
计算机毕业编程指导师3 小时前
大数据·hadoop·python·计算机·spark·django·电影评分人气
【Python大数据选题】基于Spark+Django的电影评分人气数据可视化分析系统源码 毕业设计 选题推荐 毕设选题 数据分析 机器学习⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡有什么问题可以在主页上或文末下联系咨询博客~~ ⚡⚡Java、Python、小程序、大数据实战项目集](https://blog.csdn.net/2301_80395604/category_12487856.html)
TDengine (老段)4 小时前
大数据·数据库·科技·ai·时序数据库·tdengine·涛思数据
使用 deepseek 快速搭建 TDengine IDMP demoTDengine IDMP 产品的客户多为工控场景。在工控体系中,系统自下而上通常划分为现场设备层、现场控制层、过程监控层、生产管理层以及企业资源层。因此,最初的数据来源于现场设备层,这些数据也是后续所有业务驱动的来源。对于TDengine而言,数据采集后汇聚到该平台,随后可以按设备或组织架构的形式进行展示,其内容仍围绕设备数据展开。因此,如何高效获取素材来源,决定后面工作效率和展示效果。
Jackyzhe4 小时前
大数据·flink
Flink源码阅读:如何生成StreamGraphFlink 中有四种执行图,分别是 StreamGraph、JobGraph、ExecutionGraph 和 Physical Graph。今天我们来看下我们编写的 Flink 程序代码是如何生成 StreamGraph 的。
Hello.Reader4 小时前
大数据·sql·flink
Flink SQL Window Deduplication按窗口“保留第一条/最后一条”记录(Streaming)Window Deduplication 是 Deduplication(去重)的窗口版本:在 每个窗口(window)+ 分区键(partition keys) 内,对重复行做去重,只保留第一条或最后一条。(nightlies.apache.org)
给朕把屎铲了4 小时前
大数据·数据库·涛思数据
涛思数据库:DB error: some vnode/qnode/mnode(s) out of service (10.703928s)涛思库异常:DB error: some vnode/qnode/mnode(s) out of service (10.703928s)
成长之路5144 小时前
大数据
【地理数据】城市居住人口及工作人口分布数据(更新至2023年)城市居住人口,指长期在城市特定区域居住的人口,反映 “居住地” 维度的人口集聚特征;工作人口,指在城市特定区域从事生产经营活动的人口,反映 “就业地” 维度的人口流动特征,两者均是城市规划、产业发展、社会治理的 “数据底座”,是理解城市空间演化规律、推动城市高质量发展的核心抓手
未来之窗软件服务5 小时前
大数据·人工智能·仙盟创梦ide·东方仙盟·东方仙盟sdk·东方仙盟一体化·万象exce
一体化系统(九)高级表格自己编程如何选择——东方仙盟练气期多维表格恰似东方仙盟,好处显著:各门派(部门)数据如修士灵力般互通,多视图切换像仙法变招,一键聚合分析省去手工 “炼数据” 之累,实时协作让跨部门联动如仙盟议事般高效,权限管控则如宗门结界守护数据安全。
Mr.wangh5 小时前
大数据·elasticsearch·搜索引擎·springcloud·config
SpringCloudConfig(配置中心)在微服务架构中,每一个微服务都有自己的配置文件,如果每个服务自行配置,就会面临以下问题:1.维护成本高:每次配置修改,都需要重新部署服务。
wang_yb5 小时前
大数据·databook
数据点的“社交距离”:衡量它们之间的相似与差异在数据分析的世界里, “距离” 不仅仅是地图上两点之间的路程。距离 ,本质上是衡量两个事物 “相似度” 的尺子。
小园子的小菜5 小时前
大数据·elasticsearch·搜索引擎
深度解析Elasticsearch网络通信原理:节点协同与链接机制Elasticsearch(ES)作为分布式搜索引擎,其核心能力依赖于节点间的高效协同与数据互通,而网络通信则是维系这一分布式体系的“神经网络”。从客户端发起查询请求,到节点间分片数据同步、集群状态选举,每一个环节都离不开严谨的通信协议与链接管理策略。本文将系统梳理ES的网络通信原理,重点聚焦“节点-客户端”“节点-节点”两大通信场景,并深入剖析节点间13个核心链接的设计细节。
Tipriest_5 小时前
大数据·elasticsearch·apt·pip
详细解释pip及其使用方法(对比apt)可以先建立一个映射关系:注意:pip search 已经在新版本中禁用,后面会解释怎么替代。一般不要直接用 pip 这个命令,而是:
第二只羽毛5 小时前
java·大数据·开发语言·算法
外卖订餐管理系统实验五 外卖订餐管理系统1.理解程序的基本概念——程序、变量、数据结构;2.学会使用顺序、选择、循环、跳转语句编写程序;