数据科学

胡耀超13 天前
学习·安全·网络安全·信息与通信·数据科学·信息论
从逻辑视角学习信息论:概念框架与实践指南这一篇博客的续篇:从逻辑学视角严谨证明数据加密的数学方法与实践信息论的逻辑基础远超其数学表达,根植于对信息、不确定性和推理本质的深刻理解。David Ellerman的逻辑熵理论为信息论提供了严格的逻辑基础,他认为信息本质上关乎"区分、差异、可区分性和多样性"。
胡耀超19 天前
人工智能·python·自动化·知识图谱·数据科学·逻辑学·质量评估
18.自动化生成知识图谱的多维度质量评估方法论知识图谱作为结构化表示知识的重要载体,已成为人工智能和语义网络研究的核心。随着自动化技术的发展,大规模知识图谱的自动生成成为可能,但这也带来了一个关键问题:如何全面、客观地评估自动生成知识图谱的质量?本文从多维角度出发,系统性地探讨知识图谱质量评估的方法论体系,旨在为研究者和实践者提供全面的质量评估框架。
Code_流苏1 个月前
线性代数·numpy·数据科学·向量空间·矩阵运算
《Python星球日记》 第36天:线性代数基础名人说:路漫漫其修远兮,吾将上下而求索。—— 屈原《离骚》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 专栏:《Python星球日记》,限时特价订阅中ing
AI技术学长1 个月前
人工智能·pytorch·神经网络·数据科学·计算机技术·批量标准化
训练神经网络的批量标准化(使用 PyTorch)构建神经网络是一门艺术,而非一个结果固定的过程。你无法预知最终能否得到有效的模型,而且有很多因素可能导致你的机器学习项目失败。
明月看潮生2 个月前
人工智能·青少年编程·数据科学·编程与数学·大学数学
青少年编程与数学 02-015 大学数学知识点 09课题、专业相关性分析计算机科学、数据科学和人工智能是现代技术领域的核心学科,它们与大学数学有着密切的联系。这里是这些学科与大学数学知识点之间的相关性详细分析。
明月看潮生2 个月前
数学建模·青少年编程·数据科学·高中数学·编程与数学
青少年编程与数学 02-014 高中数学知识点 06课题、数学建模与探究活动数学建模与探究活动是新课标中强调的实践性核心素养,旨在培养学生将数学知识应用于实际问题、开展创新研究的能力。从数学建模流程、典型案例分析、探究活动设计三个维度进行解析。
橙子小哥的代码世界3 个月前
人工智能·python·机器学习·kmeans·数据科学·聚类算法·肘部法
【机器学习】【KMeans聚类分析实战】用户分群聚类详解——SSE、CH 指数、SC全解析,实战电信客户分群案例在实际数据分析中,聚类算法常用于客户分群、图像分割等场景。如何确定聚类数 k 是聚类分析中的关键问题之一。本文将以“用户分群”为例,展示如何通过 KMeans 聚类,利用 SSE(误差平方和,也称 Inertia)、Calinski-Harabasz 指数(CH Score)和 Silhouette Score(轮廓系数)来判断最佳的聚类数。你将看到三幅图表,每个图表都揭示了不同的聚类评价指标,帮助你综合判断哪一个 k 值最合理。
colorknight4 个月前
人工智能·低代码·数据科学·huggingfists·可视化编程
3.3 VO-O(算子)语法VO-O语法部分是VO语言的特色部分。其核心概念主要有两个,“算子”以及“数据连接”。使用者通过拖拽“算子”图元、配置“算子”参数、构建“算子”间的“数据连接”,最终形成一个具有数据流转关系的流程图。该流程图可被理解为是由VO语言编写的一段程序。该程序最终将通过作业调度系统派发到计算节点,并由计算节点中的Oyez引擎完成解释执行。
colorknight4 个月前
sql·milvus·数据科学·huggingfists·graphrag·向量库·moql
疯狂SQL转换系列- SQL for Milvs2.4鉴于Milvus仍在不停的迭代新版本,推出新功能,其SDK目前并不稳定。目前其2.4版本的SDK接口已与之前的2.2版本有了较大的差别,功能上也有了一定的调整。为此,我们重新提供了针对[Milvus2.4](https://github.com/colorknight/moql-transx/tree/master/moql-querier-milvus2.4)版本的语法转换功能。由于Milvus文档有些内容写的不是特别详实,亦或时间仓促,我们没有正确理解其功能含义,转换工作可能存在一些问题,还请发现问题
martian6655 个月前
数据库·人工智能·数据科学·数据处理
【人工智能数据科学与数据处理】——深入详解人工智能数据科学与数据处理之数据可视化与数据库技术在人工智能(AI)的数据科学与数据处理中,数据可视化与数据库技术是两项至关重要的技能。本文将深入探讨数据可视化中的可视化技巧及其应用,以及关系型数据库(如MySQL、PostgreSQL)在数据处理中的关键作用和SQL语言的掌握方法。
martian6655 个月前
人工智能·数据科学·数据处理
【人工智能中的数据科学与数据处理】——详解人工智能中的数据科学与数据处理之数据可视化技巧在人工智能(AI)和数据科学的领域中,数据可视化是不可或缺的一环。它不仅帮助数据科学家理解和探索数据,还能有效地传达分析结果给非技术人员。本文将深入探讨数据可视化的关键概念、核心原理、常见图表类型(如柱状图、散点图、热力图等)的使用方法,并通过示例和主要应用场景,帮助读者掌握数据可视化的技巧。
martian6655 个月前
人工智能·数据清洗·数据科学·数据处理
【人工智能数据科学与数据处理】——深入详解数据科学与数据处理之数据获取与清洗数据获取与清洗是数据科学与数据处理流程中的关键步骤,它们直接影响后续的数据分析、建模与决策。本文将深入探讨数据获取与清洗的关键概念、核心原理、具体示例及主要应用,重点涵盖从数据库、API、网页抓取等方式获取数据的方法。
南宫理的日知录5 个月前
python·numpy·数据科学
「Python数据科学」标量、向量、矩阵、张量与多维数组的辨析在数据科学中,有很多概念,其中,最容易搞混的就是标量、向量、矩阵、张量了。具体到这些概念的落地实现,又与多维数组有着密不可分的联系。
Font Tian6 个月前
大数据·人工智能·数据治理·数据科学·联邦学习
联邦学习防止数据泄露联邦学习 (Federated Learning) 是一种分布式机器学习技术,旨在解决数据隐私保护问题。它允许在分散的数据源上进行模型训练,而无需将数据集中到中央服务器。因此,联邦学习可以有效地防止训练过程中的数据泄露,并提高数据隐私安全性。
AI完全体6 个月前
人工智能·学习·数据分析·数据科学·找工作
【AI战略思考12】调整战略目标,聚焦数据分析,学习德川家康,剩者为王【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】下面会从各个角度详细说明这几点原因,这是我经过了这3个月的探索、尝试和思考得出来的结论
colorknight8 个月前
人工智能·低代码·macos·huggingface·数据科学·ai agent
1.2.3 HuggingFists安装说明-MacOS安装【GitHub】GitHub - Datayoo/HuggingFists4Mac【百度网盘】https://pan.baidu.com/s/12WxZ-2GgMtbQeP7AcmsyHg?pwd=2024
叶庭云8 个月前
人工智能·数据科学·数据异构性·数据工程·数据异质性
数据异质性与数据异构性的本质和举例说明🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/在现代数据科学与信息技术领域,“数据异质性” 与 “数据异构性” 是两个常见的概念。对于初学者而言,明确这两个概念的本质及其间的差异至关重要。本文旨在以简明易懂的方式,分别阐述这两个概念,并辅以实例,助您深入掌握。
colorknight8 个月前
人工智能·低代码·llm·huggingface·数据科学·huggingfists·安装说明
1.2 HuggingFists安装说明-Linux安装【GitHub】https://github.com/Datayoo/HuggingFists【百度网盘】https://pan.baidu.com/s/12-qzxARjzRjYFvF8ddUJQQ?pwd=2024
colorknight8 个月前
人工智能·低代码·llm·数据科学·ai agent·huggingfists·向量库
2.1 HuggingFists系统架构(二)上图为HuggingFists的部署架构。从架构图可知,HuggingFists主要分为服务器(Server)、计算节点(Node)以及数据库(Storage)三部分。这三部分可以分别部署在不同的机器上,以满足系统的性能需求。为部署方便,HuggingFists社区版将这三部分集成在了一起,缺省情况下只提供了一个计算节点(Node)。
临床数据科学和人工智能兴趣组10 个月前
数据清洗·数据科学·r·数据去重·数据重塑·数据匹配
4章7节:用R做数据重塑,数据去重和数据的匹配在数据科学的分析流程中,数据重塑是一项非常重要的操作。数据的重塑通常指将数据从一种形式转换为另一种形式,以满足后续分析的需求。R语言提供了丰富的工具和函数来帮助用户高效地进行数据重塑操作。本文中,我们将深入探讨数据重塑的概念及其重要性,并详细介绍几个关键操作,包括数据去重、数据的匹配以及行列命名。