数据科学

天一生水water6 天前
数据科学
数据科学中的特征工程特征工程艺术:数据科学家的魔法工坊想象一下你是一位顶级厨师,面前摆着各种新鲜的食材,蔬菜、肉类、香料。但是你不能直接把这些原始食材端给客人,对吗?你需要清洗、切片、调味、搭配,将这些原始食材转换成精美的菜肴。这个过程就像特征工程一样,特征工程就是将原始数据转换为机器学习模型能够理解和使用的特征的艺术。
Tiger Z6 天前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第11章) --- Communication(2)写在前面本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
Tiger Z12 天前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第11章) --- Communication(1)写在前面本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
Tiger Z19 天前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第10章) --- Exploratory data写在前面本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
搞科研的小刘选手20 天前
人工智能·物联网·大模型·智慧城市·数据科学·ai驱动·计算科学
【大会邀请】2025年AI驱动下:业务转型和数据科学创新国际学术会议(ICBTDS 2025)2025年AI驱动下:业务转型和数据科学创新国际学术会议(ICBTDS 2025)2025 International conference on AI-Driven Business Transformation and Data Science Innovation
Tiger Z1 个月前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第9章) --- Layers(2)写在前面本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
lisw051 个月前
数据挖掘·数据分析·数据科学
数据科学与数据分析:真正的区别是什么?在如今这个以数据为导向的时代,当人们谈论数据科学或数据分析时,这两个术语似乎可以互换使用。尽管二者存在诸多相似之处,但这两个领域在研究方向以及对职业发展的意义上却有着天壤之别。你对这两个不同分支的理解越深入,就越能做出合适的选择 —— 尤其是当你正考虑报名参加数据科学课程时。在本指南中,我们将深入剖析数据科学家与数据分析师之间的真正区别,包括他们所从事的工作、使用的工具、所需的技能,以及如何选择能让你更接近目标的职业道路。
Tiger Z1 个月前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第9章) --- Layers(1)写在前面本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
爱思德学术2 个月前
人工智能·机器学习·软件工程·数据科学
中国计算机学会(CCF)推荐学术会议-C(软件工程/系统软件/程序设计语言):MSR 2026MSR 2026The Mining Software Repositories (MSR) conference is the premier venue for software analytics research, according to which software engineering data is analyzed using a mixture of data science, machine learning/artificial intelligence, and qualita
Tiger Z2 个月前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第7章) --- Data import(1)本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
胡耀超2 个月前
人工智能·python·机器学习·数据挖掘·数据分析·数据科学·统计学
机器学习数学基础与商业实践指南:从统计显著性到预测能力的认知升级本指南旨在帮助读者理解机器学习的数学基础,认识统计分析与机器学习预测之间的本质差异,并掌握现代机器学习在商业场景中的智慧应用。我们将从认知框架和成本效益的角度,深入探讨为什么统计显著的群体差异并不总能转化为准确的个体预测,以及如何在不同商业场景中选择最适合的技术路径。
Tiger Z3 个月前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第3章) --- Data transformation(2)本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
CodeShare3 个月前
人工智能·机器学习·数据科学
某中心将举办机器学习峰会某中心(AWS)将于6月2日至3日举办虚拟机器学习峰会,旨在汇聚客户、开发者和科学界共同探讨机器学习(ML)领域的最新进展。本次春季峰会包含四大主题轨道:
Tiger Z3 个月前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第2章) --- Workflow: basics本系列推文为《R for Data Science (2)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
Tiger Z4 个月前
r语言·数据科学·中文翻译
《R for Data Science (2e)》免费中文翻译 (第0章) --- Introduction本系列推文为《R for Data Science (2e)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn Github 地址: https://github.com/Books-zh-cn/r4ds-zh-cn r4ds-zh-cn 网站地址: https://books-zh-cn.github.io/r4ds-zh-cn/
纪伊路上盛名在4 个月前
github·项目管理·数据科学·自学·可重复性
github常用插件一,文档辅助阅读系列:自动化wiki处理1,deepwikihttps://deepwiki.com/
沛沛老爹5 个月前
人工智能·python·机器学习·numpy·数据科学·多维数组·python库
NumPy玩转数据科学本文在创作过程中借助 AI 工具辅助资料整理与内容优化。图片来源网络。大家好,我是沛哥儿。 在当今科技飞速发展的时代,人工智能和机器学习领域取得了令人瞩目的成就。而在这些领域背后,有许多基础的技术和工具发挥着至关重要的作用。NumPy 作为科学计算的基础库,便是其中之一。它提供的多维数组支持,不仅为科学计算提供了强大的工具,更是机器学习算法实现的底层依赖。深入了解 NumPy 的特性,对于推动技术的发展和应用具有重要的意义。
胡耀超5 个月前
学习·安全·网络安全·信息与通信·数据科学·信息论
从逻辑视角学习信息论:概念框架与实践指南这一篇博客的续篇:从逻辑学视角严谨证明数据加密的数学方法与实践信息论的逻辑基础远超其数学表达,根植于对信息、不确定性和推理本质的深刻理解。David Ellerman的逻辑熵理论为信息论提供了严格的逻辑基础,他认为信息本质上关乎"区分、差异、可区分性和多样性"。
胡耀超6 个月前
人工智能·python·自动化·知识图谱·数据科学·逻辑学·质量评估
18.自动化生成知识图谱的多维度质量评估方法论知识图谱作为结构化表示知识的重要载体,已成为人工智能和语义网络研究的核心。随着自动化技术的发展,大规模知识图谱的自动生成成为可能,但这也带来了一个关键问题:如何全面、客观地评估自动生成知识图谱的质量?本文从多维角度出发,系统性地探讨知识图谱质量评估的方法论体系,旨在为研究者和实践者提供全面的质量评估框架。
Code_流苏6 个月前
线性代数·numpy·数据科学·向量空间·矩阵运算
《Python星球日记》 第36天:线性代数基础名人说:路漫漫其修远兮,吾将上下而求索。—— 屈原《离骚》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 专栏:《Python星球日记》,限时特价订阅中ing