技术栈
数据分析
数厘
2 小时前
sql
·
mysql
·
数据分析
2.11 约束的使用(主键、外键、非空、唯一、默认值约束)
我刚入行时,接手了一张“用户信息表”,里面同一个用户出现了三次,手机号有的写13812345678,有的写138****5678,还有一行用户名为空。我问运营怎么回事,他说“录入的时候没注意”。后来我在这张表上做用户画像分析,统计出来的结果完全是错的——一个用户被算了三次,重复率离谱。
城数派
3 小时前
数据库
·
arcgis
·
信息可视化
·
数据分析
·
excel
2025年南京市全类别POI(55W+数据)
1数据介绍六朝古都藏古韵,长三角芯聚活力。南京的每一处POI(兴趣点),都是千年文脉与现代繁华的交融印记——从老门东的烟火市井到河西新城的科创楼宇,从中山陵的苍松翠柏到新街口的车水马龙,每一个点位都在诉说这座城市的多元魅力。本次我们依托2025年7月最新采集的高精准POI数据,拆解553,854条点位信息,全方位解锁南京的城市空间布局、产业发展脉络与民生服务图景。
Omics Pro
7 小时前
运维
·
人工智能
·
语言模型
·
自然语言处理
·
数据挖掘
·
数据分析
·
自动化
上海AI Lab+复旦大学:双轨协同实现自动化虚拟细胞建模
单细胞扰动研究面临双重异质性瓶颈:(1)语义异质性——相同生物概念在不同数据集的元数据schema下不兼容;
SelectDB
8 小时前
人工智能
·
数据分析
AI 成为主流负载后,数据基础设施将如何演进?|Apache Doris 2026 Roadmap
在过去几年中,数据基础设施的演进始终围绕一个核心问题展开:如何更快地分析数据?但进入 2026 年,这个问题正在被重新定义。随着 AI 应用的爆发式增长,数据系统不再只是分析工具,而逐渐成为 智能系统的一部分。数据不再只是被查询,而是被 Agent 调用、被模型理解、被系统实时消费。
wayz11
8 小时前
算法
·
机器学习
·
数据分析
·
回归
·
线性回归
Day 2:线性回归原理与正则化
定义:线性回归是一种监督学习方法,用于预测连续值输出。它假设输入特征和输出之间存在线性关系。数学形式: y=β0+β1x1+β2x2+⋯+βnxn+ϵ y = \beta_0 + \beta_1x_1 + \beta_2x_2 + \dots + \beta_nx_n + \epsilon y=β0+β1x1+β2x2+⋯+βnxn+ϵ
Highcharts.js
9 小时前
人工智能
·
python
·
信息可视化
·
数据挖掘
·
数据分析
·
highcharts
企业级数据可视化|BI 仪表板数据中台工业监控平台的选择分析
放弃 ECharts?如果你现在要做一个系统,你会选什么?原因:👉推荐:Highcharts原因:使用 ECharts:你在用“代码能力”
kcuwu.
10 小时前
python
·
数据分析
·
numpy
Python 数据分析实战:NumPy、Pandas、Matplotlib 融合
Python 数据分析实战:NumPy+Pandas+Matplotlib 综合案例(电商销售数据分析)
小王毕业啦
1 天前
大数据
·
人工智能
·
数据挖掘
·
数据分析
·
社科数据
·
实证分析
·
经管数据
2006-2023年 省级-建成区绿化覆盖率数据(xlsx)
01、数据简介建成区绿化覆盖率,即城市建成区内绿化覆盖面积与建成区总面积的百分比,是直观反映城市绿化水平的关键指标,对衡量城市生态环境质量意义重大。较高的建成区绿化覆盖率意味着城市拥有更多绿色空间,能有效改善空气质量、调节气候、降低噪音,为居民提供更舒适的生活环境,提升居民生活品质。
城数派
1 天前
数据库
·
arcgis
·
信息可视化
·
数据分析
·
excel
2000-2025年我国省市县三级逐8天日间地表温度数据(Shp/Excel格式)
之前我们分享过2000年2月-2025年3月逐8天全国1km分辨率日间地表温度数据!该数据来源于NASA定期发布的MOD11A2数据集。很多小伙伴拿到数据后反馈栅格数据不太方便使用,问我们能不能把数据处理为更方便使用的Shp和Excel格式的数据!
数厘
1 天前
数据库
·
mysql
·
数据分析
2.6MySQL库表操作指南(电商数据分析专用)
我刚入行时,以为数据分析师只需要会写SELECT查询就够了。直到有一天,我接到了一个任务:从零开始搭建一个店铺经营分析库,需要把运营每天导出的Excel订单数据导入数据库,然后做报表。我这才发现,不会建库建表,连数据都放不进去。
龙腾AI白云
1 天前
python
·
机器学习
·
数据分析
·
django
·
tornado
多模大模型应用实战:智能问答系统开发
多模大模型应用实战:智能问答系统开发一、 智能问答系统到底是什么? 二、 智能问答系统的核心架构 三、 RAG:让大模型“有据可依” 四、 高质量问答系统的关键点 五、 从Demo到产品:那些容易被忽略的坑
qq_28372005
1 天前
python
·
数据分析
·
pandas
Python 数据分析:Pandas+NumPy 超详细教程
📝 本章学习目标:从零掌握 NumPy 数值计算与 Pandas 数据处理核心能力,可独立完成数据读取、清洗、转换、分析、可视化全流程,代码可直接复制运行。
V搜xhliang0246
1 天前
大数据
·
人工智能
·
重构
·
数据分析
·
机器人
基于MRI多病灶生境影像组学预测肝富血供转移瘤的原发灶来源
基于MRI多病灶生境影像组学预测肝富血供转移瘤的原发灶来源 摘要 肝转移瘤是肝脏最常见的恶性肿瘤,明确其原发灶来源对制定个体化治疗方案至关重要,然而约5%-15%的患者在初诊时原发灶不明。基于MRI的生境影像组学技术通过解析肝转移瘤内部的功能异质性亚区,为术前无创鉴别原发灶来源开辟了新途径。本文系统阐述多病灶生境影像组学的技术原理、肝富血供转移瘤的影像学特征、多原发灶鉴别的证据基础及临床转化价值。现有研究表明:基于增强CT的深度学习影像组学模型鉴别肝转移瘤五分类的宏观平均AUC达0.796,二分类任务中鉴
橙露
1 天前
分布式
·
数据挖掘
·
数据分析
大数据处理:PySpark 入门与分布式数据分析实战
在大数据时代,单机处理能力已经远远无法满足海量数据的分析需求。当数据量达到TB甚至PB级别时,传统的Pandas、Excel等工具要么直接崩溃,要么等待时间令人绝望。这时,分布式计算框架成为解决问题的关键。
Taylor不想被展开
1 天前
数据分析
【Label Studio】如何使用本地存储并导入预标注信息
如果已经启动了容器,先停止并删除。启动容器并配置环境变量。注意,挂载目录一定要设置成 images 文件夹的上一级目录,即命令中的 generate_json。
zzwq.
2 天前
数据分析
·
numpy
·
pandas
数据分析三件套:Numpy、Pandas、Matplotlib
目录一、 环境准备与安装1.1 确认Python环境1.2 使用pip一键安装1.3 验证安装是否成功
聊聊MES那点事
2 天前
数据分析
·
报表工具
·
fastreport
从数据采集到日报输出,FastReport如何帮工厂做好生产日报?
很多工厂在推进数字化后,都会遇到一个很现实的问题:系统有了,数据也采了,但生产日报还是不准、不及时、不好用。
kcuwu.
2 天前
python
·
数据分析
·
numpy
Python数据分析三剑客导论:NumPy、Pandas、Matplotlib 从入门到入门
在数据驱动的时代,Python凭借其简洁的语法、强大的生态,成为数据分析领域的首选语言。而在Python的数据分析生态中,NumPy、Pandas、Matplotlib 三者被誉为“三剑客”——它们各司其职、协同作战,构成了数据分析从“数据处理”到“结果可视化”的完整流程,是每一位数据学习者必须掌握的核心工具。
数厘
2 天前
数据库
·
mysql
·
数据分析
2.4MySQL安装配置指南(电商数据分析专用)
我刚入行时,公司的数据库账号是DBA统一分配的,我只需要写SQL就行,从没想过自己安装MySQL。后来跳槽到一家初创电商公司,数据团队只有我一个人,老板说:“数据库你来搭吧。”我当场愣住了——我连MySQL怎么安装都不知道。折腾了两天才搞定,中间还因为字符集没设对,导致用户昵称里的emoji变成问号。
databook
2 天前
后端
·
sql
·
数据分析
逃离SQL丛林:实用主义的数据救赎
👋 Hi,数据分析圈的朋友们!你是不是也经历过这样的场景:老板问:"上周的复购率是多少?" 你查了A表,算出来是18%; 同事查了B表,说是23%; 运营同学从后台导出,又是20.5%……