技术栈
spl
smilejingwei
3 小时前
开发语言
·
sqlite
·
spl
·
esproc spl
面向 Java 程序员的 SQLite 替代品
很多小微型应用程序也需要一些数据处理和计算能力,如果集成一个数据库就显得太沉重了,小巧轻量的 SQLite 是个不错的选择,因而被广泛应用。 不过,SQLite 也有些不方便的地方。SQLite 对外部数据文件及其它数据源的支持力度比较弱又很繁琐;它本身没有存储过程,需要用主程序配合来实现流程,这会导致经常和主程序交换数据(流程走向依赖于数据),效率低且代码麻烦;复杂些的运算用 SQL 也很难写,开发效率较低。
smilejingwei
2 天前
大数据
·
spl
·
esproc spl
单机顶集群的大数据技术来了
大数据时代的分布式数仓(如 MPP)是个热门技术,甚至到了提到数据仓库言必称分布式的地步。 但是,分布式数仓真有必要吗?毕竟这些分布式数仓产品都不便宜,无论是采购成本还是运维成本都很高。是不是有低成本轻量级的方案呢?
smilejingwei
4 天前
python
·
sql
·
数据分析
·
编程语言
·
spl
·
esproc spl
数据分析编程:SQL,Python or SPL?
用户行为数据表10 分钟没有任何动作或退出后 5 分钟没有登录则认为会话结束,计算各用户的会话次数。球赛得分表
smilejingwei
12 天前
mongodb
·
elasticsearch
·
kafka
·
spl
·
esproc spl
从 ES Kafka Mongodb Restful ... 取到 json 之后
json 是个好东西,它可以使用公共的文本形式承载了丰富的结构化数据的信息。现代很多技术都在喜欢使用 json 作为数据传输格式,比如 Elastic Search,Restful,Kafka 等,Mongodb 这类对性能较在意的技术则使用了二进制化的 json。
smilejingwei
13 天前
数据库
·
sql
·
spl
·
esproc spl
没有数据库也能用 SQL
手头有些 csv/xls 文件,比如这样的:这种数据很适合用 SQL 做查询,但可惜 SQL 只能用在数据库,要安装个数据库并把这些文件导入,为这么个目标搞的整个应用系统都臃肿很多,实在是划不来。要是有什么技术能直接把这些文件当成数据表用 SQL 查询就好了。
smilejingwei
21 天前
java
·
前端
·
sql
·
算法
·
spl
·
esproc spl
为 Lambda 语法增加序运算能力
我们继续讨论集合运算中的 Lamba 语法,引入和次序相关的运算能力。 SQL 延用了数学上的无序集合概念,遍历集合时也不关注次序。但计算机只能一步步地执行,循环时总会有个次序,充分利用这个次序就可以方便地表达更丰富的计算需求。 比如我们想从一个集合取出半数成员构成新集合。这看起来象是过滤运算,但过滤条件和集合成员本身并没有关系,而是由循环时的次序号决定的。 SPL 中只用 ~ 写法还无法方便地描述出这种运算,这时候还需有个符号(标识符)来表示循环的次序号。这是 Lambda 语法的第四条。
半截肥皂
22 天前
web3
·
spl
·
solana
·
sol
你的第一个Solana SPL
smilejingwei
1 个月前
数据分析
·
excel
·
bi
·
spl
·
esproc spl
·
esprocdesktop
Excel筛选数据时用到分类汇总值
举个例子;现有分类产品销售额汇总表如下所示:请找出销售额大于所在分类平均销售额的产品:使用 SPL XLL,输入公式:
smilejingwei
1 个月前
开发语言
·
数据库
·
数据分析
·
bi
·
spl
·
esproc spl
BI 软件能对付多少数据分析任务?
其实没多少! 从早期喊的多维分析到近年来喊敏捷 BI,BI 厂商一直在强调自助能力,宣称可以由业务人员自己随心所欲地分析数据,而用户也常常有强烈的需求,双方一拍即合,很容易形成购买行为。 不过,就大多数缺乏 BI 应用经验的用户所期望的工作内容而言,自助分析的目标就可以说远远达不到!从经验上看,最好情况也就能解决 30% 左右的问题而已,而大多数 BI 产品连这个数也达不到,只能处理 10% 左右的需求。
smilejingwei
2 个月前
开发语言
·
数据分析
·
excel
·
spl
·
esproc spl
·
数据计算
Excel中查找某个值的位置,用位置取值
有 2022 年 1 月的日销售额统计表如下所示:找出销售额最大的是哪一天,在 C2 单元格里输入:返回结果 12
smilejingwei
2 个月前
开发语言
·
人工智能
·
spl
·
esproc
BI 和 AI 有什么区别?
BI 和 AI 中都有个 I,对应的英文单词都是 Intelligence,看起来是同一个意思。 其实不然,即使我们只限定商业决策领域中讨论问题,BI 和 AI 中的 I 也有很大的不同。 广义地来看,根据数据来辅助商业决策的事务都可以叫 BI,那么 BI 可以说是包括 AI 的。BI 是目的,AI 是手段,BI 可以用 AI 的手段实现,也可以用其它手段实现,从这个意义上讲,BI 的 I 将大于 AI 的 I。
smilejingwei
2 个月前
开发语言
·
性能优化
·
excel
·
spl
·
esproc
如何在Excel中快速找出前 N 名,后 N 名
有如下销售额统计表:找出销售额排前 10 名的产品及其销售额,和销售额排倒数 10 名以内的产品及其销售额,结果如下所示:
smilejingwei
2 个月前
开发语言
·
数据库
·
sql
·
json
·
spl
SQL,从每组中的 json 字段中提取唯一值
postgreySQL 库表的第 1 列是 ID,用于排序;第 2 列是分类;第 3 列类似 json(非标准 json), 并存在重复项。
smilejingwei
3 个月前
开发语言
·
excel
·
spl
从每 N 行找出需要数据拼成一行
Excel某表格不规范,每两行6列对应规范表格的一行3列,分别是:第1行第1列或第2行第1列(两者重复,取其一即可)、第2行第2列、第1行第3列。
smilejingwei
3 个月前
开发语言
·
excel
·
spl
Excel 保持原序时计算组内排名
Excel某表格第1列是分组,第2列是日期,未排序。要求在保持原序的情况下,算出每组数据的内部排名,写在第3列:
smilejingwei
3 个月前
大数据
·
数据库
·
sql
·
性能优化
·
database
·
spl
列式存储的另一面
列存是常见的数据存储技术,说到列存常常就意味着高性能,现代分析型数据库基本都会把列存作为标配, 列存的基本原理是减少硬盘的读取量。一个数据表有多个列,但运算可能只会用到其中少数几列,采用列存时,用不着的列就不必读出来了,而采用行式存储时,则要把所有列都扫描一遍。当取用列只占总列数的小部分时,列存的 IO 时间优势会非常大,就会显得计算速度快了很多。 不过,列存也有另一面,并不是在任何场景下都有优势。
smilejingwei
3 个月前
开发语言
·
excel
·
spl
分组汇总后再根据数量拼上不同文字
Excel某表格有2列。要求:按第1列分组,如果组内第2列大于0则对当前行进行计数,否则不计数;计数结果等于1则附加Occurrence,否则附加 Occurrence 的复数形式。
smilejingwei
3 个月前
大数据
·
开发语言
·
数据库
·
sql
·
性能优化
·
spl
分组汇总后按指定序列对齐
编写SPL代码:=orcl.query("select to_char(TRANSACT_DT_TM,'YYYY')