[原创][R语言]股票分析实战[8]:因子与subset的关系

[简介]

常用网名: 猪头三

出生日期: 1981.XX.XX

QQ联系: 643439947

个人网站: 80x86汇编小站 https://www.x86asm.org

编程生涯: 2001年~至今[共22年]

职业生涯: 20年

开发语言: C/C++、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python

开发工具: Visual Studio、Delphi、XCode、Eclipse、C++ Builder

技能种类: 逆向 驱动 磁盘 文件

研发领域: Windows应用软件安全/Windows系统内核安全/Windows系统磁盘数据安全/macOS应用软件安全

项目经历: 磁盘性能优化/文件系统数据恢复/文件信息采集/敏感文件监测跟踪/网络安全检测

[序言]

在股票数据分析中, "方差分析"是非常重要的技术. 那么"方差分析"就会涉及的因子. 因子的处理, 会涉及到"方差分析"的平衡性处理, 平衡 与 非平衡.

[因子 与 subset函数]

记录一个细节: 当有一个数据框, 需要进行"方差分析"时, 为了保证观测数的平衡性, 即每组分类的观测数是一样的. 尽量使用subset()函数来进行数据抽取. 而不是用 rbind()或者cbind()来做数据抽取. 这是因为subset()函数不会改变因子的数量.

[代码示例]

假如有一个数据框stock_demo包含一个Days列, 内容是周内第N天, 类型为因子, 数据如下:

1

3

4

3

2

2

2

1

3

R 复制代码
stock_demo_sub <- subset(stock_demo, Days = '3') #把因子为3的行内容提取出来并形成一个新的数据框 stock_demo_sub
table(stock_demo_sub) # 统计因子的频数. 这时你会发现, stock_demo_sub 仍然会保留所有的因子, 即 1 2 3 4

[结尾]

很多人在做"方差分析"的时候, 为什么结果不准确, 其实就是因子被破坏的问题, 导致了"方差分析"的平衡性倾向于非平衡, 在"非平衡模式"分析下, 不如"平衡模式"分析准确.

相关推荐
微三云、小叶34 分钟前
裂变速度提升300%!279模式如何盘活一个私域商城
大数据·软件开发·商业模式·小程序商城·本地生活·商业思维
还是大剑师兰特2 小时前
Hadoop面试题及详细答案 110题 (106-110)-- Hadoop高级与实战
大数据·hadoop·分布式
努力成为一个程序猿.3 小时前
【问题排查】hadoop-shaded-guava依赖问题
大数据·hadoop·spark
达芬奇科普4 小时前
俄罗斯全面禁止汽油出口对俄、欧、中能源市场的多维影响分析
大数据·人工智能
RE-19015 小时前
《深入浅出统计学》学习笔记(二)
大数据·数学·概率论·统计学·数理统计·知识笔记·深入浅出
yumgpkpm8 小时前
CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)使用 AI 优化库存水平、配送路线的具体案例及说明
大数据·人工智能·hive·hadoop·机器学习·zookeeper·cloudera
临风赏月9 小时前
Hudi、Iceberg、Delta Lake、Paimon四种数据湖的建表核心语法
大数据
极客数模11 小时前
【浅析赛题,一等奖水平】思路模型数据相关资料!2025 年“大湾区杯”粤港澳金融数学建模竞赛B 题 稳定币的综合评价与发展分析~
大数据·算法·数学建模·金融·数据挖掘·图论·1024程序员节
临风赏月11 小时前
Hudi、Iceberg、Delta Lake、Paimon 建表语法与场景示例
大数据
luoganttcc12 小时前
加快高水平科技自立自强,引领发展新质生产力 <十五五 规划节选>
大数据·人工智能·科技