R语言【CoordinateCleaner】——cc_dupl():根据物种名称和坐标以及用户定义的附加列删除或标记重复的记录

Package CoordinateCleaner version 2.0-20


Parameters

R 复制代码
cc_dupl(
  x,
  lon = "decimallongitude",
  lat = "decimallatitude",
  species = "species",
  additions = NULL,
  value = "clean",
  verbose = TRUE
)

参数【x】:data.frame。包含地理坐标和物种名称。

参数【lon】:字符串。具有经度坐标的列。默认值 = "decimallongitude"

参数【lat】:字符串。包含纬度坐标的列。默认值 = "decimallatitude"

参数【species】:字符串。包含物种名称的列。默认值 = "species"

参数【additions】:字符串的向量。要包含在重复测试中的其他列。例如,如下图所示,收集器名称和收集器编号。

参数【value】:字符串。定义输出值。

参数【verbose】:逻辑。如果为 TRUE,则报告测试的名称和标记的记录数。


Value

根据参数【value】,包含测试认为正确的记录的 data.frame"clean") 或逻辑向量 ("flagged"),其中TRUE = 测试通过,FALSE = 测试失败/可能有问题。默认值 = "clean"


Conclusion

cc_dupl()函数是CoordinateCleaner软件包中的一个特定函数,用于检测和处理生物多样性数据集中的重复记录。以下是对cc_dupl()函数的总结性介绍:

  • cc_dupl()函数用于识别数据集中的重复记录,并根据不同的参数和阈值进行处理。
  • 它可以通过比较记录之间的经纬度坐标、采样日期和其他属性,来确定是否存在重复的数据记录。
  • 该函数还提供了各种选项和方法,以选择处理重复记录的方式,如保留第一次出现的记录、保留最后一次出现的记录或合并重复的记录。
  • cc_dupl()函数还可以生成一个关于重复记录的详细报告,帮助用户审查和验证相关数据。
  • 该函数返回一个包含处理后数据集的对象,可以继续在其他函数中使用。

总之,cc_dupl()函数是CoordinateCleaner软件包中一个有用的函数,可帮助用户检测和处理生物多样性数据集中的重复记录。它提供了各种选项和报告,以支持用户进行更精确和准确的数据清理。


Example

R 复制代码
x <- data.frame(species = letters[1:10], 
                decimallongitude = sample(x = 0:10, size = 100, replace = TRUE), 
                decimallatitude = sample(x = 0:10, size = 100, replace = TRUE),
                collector = "Bonpl",
                collector.number = c(1001, 354),
                collection = rep(c("K", "WAG","FR", "P", "S"), 20))

cc_dupl(x, value = "flagged")
cc_dupl(x, additions = c("collector", "collector.number"))
相关推荐
故事和你911 小时前
洛谷-数据结构1-1-线性表1
开发语言·数据结构·c++·算法·leetcode·动态规划·图论
techdashen2 小时前
Rust项目公开征测:Cargo 构建目录新布局方案
开发语言·后端·rust
星空椰2 小时前
JavaScript 进阶基础:函数、作用域与常用技巧总结
开发语言·前端·javascript
忒可君2 小时前
C# winform 自制分页功能
android·开发语言·c#
Rust研习社2 小时前
Rust 智能指针 Cell 与 RefCell 的内部可变性
开发语言·后端·rust
leaves falling3 小时前
C++模板进阶
开发语言·c++
坐吃山猪4 小时前
Python27_协程游戏理解
开发语言·python·游戏
gCode Teacher 格码致知4 小时前
Javascript提高:小数精度和随机数-由Deepseek产生
开发语言·javascript·ecmascript
椰猫子4 小时前
Javaweb(Filter、Listener、AJAX、JSON)
java·开发语言
盛世宏博北京5 小时前
以太网温湿度传感器运维技巧,提升设备稳定性与使用寿命
开发语言·php·以太网温湿度传感器