R语言【taxlist】——match_names():字符和 taxlist 对象之间的搜索匹配

Package taxlist version 0.2.4


Description

字符向量中提供的名称将使用函数 stringsim() 与存储在类 taxlist 对象中的插槽 taxonNames 中的名称进行比较。


Usage

R 复制代码
match_names(x, object, ...)

## S4 method for signature 'character,character'
match_names(
  x,
  object,
  UsageID,
  best = 1,
  nomatch = TRUE,
  method = "lcs",
  cutlevel = NULL,
  ...
)

## S4 method for signature 'character,missing'
match_names(x, best, cutlevel, nomatch = TRUE, ...)

## S4 method for signature 'character,taxlist'
match_names(
  x,
  object,
  show_concepts = FALSE,
  accepted_only = FALSE,
  include_author = FALSE,
  ...
)

Arguments

参数【x】:用于匹配查找的字符向量。

参数【object】:字符向量或包含用于比较的分类列表的 taxlist 对象。如果缺失,则"x"中每个名称的相似性将与同一向量中的其余名称进行比较。

参数【...】:方法之间传递了进一步的参数。

参数【UsageID】:具有比较列表中单个用法名称的 ID 的向量。如果 ID 重复或与"object"中的名称不同,则该函数将返回错误消息。如果缺少,此函数将重新编号每个名称(请参阅输出对象中的"TaxonUsageID"列)。

参数【best】:指示输出中应显示多少个匹配项的整数值。具有相同相似度值的匹配项将被视为一个匹配项。请注意,此参数将被"cutlevel"覆盖。

参数【nomatch】:输出中应包含一个逻辑值,指示没有匹配项的名称 ('nomatch = TRUE') 或不包含 ('nomatch = FALSE')。

参数【method】:传递给 stringsim() 的进一步参数。

参数【cutlevel】:一个数值,指示相似度的切割水平,将相似度等于或大于切割值的匹配名称视为匹配名称。此参数将覆盖"best"。

参数【show_concepts】:指示是否应在输出中显示相应分类概念的逻辑值。

参数【accepted_only】:指示是只匹配接受的名称还是匹配所有用法名称(包括同义词)的逻辑值。

参数【include_author】:一个逻辑值,指示对象(taxlist 的方法)中的作者姓名是否应包含在匹配列表中。


Examples

++两个字符向量的匹配:++

R 复制代码
## Names to be compared
species <- c("Cyperus papyrus", "Typha australis", "Luke Skywalker")

## Comparing character vectors
match_names(c("Cyperus paper", "TIE fighter"), species)
复制代码
  idx submittedname TaxonUsageID       TaxonName match similarity
1   1 Cyperus paper            1 Cyperus papyrus     1  0.8571429
2   2   TIE fighter            2 Typha australis     1  0.3076923

++在 taxlist 对象中匹配:++

R 复制代码
match_names(species, Easplist)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity
1                               L.     1  1.0000000
2                        Schumach.     1  1.0000000
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485

++并且显示匹配的名称概念:++

R 复制代码
match_names(x = species, object = Easplist, show_concepts = TRUE)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity TaxonConceptID
1                               L.     1  1.0000000            206
2                        Schumach.     1  1.0000000          50105
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485          51565
    AcceptedTaxonName               AcceptedAuthorName   Level
1     Cyperus papyrus                               L. species
2   Typha domingensis                            Pers. species
3 Loudetia kagerensis (K. Schum.) C.E. Hubb. ex Hutch. species

++匹配度高于 0.8:++

R 复制代码
match_names(x = species, object = Easplist, cutlevel = 0.8)
复制代码
  idx   submittedname TaxonUsageID       TaxonName AuthorName match similarity
1   1 Cyperus papyrus          206 Cyperus papyrus         L.     1  1.0000000
2   2 Typha australis        51999 Typha australis  Schumach.     1  1.0000000
3   2 Typha australis        53125  Typha aequalis   Schnizl.     2  0.8275862
4   3  Luke Skywalker           NA            <NA>       <NA>     0         NA
相关推荐
永乐春秋23 分钟前
WEB攻防-通用漏洞&文件上传&js验证&mime&user.ini&语言特性
前端
鸽鸽程序猿25 分钟前
【前端】CSS
前端·css
ggdpzhk27 分钟前
VUE:基于MVVN的前端js框架
前端·javascript·vue.js
远歌已逝1 小时前
维护在线重做日志(二)
数据库·oracle
qq_433099403 小时前
Ubuntu20.04从零安装IsaacSim/IsaacLab
数据库
学不会•3 小时前
css数据不固定情况下,循环加不同背景颜色
前端·javascript·html
Dlwyz3 小时前
redis-击穿、穿透、雪崩
数据库·redis·缓存
工业甲酰苯胺4 小时前
Redis性能优化的18招
数据库·redis·性能优化
活宝小娜5 小时前
vue不刷新浏览器更新页面的方法
前端·javascript·vue.js
程序视点5 小时前
【Vue3新工具】Pinia.js:提升开发效率,更轻量、更高效的状态管理方案!
前端·javascript·vue.js·typescript·vue·ecmascript