R语言【taxlist】——match_names():字符和 taxlist 对象之间的搜索匹配

Package taxlist version 0.2.4


Description

字符向量中提供的名称将使用函数 stringsim() 与存储在类 taxlist 对象中的插槽 taxonNames 中的名称进行比较。


Usage

R 复制代码
match_names(x, object, ...)

## S4 method for signature 'character,character'
match_names(
  x,
  object,
  UsageID,
  best = 1,
  nomatch = TRUE,
  method = "lcs",
  cutlevel = NULL,
  ...
)

## S4 method for signature 'character,missing'
match_names(x, best, cutlevel, nomatch = TRUE, ...)

## S4 method for signature 'character,taxlist'
match_names(
  x,
  object,
  show_concepts = FALSE,
  accepted_only = FALSE,
  include_author = FALSE,
  ...
)

Arguments

参数【x】:用于匹配查找的字符向量。

参数【object】:字符向量或包含用于比较的分类列表的 taxlist 对象。如果缺失,则"x"中每个名称的相似性将与同一向量中的其余名称进行比较。

参数【...】:方法之间传递了进一步的参数。

参数【UsageID】:具有比较列表中单个用法名称的 ID 的向量。如果 ID 重复或与"object"中的名称不同,则该函数将返回错误消息。如果缺少,此函数将重新编号每个名称(请参阅输出对象中的"TaxonUsageID"列)。

参数【best】:指示输出中应显示多少个匹配项的整数值。具有相同相似度值的匹配项将被视为一个匹配项。请注意,此参数将被"cutlevel"覆盖。

参数【nomatch】:输出中应包含一个逻辑值,指示没有匹配项的名称 ('nomatch = TRUE') 或不包含 ('nomatch = FALSE')。

参数【method】:传递给 stringsim() 的进一步参数。

参数【cutlevel】:一个数值,指示相似度的切割水平,将相似度等于或大于切割值的匹配名称视为匹配名称。此参数将覆盖"best"。

参数【show_concepts】:指示是否应在输出中显示相应分类概念的逻辑值。

参数【accepted_only】:指示是只匹配接受的名称还是匹配所有用法名称(包括同义词)的逻辑值。

参数【include_author】:一个逻辑值,指示对象(taxlist 的方法)中的作者姓名是否应包含在匹配列表中。


Examples

++两个字符向量的匹配:++

R 复制代码
## Names to be compared
species <- c("Cyperus papyrus", "Typha australis", "Luke Skywalker")

## Comparing character vectors
match_names(c("Cyperus paper", "TIE fighter"), species)
复制代码
  idx submittedname TaxonUsageID       TaxonName match similarity
1   1 Cyperus paper            1 Cyperus papyrus     1  0.8571429
2   2   TIE fighter            2 Typha australis     1  0.3076923

++在 taxlist 对象中匹配:++

R 复制代码
match_names(species, Easplist)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity
1                               L.     1  1.0000000
2                        Schumach.     1  1.0000000
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485

++并且显示匹配的名称概念:++

R 复制代码
match_names(x = species, object = Easplist, show_concepts = TRUE)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity TaxonConceptID
1                               L.     1  1.0000000            206
2                        Schumach.     1  1.0000000          50105
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485          51565
    AcceptedTaxonName               AcceptedAuthorName   Level
1     Cyperus papyrus                               L. species
2   Typha domingensis                            Pers. species
3 Loudetia kagerensis (K. Schum.) C.E. Hubb. ex Hutch. species

++匹配度高于 0.8:++

R 复制代码
match_names(x = species, object = Easplist, cutlevel = 0.8)
复制代码
  idx   submittedname TaxonUsageID       TaxonName AuthorName match similarity
1   1 Cyperus papyrus          206 Cyperus papyrus         L.     1  1.0000000
2   2 Typha australis        51999 Typha australis  Schumach.     1  1.0000000
3   2 Typha australis        53125  Typha aequalis   Schnizl.     2  0.8275862
4   3  Luke Skywalker           NA            <NA>       <NA>     0         NA
相关推荐
猿小喵33 分钟前
MySQL四种隔离级别
数据库·mysql
Y编程小白39 分钟前
Redis可视化工具--RedisDesktopManager的安装
数据库·redis·缓存
洪小帅1 小时前
Django 的 `Meta` 类和外键的使用
数据库·python·django·sqlite
Channing Lewis1 小时前
如何实现网页不用刷新也能更新
前端
祁思妙想1 小时前
【LeetCode】--- MySQL刷题集合
数据库·mysql
V+zmm101342 小时前
教育培训微信小程序ssm+论文源码调试讲解
java·数据库·微信小程序·小程序·毕业设计
m0_748248022 小时前
【MySQL】C# 连接MySQL
数据库·mysql·c#
努力搬砖的程序媛儿2 小时前
uniapp广告飘窗
前端·javascript·uni-app
dfh00l2 小时前
firefox屏蔽debugger()
前端·firefox
张人玉3 小时前
小白误入(需要一定的vue基础 )使用node建立服务器——vue前端登录注册页面连接到数据库
服务器·前端·vue.js