R语言【taxlist】——match_names():字符和 taxlist 对象之间的搜索匹配

Package taxlist version 0.2.4


Description

字符向量中提供的名称将使用函数 stringsim() 与存储在类 taxlist 对象中的插槽 taxonNames 中的名称进行比较。


Usage

R 复制代码
match_names(x, object, ...)

## S4 method for signature 'character,character'
match_names(
  x,
  object,
  UsageID,
  best = 1,
  nomatch = TRUE,
  method = "lcs",
  cutlevel = NULL,
  ...
)

## S4 method for signature 'character,missing'
match_names(x, best, cutlevel, nomatch = TRUE, ...)

## S4 method for signature 'character,taxlist'
match_names(
  x,
  object,
  show_concepts = FALSE,
  accepted_only = FALSE,
  include_author = FALSE,
  ...
)

Arguments

参数【x】:用于匹配查找的字符向量。

参数【object】:字符向量或包含用于比较的分类列表的 taxlist 对象。如果缺失,则"x"中每个名称的相似性将与同一向量中的其余名称进行比较。

参数【...】:方法之间传递了进一步的参数。

参数【UsageID】:具有比较列表中单个用法名称的 ID 的向量。如果 ID 重复或与"object"中的名称不同,则该函数将返回错误消息。如果缺少,此函数将重新编号每个名称(请参阅输出对象中的"TaxonUsageID"列)。

参数【best】:指示输出中应显示多少个匹配项的整数值。具有相同相似度值的匹配项将被视为一个匹配项。请注意,此参数将被"cutlevel"覆盖。

参数【nomatch】:输出中应包含一个逻辑值,指示没有匹配项的名称 ('nomatch = TRUE') 或不包含 ('nomatch = FALSE')。

参数【method】:传递给 stringsim() 的进一步参数。

参数【cutlevel】:一个数值,指示相似度的切割水平,将相似度等于或大于切割值的匹配名称视为匹配名称。此参数将覆盖"best"。

参数【show_concepts】:指示是否应在输出中显示相应分类概念的逻辑值。

参数【accepted_only】:指示是只匹配接受的名称还是匹配所有用法名称(包括同义词)的逻辑值。

参数【include_author】:一个逻辑值,指示对象(taxlist 的方法)中的作者姓名是否应包含在匹配列表中。


Examples

++两个字符向量的匹配:++

R 复制代码
## Names to be compared
species <- c("Cyperus papyrus", "Typha australis", "Luke Skywalker")

## Comparing character vectors
match_names(c("Cyperus paper", "TIE fighter"), species)
复制代码
  idx submittedname TaxonUsageID       TaxonName match similarity
1   1 Cyperus paper            1 Cyperus papyrus     1  0.8571429
2   2   TIE fighter            2 Typha australis     1  0.3076923

++在 taxlist 对象中匹配:++

R 复制代码
match_names(species, Easplist)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity
1                               L.     1  1.0000000
2                        Schumach.     1  1.0000000
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485

++并且显示匹配的名称概念:++

R 复制代码
match_names(x = species, object = Easplist, show_concepts = TRUE)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity TaxonConceptID
1                               L.     1  1.0000000            206
2                        Schumach.     1  1.0000000          50105
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485          51565
    AcceptedTaxonName               AcceptedAuthorName   Level
1     Cyperus papyrus                               L. species
2   Typha domingensis                            Pers. species
3 Loudetia kagerensis (K. Schum.) C.E. Hubb. ex Hutch. species

++匹配度高于 0.8:++

R 复制代码
match_names(x = species, object = Easplist, cutlevel = 0.8)
复制代码
  idx   submittedname TaxonUsageID       TaxonName AuthorName match similarity
1   1 Cyperus papyrus          206 Cyperus papyrus         L.     1  1.0000000
2   2 Typha australis        51999 Typha australis  Schumach.     1  1.0000000
3   2 Typha australis        53125  Typha aequalis   Schnizl.     2  0.8275862
4   3  Luke Skywalker           NA            <NA>       <NA>     0         NA
相关推荐
simon_luv_pho12 分钟前
一行代码把网页变成 AI Agent?
前端
兆子龙19 分钟前
模块联邦(Module Federation)详解:从概念到手把手 Demo
前端·架构
ZFSS22 分钟前
Kimi Chat Completion API 申请及使用
前端·人工智能
没想好d22 分钟前
通用管理后台组件库-8-表格组件
前端
前端Hardy27 分钟前
HTML&CSS&JS:打造丝滑的3D彩纸飘落特效
前端·javascript·css
布列瑟农的星空1 小时前
rsbuild mock 插件开发指南
前端
用泥种荷花1 小时前
【LangChain.js学习】 文档加载(Loader)与文本分割全解析
前端
cxxcode2 小时前
Vite 热更新(HMR)原理详解
前端
HelloReader2 小时前
Tauri 架构从“WebView + Rust”到完整工具链与生态
前端
李广坤2 小时前
MySQL 大表字段变更实践(改名 + 改类型 + 改长度)
数据库