R语言【taxlist】——match_names():字符和 taxlist 对象之间的搜索匹配

Package taxlist version 0.2.4


Description

字符向量中提供的名称将使用函数 stringsim() 与存储在类 taxlist 对象中的插槽 taxonNames 中的名称进行比较。


Usage

R 复制代码
match_names(x, object, ...)

## S4 method for signature 'character,character'
match_names(
  x,
  object,
  UsageID,
  best = 1,
  nomatch = TRUE,
  method = "lcs",
  cutlevel = NULL,
  ...
)

## S4 method for signature 'character,missing'
match_names(x, best, cutlevel, nomatch = TRUE, ...)

## S4 method for signature 'character,taxlist'
match_names(
  x,
  object,
  show_concepts = FALSE,
  accepted_only = FALSE,
  include_author = FALSE,
  ...
)

Arguments

参数【x】:用于匹配查找的字符向量。

参数【object】:字符向量或包含用于比较的分类列表的 taxlist 对象。如果缺失,则"x"中每个名称的相似性将与同一向量中的其余名称进行比较。

参数【...】:方法之间传递了进一步的参数。

参数【UsageID】:具有比较列表中单个用法名称的 ID 的向量。如果 ID 重复或与"object"中的名称不同,则该函数将返回错误消息。如果缺少,此函数将重新编号每个名称(请参阅输出对象中的"TaxonUsageID"列)。

参数【best】:指示输出中应显示多少个匹配项的整数值。具有相同相似度值的匹配项将被视为一个匹配项。请注意,此参数将被"cutlevel"覆盖。

参数【nomatch】:输出中应包含一个逻辑值,指示没有匹配项的名称 ('nomatch = TRUE') 或不包含 ('nomatch = FALSE')。

参数【method】:传递给 stringsim() 的进一步参数。

参数【cutlevel】:一个数值,指示相似度的切割水平,将相似度等于或大于切割值的匹配名称视为匹配名称。此参数将覆盖"best"。

参数【show_concepts】:指示是否应在输出中显示相应分类概念的逻辑值。

参数【accepted_only】:指示是只匹配接受的名称还是匹配所有用法名称(包括同义词)的逻辑值。

参数【include_author】:一个逻辑值,指示对象(taxlist 的方法)中的作者姓名是否应包含在匹配列表中。


Examples

++两个字符向量的匹配:++

R 复制代码
## Names to be compared
species <- c("Cyperus papyrus", "Typha australis", "Luke Skywalker")

## Comparing character vectors
match_names(c("Cyperus paper", "TIE fighter"), species)
复制代码
  idx submittedname TaxonUsageID       TaxonName match similarity
1   1 Cyperus paper            1 Cyperus papyrus     1  0.8571429
2   2   TIE fighter            2 Typha australis     1  0.3076923

++在 taxlist 对象中匹配:++

R 复制代码
match_names(species, Easplist)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity
1                               L.     1  1.0000000
2                        Schumach.     1  1.0000000
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485

++并且显示匹配的名称概念:++

R 复制代码
match_names(x = species, object = Easplist, show_concepts = TRUE)
复制代码
  idx   submittedname TaxonUsageID           TaxonName
1   1 Cyperus papyrus          206     Cyperus papyrus
2   2 Typha australis        51999     Typha australis
3   3  Luke Skywalker        51565 Loudetia kagerensis
                        AuthorName match similarity TaxonConceptID
1                               L.     1  1.0000000            206
2                        Schumach.     1  1.0000000          50105
3 (K. Schum.) C.E. Hubb. ex Hutch.     1  0.4848485          51565
    AcceptedTaxonName               AcceptedAuthorName   Level
1     Cyperus papyrus                               L. species
2   Typha domingensis                            Pers. species
3 Loudetia kagerensis (K. Schum.) C.E. Hubb. ex Hutch. species

++匹配度高于 0.8:++

R 复制代码
match_names(x = species, object = Easplist, cutlevel = 0.8)
复制代码
  idx   submittedname TaxonUsageID       TaxonName AuthorName match similarity
1   1 Cyperus papyrus          206 Cyperus papyrus         L.     1  1.0000000
2   2 Typha australis        51999 Typha australis  Schumach.     1  1.0000000
3   2 Typha australis        53125  Typha aequalis   Schnizl.     2  0.8275862
4   3  Luke Skywalker           NA            <NA>       <NA>     0         NA
相关推荐
玄同7654 分钟前
SQLite + LLM:大模型应用落地的轻量级数据存储方案
jvm·数据库·人工智能·python·语言模型·sqlite·知识图谱
吾日三省吾码6 分钟前
别只会“加索引”了!这 3 个 PostgreSQL 反常识优化,能把性能和成本一起打下来
数据库·postgresql
chian-ocean7 分钟前
百万级图文检索实战:`ops-transformer` + 向量数据库构建语义搜索引擎
数据库·搜索引擎·transformer
吃杠碰小鸡20 分钟前
高中数学-数列-导数证明
前端·数学·算法
kingwebo'sZone26 分钟前
C#使用Aspose.Words把 word转成图片
前端·c#·word
小Tomkk27 分钟前
数据库 变更和版本控制管理工具 --Bytebase 安装部署(linux 安装篇)
linux·运维·数据库·ci/cd·bytebase
xjt_09011 小时前
基于 Vue 3 构建企业级 Web Components 组件库
前端·javascript·vue.js
qq_12498707531 小时前
基于JavaWeb的大学生房屋租赁系统(源码+论文+部署+安装)
java·数据库·人工智能·spring boot·计算机视觉·毕业设计·计算机毕业设计
我是伪码农1 小时前
Vue 2.3
前端·javascript·vue.js
夜郎king1 小时前
HTML5 SVG 实现日出日落动画与实时天气可视化
前端·html5·svg 日出日落