第五章 使用 SQL Search - 验证 SQL 搜索项字符串

文章目录

  • [第五章 使用 SQL Search - 验证 SQL 搜索项字符串](#第五章 使用 SQL Search - 验证 SQL 搜索项字符串)
  • [验证 SQL 搜索项字符串](#验证 SQL 搜索项字符串)
  • 模糊搜索

验证 SQL 搜索项字符串

可以使用 %iFind.Utils.TestSearchString()在方法来验证 search_items 字符串。此方法使能够检测语法错误和逻辑运算符的不明确使用。例如,"word1 AND word2 OR word3"未通过验证,因为它在逻辑上不明确。添加括号可将此字符串澄清为"word1 AND (word2 OR word3)"或"(word1 AND word2) OR word3"

以下示例将此 SQL 搜索实用程序作为 SQL 函数调用:

sql 复制代码
SELECT %iFind.TestSearchString('orange AND (lemon OR lime)')

TestSearchString() 返回 %Status 值:有效的 search_items 字符串返回状态 1。无效的 search_items 字符串返回以 0 开头的对象表达式,后跟编码的错误信息。

模糊搜索

SQL 搜索支持模糊搜索来匹配包含"几乎almost"与搜索字符串匹配的元素(words or entities)的记录。模糊搜索可用于解决书写中的微小变化(color vs. colour)、拼写错误(collor vs color)以及不同的语法形式(color vs. colors)

SQL 搜索通过比较两个单词之间的编辑距离来评估模糊匹配。编辑距离是将一个单词更改为另一个单词所需的最小单字符编辑(插入、删除或替换)次数。所需的单字符编辑的最大数量称为最大编辑距离。 SQL 搜索最大编辑距离默认为 2 个字符。最大编辑距离分别应用于搜索字符串中的每个元素。对于 SQL Search Basic 索引,它应用于搜索字符串中的每个单词。对于 SQL 搜索语义索引,它应用于搜索字符串中的每个 NLP 实体。 (以下示例假定使用 SQL Search Basic 索引。)

例如,当最大编辑距离 = 2 时,短语 "analyse programme behaviour""analyze program behavior"的模糊搜索匹配,因为搜索字符串中的每个单词的编辑距离相差(最多)2 个字符: analyse=analyze1 个替换),programme=program2 个删除)behaviour=behavior1 个删除)。

小于或等于最大编辑距离的单词是对具有相同或更少字符数的任何单词的模糊搜索匹配。例如,如果编辑距离为 2,则单词"ab"将匹配任何两个字母单词(2 个替换)、任何一个字母单词(1 个替换、1 个删除)、任何包含"a"的三个字母单词或"b"(1 次替换,1 次插入),以及按该顺序同时包含"a"和"b"的任何四字母单词(2 次插入)。

  • 所有 SQL 搜索索引类型都支持模糊搜索:基本、语义和分析。在基本索引上,它对单个单词执行模糊搜索。在语义索引上,它对各个 NLP 实体执行模糊搜索。
  • 模糊搜索不能与通配符搜索结合使用。

要激活 search_index() 的模糊搜索,请将 search_option 指定为 3(默认编辑距离为 2 的模糊搜索)或 3:n(编辑距离指定为 n 个字符的模糊搜索)。以下示例显示了编辑距离为 4 的模糊搜索的 SQL 搜索:

sql 复制代码
SELECT Narrative FROM Aviation.TestSQLSrch WHERE %ID %FIND 
search_index(NarrBasicIdx,'"color code" program','3:4','en')

设置 3:1 设置编辑distance=1,这在英语中适合匹配大多数(但不是全部)单数和复数单词。设置3:0设置编辑distance=0,这与没有模糊搜索的SQL搜索相同。

要为 SQL 搜索方法指定模糊搜索,请设置 pSearchOption = $$$IFSEARCHFUZZY

相关推荐
前端小巷子6 分钟前
深入理解TCP协议
前端·javascript·面试
presenttttt34 分钟前
用Python和OpenCV从零搭建一个完整的双目视觉系统(四)
开发语言·python·opencv·计算机视觉
每日出拳老爷子40 分钟前
[C#] 使用TextBox换行失败的原因与解决方案:换用RichTextBox的实战经验
开发语言·c#
半桔43 分钟前
【Linux手册】从接口到管理:Linux文件系统的核心操作指南
android·java·linux·开发语言·面试·系统架构
nightunderblackcat1 小时前
新手向:实现ATM模拟系统
java·开发语言·spring boot·spring cloud·tomcat·maven·intellij-idea
开开心心就好1 小时前
电脑息屏工具,一键黑屏超方便
开发语言·javascript·电脑·scala·erlang·perl
笑衬人心。1 小时前
Java 17 新特性笔记
java·开发语言·笔记
web守墓人2 小时前
【前端】ikun-markdown: 纯js实现markdown到富文本html的转换库
前端·javascript·html
序属秋秋秋2 小时前
《C++初阶之内存管理》【内存分布 + operator new/delete + 定位new】
开发语言·c++·笔记·学习
ruan1145143 小时前
MySQL4种隔离级别
java·开发语言·mysql