第五章 使用 SQL Search - 验证 SQL 搜索项字符串

文章目录

  • [第五章 使用 SQL Search - 验证 SQL 搜索项字符串](#第五章 使用 SQL Search - 验证 SQL 搜索项字符串)
  • [验证 SQL 搜索项字符串](#验证 SQL 搜索项字符串)
  • 模糊搜索

验证 SQL 搜索项字符串

可以使用 %iFind.Utils.TestSearchString()在方法来验证 search_items 字符串。此方法使能够检测语法错误和逻辑运算符的不明确使用。例如,"word1 AND word2 OR word3"未通过验证,因为它在逻辑上不明确。添加括号可将此字符串澄清为"word1 AND (word2 OR word3)"或"(word1 AND word2) OR word3"

以下示例将此 SQL 搜索实用程序作为 SQL 函数调用:

sql 复制代码
SELECT %iFind.TestSearchString('orange AND (lemon OR lime)')

TestSearchString() 返回 %Status 值:有效的 search_items 字符串返回状态 1。无效的 search_items 字符串返回以 0 开头的对象表达式,后跟编码的错误信息。

模糊搜索

SQL 搜索支持模糊搜索来匹配包含"几乎almost"与搜索字符串匹配的元素(words or entities)的记录。模糊搜索可用于解决书写中的微小变化(color vs. colour)、拼写错误(collor vs color)以及不同的语法形式(color vs. colors)

SQL 搜索通过比较两个单词之间的编辑距离来评估模糊匹配。编辑距离是将一个单词更改为另一个单词所需的最小单字符编辑(插入、删除或替换)次数。所需的单字符编辑的最大数量称为最大编辑距离。 SQL 搜索最大编辑距离默认为 2 个字符。最大编辑距离分别应用于搜索字符串中的每个元素。对于 SQL Search Basic 索引,它应用于搜索字符串中的每个单词。对于 SQL 搜索语义索引,它应用于搜索字符串中的每个 NLP 实体。 (以下示例假定使用 SQL Search Basic 索引。)

例如,当最大编辑距离 = 2 时,短语 "analyse programme behaviour""analyze program behavior"的模糊搜索匹配,因为搜索字符串中的每个单词的编辑距离相差(最多)2 个字符: analyse=analyze1 个替换),programme=program2 个删除)behaviour=behavior1 个删除)。

小于或等于最大编辑距离的单词是对具有相同或更少字符数的任何单词的模糊搜索匹配。例如,如果编辑距离为 2,则单词"ab"将匹配任何两个字母单词(2 个替换)、任何一个字母单词(1 个替换、1 个删除)、任何包含"a"的三个字母单词或"b"(1 次替换,1 次插入),以及按该顺序同时包含"a"和"b"的任何四字母单词(2 次插入)。

  • 所有 SQL 搜索索引类型都支持模糊搜索:基本、语义和分析。在基本索引上,它对单个单词执行模糊搜索。在语义索引上,它对各个 NLP 实体执行模糊搜索。
  • 模糊搜索不能与通配符搜索结合使用。

要激活 search_index() 的模糊搜索,请将 search_option 指定为 3(默认编辑距离为 2 的模糊搜索)或 3:n(编辑距离指定为 n 个字符的模糊搜索)。以下示例显示了编辑距离为 4 的模糊搜索的 SQL 搜索:

sql 复制代码
SELECT Narrative FROM Aviation.TestSQLSrch WHERE %ID %FIND 
search_index(NarrBasicIdx,'"color code" program','3:4','en')

设置 3:1 设置编辑distance=1,这在英语中适合匹配大多数(但不是全部)单数和复数单词。设置3:0设置编辑distance=0,这与没有模糊搜索的SQL搜索相同。

要为 SQL 搜索方法指定模糊搜索,请设置 pSearchOption = $$$IFSEARCHFUZZY

相关推荐
大家的林语冰5 小时前
ES5 凉凉,Babel 8 正式发布,默认不再编译为 ES5 和 CJS......
前端·javascript·前端工程化
weedsfly7 小时前
异步编程全景与事件循环——彻底搞懂 JS 执行机制
前端·javascript
用户1733598075377 小时前
纯前端 PDF 数字签名实战:Vue 3 + pdf-lib 在浏览器里完成签名嵌入
前端·javascript
BingoGo8 小时前
PHP 泛型之殇 泛型 RFC 提案被拒绝
后端·php
JaguarJack8 小时前
PHP 泛型之殇 泛型 RFC 提案被拒绝
后端·php
JieE21218 小时前
LeetCode 226. 翻转二叉树|JS 递归超详细拆解,二叉树入门经典题
javascript·算法
JieE21218 小时前
LeetCode 104. 二叉树的最大深度|递归思路超详细拆解
javascript·算法
kyriewen1 天前
我用 AI 一周写完了整个项目,上线第一天就崩了——这是我踩过最贵的 5 个坑
前端·javascript·ai编程
Larcher1 天前
AI Loop:让AI像人一样自主完成任务的核心机制
javascript·人工智能·设计模式
默_笙1 天前
🃏 JS 只有 8 种数据类型,但我花了 2 天才搞懂 null 和 undefined 的区别
javascript