如何在WPS实现平行语料库简易检索

平行语料库是非常重要的语言资产,通常可以转化为TMX格式的翻译记忆库,用于计算机辅助翻译实践。我们可以使用Trados, Memoq的翻译记忆库管理工具来实现对翻译记忆库检索,也可以用ParaConc,CUC ParaConc, BFSU ParaConc这些软件来检索平行语料语料库,但是这些工具都有一定的学习成本,在实际操作中并不十分好用。今天我们使用WPS中的表格,附加一个公式来实现一个简易的平行语料库检索功能。

一、确定平行语料库

首先,我们需要准备一个已经做好的平行语料库,比如:治国理政第四卷的平行语料,并把它整理成XLSX格式,形成AB两列中英对照的格式,如下图所示。

二、新建Textbox控件

我们在sheet1中放入准备好的平行语料库,在sheet2中A1中通过:工具------开发工具------文本框,在A1处插入一个文本框控件,并设置其高和宽。

接着,我们点击工具选项卡------设计模式------右击这个textbox控件,在右键菜单中选择【设置对象格式】

然后,在右侧弹出的文本框设置界面,把Linkedcell设置为A1,这样我们在文本框输入的数据自动会传给A1。

三、应用公式

配置完搜索框后,我们可以在A2单元格式中输入以下公式:

vbscript 复制代码
=IF(A1="","",FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!A:A)),FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!B:B)))))

这个公式的公式利用if来判断A1的内容是否为空,然后传递给FILTER函数对Sheet1中AB两列数据进行匹配搜索,如果能用函数SEARCH找到包含A1关键词的句子就用ISNUMBER函数转化为布尔值True,然后用FILTER函数提取出来显示在下方。

这个公式可以实现对中文和英文的检索,虽然比较简易,但是执行速度快,不需要额外的软件也不需要VBA编程,非常实用。

四、学后总结

  1. 上面这种方法可以用于海量语料库的快速检索,提取包含有关键词的中英语句,对于术语提取、译文学习非常有帮助。

  2. WPS最近更新了很多函数如regexp, scan, xlookup等,如果我们把这些函数综合写成公式应用到我们的语料库检索和翻译学习,一定要以事半功倍。

  3. 后期将通过修改公式,把这项功能进行扩展,比如支持正则检索,或者上传共享文档,分享给指定人群在线使用等等。

相关推荐
jiayou6414 小时前
KingbaseES 表级与列级加密完全指南
数据库·后端
GBASE1 天前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库
xiezhr2 天前
逛GitHub发现了一款免费的带AI功能的数据库管理工具
数据库·ai编程·dba
吃糖的小孩3 天前
给 QQ AI 机器人设计“可控记忆”:会话摘要、手动长期记忆与角色卡边界
数据库
笃行3504 天前
金仓数据库数据安全双防线:静态存储加密与传输加密实战
数据库
笃行3504 天前
金仓数据库物理备份实战:sys_rman 全流程演练与误覆盖抢救
数据库
笃行3504 天前
金仓数据库逻辑备份实战:从全库导出到 Schema 替换的完整闭环
数据库
SelectDB4 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
这个DBA有点耶4 天前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构