如何在WPS实现平行语料库简易检索

平行语料库是非常重要的语言资产,通常可以转化为TMX格式的翻译记忆库,用于计算机辅助翻译实践。我们可以使用Trados, Memoq的翻译记忆库管理工具来实现对翻译记忆库检索,也可以用ParaConc,CUC ParaConc, BFSU ParaConc这些软件来检索平行语料语料库,但是这些工具都有一定的学习成本,在实际操作中并不十分好用。今天我们使用WPS中的表格,附加一个公式来实现一个简易的平行语料库检索功能。

一、确定平行语料库

首先,我们需要准备一个已经做好的平行语料库,比如:治国理政第四卷的平行语料,并把它整理成XLSX格式,形成AB两列中英对照的格式,如下图所示。

二、新建Textbox控件

我们在sheet1中放入准备好的平行语料库,在sheet2中A1中通过:工具------开发工具------文本框,在A1处插入一个文本框控件,并设置其高和宽。

接着,我们点击工具选项卡------设计模式------右击这个textbox控件,在右键菜单中选择【设置对象格式】

然后,在右侧弹出的文本框设置界面,把Linkedcell设置为A1,这样我们在文本框输入的数据自动会传给A1。

三、应用公式

配置完搜索框后,我们可以在A2单元格式中输入以下公式:

vbscript 复制代码
=IF(A1="","",FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!A:A)),FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!B:B)))))

这个公式的公式利用if来判断A1的内容是否为空,然后传递给FILTER函数对Sheet1中AB两列数据进行匹配搜索,如果能用函数SEARCH找到包含A1关键词的句子就用ISNUMBER函数转化为布尔值True,然后用FILTER函数提取出来显示在下方。

这个公式可以实现对中文和英文的检索,虽然比较简易,但是执行速度快,不需要额外的软件也不需要VBA编程,非常实用。

四、学后总结

  1. 上面这种方法可以用于海量语料库的快速检索,提取包含有关键词的中英语句,对于术语提取、译文学习非常有帮助。

  2. WPS最近更新了很多函数如regexp, scan, xlookup等,如果我们把这些函数综合写成公式应用到我们的语料库检索和翻译学习,一定要以事半功倍。

  3. 后期将通过修改公式,把这项功能进行扩展,比如支持正则检索,或者上传共享文档,分享给指定人群在线使用等等。

相关推荐
Maverick062 小时前
Oracle Redo 日志操作手册
数据库·oracle
攒了一袋星辰2 小时前
高并发强一致性顺序号生成系统 -- SequenceGenerator
java·数据库·mysql
W.D.小糊涂2 小时前
gpu服务器安装windows+ubuntu24.04双系统
c语言·开发语言·数据库
云贝教育-郑老师2 小时前
【OceanBase 的多租户架构是怎样的?有什么优势?】
数据库·oceanbase
顶点多余3 小时前
使用C/C++语言链接Mysql详解
数据库·c++·mysql
xiaokangzhe3 小时前
MySQL 数据库操作
数据库·oracle
发际线还在4 小时前
互联网大厂Java三轮面试全流程实战问答与解析
java·数据库·分布式·面试·并发·系统设计·大厂
小王不爱笑1325 小时前
MyBatis 执行流程源码级深度解析:从 Mapper 接口到 SQL 执行的全链路逻辑
数据库·sql·mybatis
山峰哥5 小时前
SQL优化实战:从索引策略到执行计划的极致突破
数据库·sql·性能优化·编辑器·深度优先
总要冲动一次6 小时前
离线安装 percona-xtrabackup-24
linux·数据库·mysql·centos