如何在WPS实现平行语料库简易检索

平行语料库是非常重要的语言资产,通常可以转化为TMX格式的翻译记忆库,用于计算机辅助翻译实践。我们可以使用Trados, Memoq的翻译记忆库管理工具来实现对翻译记忆库检索,也可以用ParaConc,CUC ParaConc, BFSU ParaConc这些软件来检索平行语料语料库,但是这些工具都有一定的学习成本,在实际操作中并不十分好用。今天我们使用WPS中的表格,附加一个公式来实现一个简易的平行语料库检索功能。

一、确定平行语料库

首先,我们需要准备一个已经做好的平行语料库,比如:治国理政第四卷的平行语料,并把它整理成XLSX格式,形成AB两列中英对照的格式,如下图所示。

二、新建Textbox控件

我们在sheet1中放入准备好的平行语料库,在sheet2中A1中通过:工具------开发工具------文本框,在A1处插入一个文本框控件,并设置其高和宽。

接着,我们点击工具选项卡------设计模式------右击这个textbox控件,在右键菜单中选择【设置对象格式】

然后,在右侧弹出的文本框设置界面,把Linkedcell设置为A1,这样我们在文本框输入的数据自动会传给A1。

三、应用公式

配置完搜索框后,我们可以在A2单元格式中输入以下公式:

vbscript 复制代码
=IF(A1="","",FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!A:A)),FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!B:B)))))

这个公式的公式利用if来判断A1的内容是否为空,然后传递给FILTER函数对Sheet1中AB两列数据进行匹配搜索,如果能用函数SEARCH找到包含A1关键词的句子就用ISNUMBER函数转化为布尔值True,然后用FILTER函数提取出来显示在下方。

这个公式可以实现对中文和英文的检索,虽然比较简易,但是执行速度快,不需要额外的软件也不需要VBA编程,非常实用。

四、学后总结

  1. 上面这种方法可以用于海量语料库的快速检索,提取包含有关键词的中英语句,对于术语提取、译文学习非常有帮助。

  2. WPS最近更新了很多函数如regexp, scan, xlookup等,如果我们把这些函数综合写成公式应用到我们的语料库检索和翻译学习,一定要以事半功倍。

  3. 后期将通过修改公式,把这项功能进行扩展,比如支持正则检索,或者上传共享文档,分享给指定人群在线使用等等。

相关推荐
爱可生开源社区1 天前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
随逸1771 天前
《从零搭建NestJS项目》
数据库·typescript
加号32 天前
windows系统下mysql多源数据库同步部署
数据库·windows·mysql
シ風箏2 天前
MySQL【部署 04】Docker部署 MySQL8.0.32 版本(网盘镜像及启动命令分享)
数据库·mysql·docker
李慕婉学姐2 天前
Springboot智慧社区系统设计与开发6n99s526(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库·spring boot·后端
百锦再2 天前
Django实现接口token检测的实现方案
数据库·python·django·sqlite·flask·fastapi·pip
tryCbest2 天前
数据库SQL学习
数据库·sql
jnrjian2 天前
ORA-01017 查找机器名 用户名 以及library cache lock 参数含义
数据库·oracle
十月南城2 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark
Henry Zhu1232 天前
数据库:并发控制基本概念
服务器·数据库