如何在WPS实现平行语料库简易检索

平行语料库是非常重要的语言资产,通常可以转化为TMX格式的翻译记忆库,用于计算机辅助翻译实践。我们可以使用Trados, Memoq的翻译记忆库管理工具来实现对翻译记忆库检索,也可以用ParaConc,CUC ParaConc, BFSU ParaConc这些软件来检索平行语料语料库,但是这些工具都有一定的学习成本,在实际操作中并不十分好用。今天我们使用WPS中的表格,附加一个公式来实现一个简易的平行语料库检索功能。

一、确定平行语料库

首先,我们需要准备一个已经做好的平行语料库,比如:治国理政第四卷的平行语料,并把它整理成XLSX格式,形成AB两列中英对照的格式,如下图所示。

二、新建Textbox控件

我们在sheet1中放入准备好的平行语料库,在sheet2中A1中通过:工具------开发工具------文本框,在A1处插入一个文本框控件,并设置其高和宽。

接着,我们点击工具选项卡------设计模式------右击这个textbox控件,在右键菜单中选择【设置对象格式】

然后,在右侧弹出的文本框设置界面,把Linkedcell设置为A1,这样我们在文本框输入的数据自动会传给A1。

三、应用公式

配置完搜索框后,我们可以在A2单元格式中输入以下公式:

vbscript 复制代码
=IF(A1="","",FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!A:A)),FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!B:B)))))

这个公式的公式利用if来判断A1的内容是否为空,然后传递给FILTER函数对Sheet1中AB两列数据进行匹配搜索,如果能用函数SEARCH找到包含A1关键词的句子就用ISNUMBER函数转化为布尔值True,然后用FILTER函数提取出来显示在下方。

这个公式可以实现对中文和英文的检索,虽然比较简易,但是执行速度快,不需要额外的软件也不需要VBA编程,非常实用。

四、学后总结

  1. 上面这种方法可以用于海量语料库的快速检索,提取包含有关键词的中英语句,对于术语提取、译文学习非常有帮助。

  2. WPS最近更新了很多函数如regexp, scan, xlookup等,如果我们把这些函数综合写成公式应用到我们的语料库检索和翻译学习,一定要以事半功倍。

  3. 后期将通过修改公式,把这项功能进行扩展,比如支持正则检索,或者上传共享文档,分享给指定人群在线使用等等。

相关推荐
XDHCOM11 小时前
ORA-32484重复列名错误,ORACLE数据库CYCLE子句故障修复与远程处理方案
数据库·oracle
翻斗包菜11 小时前
PostgreSQL 日常维护完全指南:从基础操作到高级运维
运维·数据库·postgresql
呆瑜nuage11 小时前
MySQL表约束详解:8大核心约束实战指南
数据库·mysql
liliangcsdn11 小时前
Agent Memory智能体记忆系统的示例分析
数据库·人工智能·全文检索
那个失眠的夜11 小时前
Mybatis延迟加载策略
xml·java·数据库·maven·mybatis
Rick199311 小时前
SQL 执行流程
数据库·sql
M--Y11 小时前
Redis常用数据类型
数据结构·数据库·redis
猿小喵12 小时前
MySQL慢查询分析与处理-第二篇
数据库·mysql·性能优化
Y0011123612 小时前
MySQL-进阶
开发语言·数据库·sql·mysql
徒 花13 小时前
数据库知识复习01
数据库