如何在WPS实现平行语料库简易检索

平行语料库是非常重要的语言资产,通常可以转化为TMX格式的翻译记忆库,用于计算机辅助翻译实践。我们可以使用Trados, Memoq的翻译记忆库管理工具来实现对翻译记忆库检索,也可以用ParaConc,CUC ParaConc, BFSU ParaConc这些软件来检索平行语料语料库,但是这些工具都有一定的学习成本,在实际操作中并不十分好用。今天我们使用WPS中的表格,附加一个公式来实现一个简易的平行语料库检索功能。

一、确定平行语料库

首先,我们需要准备一个已经做好的平行语料库,比如:治国理政第四卷的平行语料,并把它整理成XLSX格式,形成AB两列中英对照的格式,如下图所示。

二、新建Textbox控件

我们在sheet1中放入准备好的平行语料库,在sheet2中A1中通过:工具------开发工具------文本框,在A1处插入一个文本框控件,并设置其高和宽。

接着,我们点击工具选项卡------设计模式------右击这个textbox控件,在右键菜单中选择【设置对象格式】

然后,在右侧弹出的文本框设置界面,把Linkedcell设置为A1,这样我们在文本框输入的数据自动会传给A1。

三、应用公式

配置完搜索框后,我们可以在A2单元格式中输入以下公式:

vbscript 复制代码
=IF(A1="","",FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!A:A)),FILTER(Sheet1!$A:$B,ISNUMBER(SEARCH(A1,Sheet1!B:B)))))

这个公式的公式利用if来判断A1的内容是否为空,然后传递给FILTER函数对Sheet1中AB两列数据进行匹配搜索,如果能用函数SEARCH找到包含A1关键词的句子就用ISNUMBER函数转化为布尔值True,然后用FILTER函数提取出来显示在下方。

这个公式可以实现对中文和英文的检索,虽然比较简易,但是执行速度快,不需要额外的软件也不需要VBA编程,非常实用。

四、学后总结

  1. 上面这种方法可以用于海量语料库的快速检索,提取包含有关键词的中英语句,对于术语提取、译文学习非常有帮助。

  2. WPS最近更新了很多函数如regexp, scan, xlookup等,如果我们把这些函数综合写成公式应用到我们的语料库检索和翻译学习,一定要以事半功倍。

  3. 后期将通过修改公式,把这项功能进行扩展,比如支持正则检索,或者上传共享文档,分享给指定人群在线使用等等。

相关推荐
睡不醒男孩0308231 小时前
第七篇:揭秘 PostgreSQL 数据库内核级管控:CLup 深度架构设计与高可用底座技术白皮书
数据库·postgresql·clup
cmes_love2 小时前
Level 2逐笔成交历史数据下载方法笔记
数据库·笔记·oracle
swordbob2 小时前
MySQL字符集陷阱:从Oracle迁移踩坑到utf8mb4强制规范
数据库·sql
牛油果子哥q2 小时前
【C++ STL string 】C++ STL string 终极精讲:底层原理、内存机制、全套API、深浅拷贝、易错坑点与工程实战规范
数据库·c++
十五年专注C++开发2 小时前
MySql中各种功能用sql语句实现总结
数据库·sql·mysql
数据库小学妹3 小时前
AI时代数据库怎么选?多模融合、数据统一存储与选型实战指南
数据库·人工智能·经验分享·ai
Albert Edison3 小时前
【Redis】Centos7.9 安装 Redis 5 教程
数据库·redis·缓存
云计算磊哥@3 小时前
运维开发宝典026-MySQL02数据库表操作
运维·数据库·运维开发
小二·3 小时前
Redis 内存溢出(OOM)排查与恢复实战
数据库·redis·bootstrap
pqk6V6Vep3 小时前
Redis 分布式锁进阶第一篇讲解
数据库·redis·分布式