技术栈
机器翻译
数据知道
3 天前
docker
·
容器
·
机器翻译
容器化部署:用Docker封装机器翻译模型与服务详解
容器化技术(如Docker)已成为部署机器翻译(MT)服务的行业标准,它能解决环境依赖、资源隔离和跨平台部署等核心问题。
数据知道
4 天前
人工智能
·
自然语言处理
·
机器翻译
机器翻译:模型微调(Fine-tuning)与调优详解
在机器翻译(Machine Translation, MT)任务中,预训练模型(如 mBART、T5、NLLB)通常需要进一步优化以适应特定领域或语言对的翻译需求。微调(Fine-tuning) 和 调优(Hyperparameter Tuning) 是提升模型性能的关键技术。
数据知道
5 天前
人工智能
·
自然语言处理
·
机器翻译
机器翻译:Hugging Face库详解
Hugging Face的Transformers库为机器翻译任务提供了强大的支持,通过其丰富的预训练模型、灵活的API和高效的性能,显著降低了开发门槛并提升了翻译质量。
adminwolf
5 天前
人工智能
·
自然语言处理
·
机器翻译
支持小语种的在线客服系统,自动翻译双方语言,适合对接跨境海外客户
最近在捣鼓一个特别有意思的功能——小语种在线客服系统。说实话,这玩意儿比我想象的复杂多了,但也比想象中酷多了。
墨尘游子
8 天前
人工智能
·
网络爬虫
·
知识图谱
·
机器翻译
2- Python 网络爬虫 — 如何精准提取网页数据?XPath、Beautiful Soup、pyquery 与 parsel 实战指南
在网络爬虫与数据采集场景中,网页数据解析是核心步骤之一。当我们通过请求工具(如requests、aiohttp)获取到网页的 HTML/XML 源码后,需要从中精准提取目标数据(如文本、链接、属性等)。
数据知道
9 天前
人工智能
·
自然语言处理
·
机器翻译
机器翻译:Bahdanau注意力和Luong注意力详解
注意力机制(Attention Mechanism) 是自然语言处理(NLP)和深度学习中的核心技术之一,尤其在序列到序列(Seq2Seq)任务(如机器翻译、文本摘要等)中表现突出。Bahdanau注意力(又称“加性注意力”)和Luong注意力(又称“乘性注意力”)是两种经典的注意力模型,它们在计算方式和应用场景上有所不同。
数据知道
11 天前
人工智能
·
学习
·
自然语言处理
·
pdf
·
机器翻译
将英文PDF文件完整地翻译成中文的4类方式
在全球化的今天,跨越语言障碍获取信息变得尤为重要。本文将介绍几种有效的方法,帮助您将英文PDF文件完整地翻译成中文。 在开始方法详解前,我们必须明白PDF翻译的核心难点,这有助于你选择最合适的方案:
数据知道
12 天前
人工智能
·
自然语言处理
·
机器翻译
机器翻译:语料库的定义与获取,及语料预处理
语料库(Corpus)=「为特定研究或工程目的而收集、整理、标注的大规模真实语言数据集合」。 在机器翻译(MT)场景下,语料库专指「平行语料库(parallel corpus)」:一一对应的源语言句子和目标语言句子;也可能附带单语语料、领域标签、时间戳、质量分数等元数据。
数据知道
14 天前
python
·
自然语言处理
·
bard
·
机器翻译
·
gemini
一文掌握Bard机器翻译,以及用python调用的4种方式(现已升级为 Gemini)
Bard(大型双语自动编码器解码器)是Google推出的生成式AI模型,具备强大的自然语言理解与生成能力,在机器翻译领域表现出色。与传统机器翻译模型相比,Bard不仅能实现精准翻译,还能理解上下文语境、保持翻译风格一致性,并支持复杂句式和专业领域文本的翻译。
max500600
14 天前
开发语言
·
python
·
深度学习
·
机器学习
·
matlab
·
transformer
·
机器翻译
复现论文《A Fiber Bragg Grating Sensor System for Train Axle Counting》
“A Fiber Bragg Grating Sensor System for Train Axle Counting” (用于列车轴计数的光纤布拉格光栅传感器系统)
数据知道
15 天前
人工智能
·
gpt
·
机器翻译
使用GPT机器翻译详解,及对应实现翻译的3个案例
GPT(Generative Pre-trained Transformer) 系列模型,特别是像GPT-3、GPT-3.5、GPT-4这样的大型语言模型,虽然最初并非专为机器翻译任务设计,但它们在自然语言生成和理解方面表现出的强大能力,使其在零样本(zero-shot)和少样本(few-shot)机器翻译任务中表现非常出色。
数据知道
16 天前
人工智能
·
百度
·
语言模型
·
自然语言处理
·
机器翻译
百度翻译详解:包括PaddleNLP、百度AI开放平台、接口逆向(包括完整代码)
百度翻译是百度推出的多语言智能翻译平台,依托自研的 NMT(神经机器翻译)技术 和 大语言模型能力,支持 200+种语言互译,日均处理翻译请求超千亿字符。其核心优势在于:
数据知道
16 天前
人工智能
·
分类
·
机器翻译
机器翻译的分类:规则式、统计式、神经式MT的核心区别
机器翻译(Machine Translation,MT)自诞生以来,随着技术发展经历了不同的范式演变,主要可分为规则式机器翻译(Rule-Based MT, RBMT)、统计式机器翻译(Statistical MT, SMT) 和神经式机器翻译(Neural MT, NMT) 三大类。三者在技术原理、依赖资源、优势劣势等方面存在显著差异,以下从核心区别展开详细说明:
不会计算机的g_c__b
17 天前
人工智能
·
自然语言处理
·
机器翻译
搜索引擎评估革命:用户行为模型如何颠覆传统指标?
摘要:为什么你的搜索结果总不让人满意?本文揭秘谷歌、百度背后评估机制的进化之路!从20年前的DCG到今日AI建模,手把手用Python实现新一代评估指标,带你看懂搜索质量优化的核心技术。
CodeShare
20 天前
语音识别
·
机器翻译
·
对话式ai
Alexa实时对话翻译技术解析
某中心推出的Alexa实时翻译功能支持两种不同语言的用户进行对话,由系统自动识别语言并实时翻译。该功能基于现有技术栈构建,包括:
X.Cristiano
25 天前
机器翻译
Qwen-MT:翻得快,译得巧
我们再向大家介绍一位新朋友:机器翻译模型Qwen-MT。开发者朋友们可通过Qwen API(qwen-mt-turbo),来直接体验它又快又准的翻译技能。
大龄牛码
1 个月前
人工智能
·
自然语言处理
·
机器翻译
Edge浏览器设置网页自动翻译
一.浏览网页自动翻译设置->扩展->获取Microsoft Edge扩展->搜索“沉浸式翻译”->获取 。
ViiTor_AI
1 个月前
音视频
·
机器翻译
·
视频翻译工具
语音对话秒译 + 视频悬浮字 + 相机即拍即译:ViiTor 如何破局跨语言场景?
在跨语言信息获取场景中,语言壁垒常导致效率降低。ViiTor Translate 试图通过 “场景化功能布局” ,覆盖 语音、视频、图像、文本 四大维度翻译需求。以下基于产品功能展示,拆解其核心能力:
小叮当爱咖啡
1 个月前
人工智能
·
自然语言处理
·
机器翻译
Seq2seq+Attention 机器翻译
本文为🔗365天深度学习训练营内部文章原作者:K同学啊
致Great
2 个月前
人工智能
·
学习
·
机器翻译
机器翻译与跨语言学习数据集综述
机器翻译(Machine Translation, MT)与跨语言学习是自然语言处理领域的核心研究方向,其发展与突破高度依赖于大规模、高质量的数据集。本文系统性地梳理了该领域的关键数据集,构建了一个从应用场景出发的四层分类体系:平行语料库、语言建模资源、跨语言资源和任务特定数据集。在此基础上,本文首先通过Mermaid流程图和多维度分类表对数据集生态进行了宏观概述,随后深入剖析了每个类别下的代表性数据集,阐述了其构建背景、核心特点、技术演进和主要挑战。通过横向对比分析,本文揭示了数据集从支持统计机器翻译(