机器翻译

coldstarry10 天前
人工智能·深度学习·自然语言处理·机器翻译
sheng的学习笔记-AI-自然语言处理(NLP),机器翻译,情感分类,词嵌入Ai目录:sheng的学习笔记-AI目录-CSDN博客先看这个文章:序列模型:sheng的学习笔记-AI-序列模型(Sequence Models),RNN,GRU,LSTM_音乐识别是一对多吗-CSDN博客
博士僧小星10 天前
人工智能·自然语言处理·bleu·rouge·机器翻译
人工智能|自然语言处理——机器翻译评价指标Bleu和Rouge在机器翻译任务中,BLEU 和 ROUGE 是两个常用的评价指标,BLEU 根据精确率(Precision)衡量翻译的质量,而 ROUGE 根据召回率(Recall)衡量翻译的质量
小嗷犬20 天前
论文阅读·人工智能·语言模型·机器翻译·手语翻译
【论文笔记】A Token-level Contrastive Framework for Sign Language Translation🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。
jiao_mrswang20 天前
人工智能·自然语言处理·机器翻译
文本生成类(机器翻译)系统评估在机器翻译任务中常用评价指标:BLEU、ROGUE、METEOR、PPL。这些指标的缺点:只能反应模型输出是否类似于测试文本。
张申傲22 天前
人工智能·ai·chatgpt·机器翻译
大模型翻译能力评测随着自然语言处理技术的飞速发展,机器翻译已经成为一个重要的研究领域。近年来,基于大模型的语言模型在机器翻译任务上取得了显著的进展。这些大模型通常具有数亿甚至数千亿的参数,能够更好地理解和生成自然语言。 但是,现在市面上可用的大模型成百上千,每个模型又都有各自的功能特性和适用场景,我们应该如何评估不同模型的翻译效果呢?解决方案可能多种多样,本文尝试采用 WMT 数据集 + BLEU 评分的机制,来相对完善地评估几个大模型的翻译能力。
陈苏同学1 个月前
人工智能·pytorch·笔记·python·深度学习·自然语言处理·机器翻译
机器翻译 & 数据集 (NLP基础 - 预处理 → tokenize → 词表 → 截断/填充 → 迭代器) + 代码实现 —— 笔记3.9《动手学深度学习》0. 前言1. 下载和预处理数据集2. 词元化 (tokenize)3. 词表 (Vocab)4. 加载数据集 (填充/截断)
Just Jump1 个月前
自然语言处理·transformer·机器翻译
机器翻译基础与模型 之三:基于自注意力的模型基于RNN和CNN的翻译模型,在处理文字序列时有个问题:它们对序列中不同位置之间的依赖关系的建模并不直接。以CNN的为例,如果要对长距离依赖进行描述,需要多层卷积操作,而且不同层之间信息传递也可能有损失,这些都限制了模型的能力。
Just Jump1 个月前
人工智能·cnn·机器翻译
机器翻译基础与模型 之二: 基于CNN的模型相比于全连接网络,卷积神经网络最大的特点在于具有局部连接(Locally Connected)和权值共享(Weight Sharing)的特性。
Just Jump1 个月前
自然语言处理·机器翻译
机器翻译基础与模型 之一: 基于RNN的模型基于规则的-->基于实例的-->基于统计方法的-->基于神经网络的传统统计机器翻译把词序列看作离散空间里的由多个特征函数描述的点,类似 于 n-gram 语言模型,这类模型对数据稀疏问题非常敏感。神经机器翻译把文字序列表示为实数向量,一方面避免了特征工程繁重的工作,另一方面使得系统可以对文字序列的“表示”进行学习。
小嗷犬1 个月前
论文阅读·大模型·机器翻译·多模态·手语翻译
【论文笔记】SCOPE: Sign Language Contextual Processing with Embedding from LLMs🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。
魅色1 个月前
人工智能·自然语言处理·机器翻译·外文阅读·在线翻译
法语文档的几种翻译方法翻译法语文档时,可以采用多种方法来确保翻译的准确性和流畅性。以下是几种常见的翻译方法:专业译者:找到具有法语和目标语言(如中文)双语能力的专业译者。他们能够理解文档的专业术语和文化背景,提供高质量的翻译。
irrationality1 个月前
深度学习·transformer·机器翻译
昇思大模型平台打卡体验活动:项目5基于MindSpore实现Transformer机器翻译首先仍然是先登录大模型体验平台 https://xihe.mindspore.cn/my/clouddev 启动!!
萧鼎1 个月前
开发语言·python·机器翻译
【Python】轻松实现机器翻译:Transformers库使用教程近年来,机器翻译技术飞速发展,从传统的基于规则的翻译到统计机器翻译,再到如今流行的神经网络翻译模型,尤其是基于Transformer架构的模型,翻译效果已经有了质的飞跃。Transformers库由Hugging Face推出,是目前最流行的自然语言处理库之一,它提供了多种预训练的语言模型,可以用于文本分类、文本生成、机器翻译等任务。本文将详细介绍如何使用Transformers库来实现一个机器翻译模型。
forestsea2 个月前
java·人工智能·spring boot·深度学习·自然语言处理·机器翻译·deep learning
Springboot 整合 Java DL4J 构建自然语言处理之机器翻译系统🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c=1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编程,高并发设计,Springboot和微服务,熟悉Linux,ESXI虚拟化以及云原生Docker和K8s,热衷于探索科技的边界,并将理论知识转化为实际应用。保持对新技术的好奇心,乐于分享所学,希望通过我的实践经历和见解,启发他人的创新思维。在这里,我希望能与志同道合的
思通数科AI全行业智能NLP系统2 个月前
人工智能·语言模型·自然语言处理·数据分析·语音识别·数据库开发·机器翻译
免费开源!语音识别平台让医疗对话更高效,沟通更准确一、系统概述思通数科的语音识别(ASR)系统基于先进的自然语言处理(NLP)技术,旨在为医疗行业提供高效、精准的沟通支持。系统特别针对医疗场景进行了定制优化,能够快速识别医生与患者的对话内容,将信息精准记录下来,从而大幅减少传统手动录入的时间和误差。许多医疗机构在信息处理上普遍面临信息碎片化、录入时间长、误差高等问题,导致医生在沟通过程中无法专注于患者需求。思通数科通过其开源免费的语音识别平台有效解决了这些痛点,并且支持用户自定义设置,满足各类医疗场景需求,帮助医生高效管理医疗数据,提升患者满意度。
数据猎手小k2 个月前
人工智能·自然语言处理·机器翻译
MT-Pref数据集:包含18种语言的18k实例,涵盖多个领域。实验表明它能有效提升Tower模型在WMT23和FLORES基准测试中的翻译质量。2024-10-10,由电信研究所、里斯本大学等联合创建MT-Pref数据集,它包含18种语言方向的18k实例,覆盖了2022年后的多个领域文本。通过在WMT23和FLORES基准测试上的实验,我们展示了使用MT-Pref数据集对Tower模型进行对齐可以显著提高翻译质量。
Tunny_yyy2 个月前
人工智能·机器学习·机器翻译
李宏毅机器学习2023-HW5-Machine TranslationMachine translation 中文翻译为英文此任务没有什么难度,跟着课件中的hint做即可Data
davenian2 个月前
python·docker·pdf·flask·ocr·机器翻译
<Project-8 pdf2tx-MM> Python Flask应用:在浏览器中翻译PDF文件 NLTK OCR 多线程 指定翻译器 改进后的P6pdf file transfer to text content with Multi-threads and Multi-translators
陌上阳光2 个月前
人工智能·深度学习·机器翻译
动手学深度学习60 机器翻译与数据集
fxybg20223 个月前
人工智能·自然语言处理·pdf·word·机器翻译
探索高效免费的PDF转Word工具,开启便捷办公之旅无论是为了方便对文档内容进行编辑、修改,还是为了更好地适应不同的工作和学习场景,将 PDF 文档转换为可编辑的 Word 格式都具有重要意义。今天我就分享几款pdf转换成word免费版工具来解决大家的困扰。