Python(十七)excel指定列自动翻译成英文

前言

本章主要讲述在excel的指定列后面添加一列,并翻译成英文



一、效果图


二、代码

实际需求:

python 复制代码
# -*- codeing = utf-8 -*-
# @time: 2025/1/16  16:32
# @Author : Mikasa
#
# @Aim:自动将客户发的货物清单里的商品名称,翻译成英文;
#       并在当前excel中,品名后面加入一列,并将翻译后的英文写入到excel里

from translate import Translator
import pandas as pd

file_path = "./translate_packaging_list/test.xlsx"
sheet_name = "Sheet1"
column_name = "品名"
new_file_path = "./translate_packaging_list/test_translate.xlsx"


def extract_column_as_array(file_path, sheet_name, column_name):
    """
    获取excel某列数据,并返回一个list
    :param file_path:
    :param sheet_name:
    :param column_name:
    :return: 去掉空行的lsit
    """
    df = pd.read_excel(file_path, sheet_name=sheet_name)
    column_data = df[column_name].tolist()
    return column_data


def translate_text(text, src='zh-cn', dest='en'):
    """
    将中文翻译成英文
    :param text:
    :param src:
    :param dest:
    :return:
    """
    translator = Translator(from_lang=src, to_lang=dest)
    translation = translator.translate(text)
    return translation


def translate_packaging_list():
    """
    1、翻译后的值生成一个list
    2、在excel【品名】后加入一列【goods】列
    3、将翻译后的list写入到该列
    :return:
    """
    result_array = extract_column_as_array(file_path, sheet_name, column_name)  # 获取列表
    df = pd.read_excel(file_path, sheet_name=sheet_name)
    new_column_name = "goods"
    new_loc = df.columns.get_loc('品名') + 1 #获取指定列后面的坐标
    english_cargo_name_list = []
    for good_name in result_array:
        if type(good_name) == str:
            translated_text = translate_text(good_name)
            print(f"{good_name} -> {translated_text}")
            english_cargo_name_list.append(translated_text)
        else:
            english_cargo_name_list.append(good_name)
    print("english_cargo_name_list:", english_cargo_name_list)
    print("new_loc:", new_loc)
    df.insert(loc=new_loc, column=new_column_name, value=english_cargo_name_list)
    df.to_excel(new_file_path, index=False)


if __name__ == '__main__':
    translate_packaging_list()
相关推荐
科学创新前沿10 小时前
从原子结构到宏观性能:机器学习驱动的固态电解质设计与高通量筛选
人工智能·python·深度学习·机器学习·固态电池·固态电解质
qq_4523962310 小时前
【模型手术室】第七篇:模型量化 —— 从 FP16 到 4-bit 的极限压缩与性能翻倍
人工智能·python·ai
Python量化投资、代码解析与论文精读10 小时前
R语言-机器学习生态风险评估RF-SHAP分析
人工智能·python·深度学习
Ulyanov10 小时前
基于Tkinter/ttk的现代化Python GUI开发全攻略:从布局设计到视觉美化(三)
开发语言·python·gui·tkinter·ttk
yivifu11 小时前
完美的PyMuPDF删除pdf页面文字水印
python·pdf·pymupdf·去水印
weixin_4331793311 小时前
python - 读写文件
开发语言·python
Astro_ChaoXu11 小时前
GAMSE使用日志与教程(高分辨率光谱数据缩减)
linux·数据库·python
人工智能培训11 小时前
基于知识图谱的故障推理方法与算法
人工智能·python·深度学习·机器学习·知识图谱·故障诊断
ID_1800790547311 小时前
超详细:Python 调用淘宝商品详情 API 完整教程
开发语言·python
全栈开发圈12 小时前
新书速览|Excel+DeepSeek会计与财务高效办公
语言模型·excel