python-pytorch官方示例Generating Names with a Character-Level RNN的部分理解0.5.03

pytorch官方示例Generating Names with a Character-Level RNN的部分理解

模型结构

功能

输入一个类别名和一个英文字符,就可以自动生成这个类别,且以英文字符开始的姓名

关键技术

  1. 将字符进行one-hot编码
  2. 名字最大长度20,就是使用模型预测20次,下一个字符根据上一个字符循环预测,最后将字符串连接在一起输出一个名字
  3. 如果是分类任务,输入的名字是字符串表示的,因此在循环这个名字长度,每个字符输入模型中,得到的hidden作为下一次字符预测模型的参数,如官方的分类示例:https://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html。 因此最后一个名字字符的预测output将作为softmax的参数进行预测

模型输入

1x128是hidden层,1x18是某一类别的one-hot编码,1x59是某一个英文字符的ont-hot编码,如下面就可以实现某一个字符的one-hot

python 复制代码
tensor = torch.zeros(1, n_categories)
tensor[0][li] = 1

模型输出

输出是1x59,就是预测的一个字符。

预测实现

  1. 名字是由多个字符串组合的,根据给的英文字符预测下一个字符,再根据这字符预测下一个字符,一直反复到EOS时停止
python 复制代码
for i in range(max_length):
    output, hidden = rnn(category_tensor, input[0], hidden)
    topv, topi = output.topk(1)
    topi = topi[0][0]
    if topi == n_letters - 1:
        break
    else:
        letter = all_letters[topi]
        output_name += letter
    input = inputTensor(letter)
相关推荐
呱呱复呱呱40 分钟前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
曲幽5 小时前
刚部署的 LibreTranslate 频频翻车?我掏出了 20 年前的 StarDict 词典,用 FastAPI 搭了个本地词典翻译 API
python·fastapi·web·translate·goldendict·libretranslate·stardict·pystardict
荣码6 小时前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python
兵慌码乱15 小时前
基于Python+PyQt5+SQLite的药房管理系统实现:事务一致性与界面解耦全流程解析
python·sqlite·信号与槽·pyqt5·数据库设计·桌面应用开发·事务处理
金銀銅鐵17 小时前
[Python] 体验用欧几里得算法计算最大公约数的过程
python·数学
FreakStudio20 小时前
W55MH32L-EVB 上手测评:硬件 TCP/IP 加持的以太网单片机,MicroPython 零门槛开发
python·单片机·嵌入式·大学生·面向对象·并行计算·电子diy·电子计算机
用户0332126663671 天前
使用 Python 从零创建 Word 文档
python
Csvn1 天前
Python 两大经典坑点 —— 可变默认参数 & 闭包延迟绑定
后端·python
曲幽1 天前
别再用网页翻译看源码了!你的私人翻译神器LibreTranslate,部署避坑指南来了
python·docker·web·pot·translate·libretranslate·arogstranslate
用户556918817531 天前
#从脚本到独立程序:Python + Playwright 批量抓取的完整踩坑记录
python·自动化运维