python-pytorch官方示例Generating Names with a Character-Level RNN的部分理解0.5.03

pytorch官方示例Generating Names with a Character-Level RNN的部分理解

模型结构

功能

输入一个类别名和一个英文字符,就可以自动生成这个类别,且以英文字符开始的姓名

关键技术

  1. 将字符进行one-hot编码
  2. 名字最大长度20,就是使用模型预测20次,下一个字符根据上一个字符循环预测,最后将字符串连接在一起输出一个名字
  3. 如果是分类任务,输入的名字是字符串表示的,因此在循环这个名字长度,每个字符输入模型中,得到的hidden作为下一次字符预测模型的参数,如官方的分类示例:https://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html。 因此最后一个名字字符的预测output将作为softmax的参数进行预测

模型输入

1x128是hidden层,1x18是某一类别的one-hot编码,1x59是某一个英文字符的ont-hot编码,如下面就可以实现某一个字符的one-hot

python 复制代码
tensor = torch.zeros(1, n_categories)
tensor[0][li] = 1

模型输出

输出是1x59,就是预测的一个字符。

预测实现

  1. 名字是由多个字符串组合的,根据给的英文字符预测下一个字符,再根据这字符预测下一个字符,一直反复到EOS时停止
python 复制代码
for i in range(max_length):
    output, hidden = rnn(category_tensor, input[0], hidden)
    topv, topi = output.topk(1)
    topi = topi[0][0]
    if topi == n_letters - 1:
        break
    else:
        letter = all_letters[topi]
        output_name += letter
    input = inputTensor(letter)
相关推荐
奔跑吧邓邓子4 分钟前
【Python爬虫(36)】深挖多进程爬虫性能优化:从通信到负载均衡
开发语言·爬虫·python·性能优化·负载均衡·多进程
学长学姐我该怎么办29 分钟前
年前集训总结python
python
量化投资技术36 分钟前
【量化科普】Sharpe Ratio,夏普比率
python·量化交易·量化·量化投资·qmt·miniqmt
yanglamei196238 分钟前
基于Python+Django+Vue的旅游景区推荐系统系统设计与实现源代码+数据库+使用说明
vue.js·python·django
虚假程序设计40 分钟前
python用 PythonNet 从 Python 调用 WPF 类库 UI 用XAML
python·ui·wpf
胡桃不是夹子1 小时前
CPU安装pytorch(别点进来)
人工智能·pytorch·python
不会玩技术的技术girl3 小时前
使用Python和正则表达式爬取网页中的URL数据
开发语言·python·正则表达式
Binary Oracle3 小时前
RNN中远距离时间步梯度消失问题及解决办法
人工智能·rnn·深度学习
阿_旭3 小时前
基于YOLO11深度学习的糖尿病视网膜病变检测与诊断系统【python源码+Pyqt5界面+数据集+训练代码】
人工智能·python·深度学习·视网膜病变检测
胖哥真不错3 小时前
Python实现GO鹅优化算法优化随机森林分类模型项目实战
python·机器学习·项目实战·go鹅优化算法·随机森林分类模型