tensorflow 零基础吃透：RaggedTensor 在 Keras 和 tf.Example 中的实战用法 (补充)

keras_model的训练报错如下：

复制代码

Epoch 1/5
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
Cell In[102], line 1
----> 1 keras_model.fit(hashed_words, is_question, epochs=5)

File /opt/anaconda3/envs/py3_12_6_env/lib/python3.12/site-packages/keras/src/utils/traceback_utils.py:122, in filter_traceback.<locals>.error_handler(*args, **kwargs)
    119     filtered_tb = _process_traceback_frames(e.__traceback__)
    120     # To get the full stack trace, call:
    121     # `keras.config.disable_traceback_filtering()`
--> 122     raise e.with_traceback(filtered_tb) from None
    123 finally:
    124     del filtered_tb

File /opt/anaconda3/envs/py3_12_6_env/lib/python3.12/site-packages/keras/src/utils/traceback_utils.py:122, in filter_traceback.<locals>.error_handler(*args, **kwargs)
    119     filtered_tb = _process_traceback_frames(e.__traceback__)
    120     # To get the full stack trace, call:
    121     # `keras.config.disable_traceback_filtering()`
--> 122     raise e.with_traceback(filtered_tb) from None
    123 finally:
    124     del filtered_tb

ValueError: Exception encountered when calling LSTM.call().

Cannot index into an inner ragged dimension.

Arguments received by LSTM.call():
  • sequences=tf.Tensor(shape=(None, None, 16), dtype=float32)
  • initial_state=None
  • mask=None
  • training=True

这个报错的核心原因是：Keras的LSTM层无法直接处理RaggedTensor的内部不规则维度 （虽然Input层声明了ragged=True，但LSTM层对RaggedTensor的原生支持存在限制，无法索引不规则的inner维度）。

一、报错本质分析

你的hashed_words是RaggedTensor（形状[4, None]，4个句子，每个句子单词数可变）；
Embedding层接收RaggedTensor后，输出的是形状[4, None, 16]的RaggedTensor；
LSTM层尝试处理这个RaggedTensor时，因"内部维度长度不规则"，无法完成索引操作，抛出Cannot index into an inner ragged dimension错误。

二、解决方案：RaggedTensor → 密集张量+Mask（核心思路）

解决思路是：将RaggedTensor补0转为密集张量，同时生成Mask（标记有效元素位置），让LSTM层忽略补0的无效位置（既保留可变长度的核心需求，又适配LSTM层的输入要求）。

三、完整修正代码（可直接运行）

python 复制代码

import tensorflow as tf

# ===================== 1. 定义数据 =====================
sentences = tf.constant(
    ['What makes you think she is a witch?',
     'She turned me into a newt.',
     'A newt?',
     'Well, I got better.'])
is_question = tf.constant([True, False, True, False])

# ===================== 2. 预处理：RaggedTensor → 密集张量+Mask =====================
hash_buckets = 1000
# 步骤2.1：切分单词→RaggedTensor
words = tf.strings.split(sentences, ' ')
# 步骤2.2：单词哈希编码→RaggedTensor
hashed_words = tf.strings.to_hash_bucket_fast(words, hash_buckets)

# 步骤2.3：RaggedTensor转密集张量（补0到最长句子长度）+ 生成Mask
# mask规则：True=有效元素（非补0），False=补0的无效元素
dense_words = hashed_words.to_tensor(default_value=0)  # 补0后的密集张量
mask = tf.sequence_mask(hashed_words.row_lengths())    # 生成Mask（形状和dense_words一致）

# ===================== 3. 构建模型（适配Mask） =====================
# 方案1：用Functional API（更灵活，支持Mask传递）
inputs = tf.keras.layers.Input(shape=[None], dtype=tf.int64)
# Embedding层：设置mask_zero=True（自动根据0生成Mask，无需手动传mask）
x = tf.keras.layers.Embedding(hash_buckets, 16, mask_zero=True)(inputs)
# LSTM层：自动接收Embedding层的Mask，忽略补0位置
x = tf.keras.layers.LSTM(32, use_bias=False)(x)
x = tf.keras.layers.Dense(32)(x)
x = tf.keras.layers.Activation(tf.nn.relu)(x)
outputs = tf.keras.layers.Dense(1)(x)

keras_model = tf.keras.Model(inputs=inputs, outputs=outputs)

# ===================== 4. 编译+训练+预测 =====================
keras_model.compile(loss='binary_crossentropy', optimizer='rmsprop')
# 训练：输入补0后的密集张量（LSTM会通过mask_zero忽略补0）
keras_model.fit(dense_words, is_question, epochs=5)
# 预测：同样输入补0后的密集张量
print("\n模型预测结果：")
print(keras_model.predict(dense_words))

四、关键修正点解析

1. RaggedTensor转密集张量+Mask

hashed_words.to_tensor(default_value=0)：将RaggedTensor补0到"最长句子长度"（比如示例中最长句子8个词，所有句子都补0到8列）；
tf.sequence_mask(hashed_words.row_lengths())：生成和密集张量形状一致的Mask，True表示该位置是有效单词，False是补0的无效位置。

2. Embedding层设置`mask_zero=True`（核心！）

作用：Embedding层会自动根据"输入中的0"生成Mask（0对应补0位置，标记为无效），并将Mask传递给后续的LSTM层；
效果：LSTM层只会处理有效单词的位置，补0的位置会被忽略，和直接用RaggedTensor的逻辑完全一致（只是存储形式变成了补0的密集张量）。

3. 改用Functional API（可选，但更稳定）

Sequential API对Mask的传递支持不如Functional API稳定，改用Functional API能确保Mask正确传递到LSTM层；

如果坚持用Sequential API，只需把Input层的ragged=True去掉，Embedding层加mask_zero=True即可：