RNN之多层LSTM理解：输入，输出，时间步，隐藏节点数，层数

从pytorch代码角度初次理解LSTM各种术语。LSTM:class torch.nn.LSTM(*args, **kwargs)Parametersinput_size 输入特征维数：（特征向量的长度，如2048）hidden_size 隐层状态的维数：（每个LSTM单元或者时间步的输出的ht的维度，单元内部有权重与偏差计算）num_layers RNN层的个数：（在竖直...

视觉弘毅

65446人浏览 · 2019-02-28 16:37:39

视觉弘毅 · 2019-02-28 16:37:39 发布

从pytorch代码角度初次理解LSTM各种术语。

LSTM:

class torch.nn.LSTM(*args, **kwargs)

Parameters

input_size 输入特征维数：（特征向量的长度，如2048）
hidden_size 隐层状态的维数：（每个LSTM单元或者时间步的输出的ht的维度，单元内部有权重与偏差计算）
num_layers RNN层的个数：（在竖直方向堆叠的多个相同个数单元的层数）
bias 隐层状态是否带bias，默认为true
batch_first 是否输入输出的第一维为batchsize
dropout 是否在除最后一个RNN层外的RNN层后面加dropout层
bidirectional 是否是双向RNN，默认为false

Inputs: input, (h_0, c_0)

input (seq_len, batch, input_size) 时间步数或序列长度，batch数，输入特征维度。如果设置了batch_first，则batch为第一维。
(h_0, c_0) 隐层状态

h0 shape：(num_layers * num_directions, batch, hidden_size)

c0 shape：(num_layers * num_directions, batch, hidden_size)