LSTM | 电子创新网 Imgtec 社区

机器学习：深入理解LSTM网络 (二)

demi 在周二, 12/03/2019 - 11:46 提交

之前我们介绍了RNN 网络结构以及其所遇到的问题，RNN 结构对于关联度太长的时序问题可能无法处理，简单来说，RNN对于太久远的信息不能有效地储存，为了解决这个问题，有人提出了LSTM的网络结构，LSTM 网络结构最早是由 Hochreiter & Schmidhuber 在1997 年提出的，随着后来研究者的不断改进，LSTM网络在很多问题上都有非常好的表现，并且得到广泛的关注与应用。

LSTM 网络

LSTM 结构的一个优势在于可以很好的解决 “long-term dependency” 的问题，”长期记忆”是LSTM结构与生俱来的特性，而不需要刻意地去学习。

所有的RNN结构都是有一个不断重复的模块，在标准的RNN结构中，这个不断重复的模块是一个单层的tanh , 如下图所示：

机器学习：深入理解LSTM网络 (一)

demi 在周二, 12/03/2019 - 11:37 提交

Long Short Term Memory Networks (LSTMs) 最近获得越来越多的关注，与传统的前向神经网络 (feedforward network)不同，LSTM 可以对之前的输入有选择的记忆，从而有助于判断当前的输入， LSTM的这一特点在处理时序相关的输入时，有着很大的优势。

LSTM超参数调试注意事项

demi 在周三, 08/07/2019 - 15:47 提交

小心出现过拟合，这通常是因为神经网络在“死记”定型数据。过拟合意味着定型数据的表现会很好，但网络的模型对于样例以外的预测则完全无用。正则化有好处：正则化的方法包括l1、l2和丢弃法等。

LSTM调参经验

demi 在周三, 07/31/2019 - 17:29 提交

在开始调参之前，需要确定方向，所谓方向就是确定了之后，在调参过程中不再更改。1、根据任务需求，结合数据，确定网络结构。例如对于RNN而言，你的数据是变长还是非变长；输入输出对应关系是many2one还是many2many等等

长短期记忆（（Long short-term memory）最早是1997年由Hochreiter 和 Schmidhuber在论文《LONG SHORT-TERM MEMORY》中提出的。在神经网络发展的过程中，几乎所有关于LSTM的文章中对于LSTM的结构都会做出一些变动，也称为LSTM的变体。其中变动较大的是门控循环单元（Gated Recurrent Units），也就是较为流行的GRU。

LSTM模型与前向反向传播算法

demi 在周二, 06/25/2019 - 14:27 提交

由于RNN也有梯度消失的问题，因此很难处理长序列的数据，大牛们对RNN做了改进，得到了RNN的特例LSTM（Long Short-Term Memory），它可以避免常规RNN的梯度消失，因此在工业界得到了广泛的应用。