V2EX  ›  英汉词典

Exploding Gradient

定义 Definition

“Exploding gradient(梯度爆炸)”指在训练神经网络(尤其是深层网络或循环神经网络)时,反向传播得到的梯度在层与层(或时间步与时间步)之间迅速变得非常大,导致参数更新过猛、训练不稳定,甚至出现损失为 NaN/发散等问题。

发音 Pronunciation

/ɪkˈsploʊdɪŋ ˈɡreɪdiənt/

例句 Examples

The model fails to train because of an exploding gradient.
这个模型因为梯度爆炸而无法正常训练。

During backpropagation through time, exploding gradients can cause the RNN’s weights to grow uncontrollably unless we use gradient clipping.
在时间反向传播(BPTT)过程中,若不使用梯度裁剪,梯度爆炸可能使 RNN 的权重失控地增大。

词源 Etymology

exploding 来自动词 explode(“爆炸、迅速膨胀”),gradient 在数学与优化中表示“梯度/斜率”,词根可追溯到拉丁语 gradus(“步、级”)。合起来用作机器学习术语,形象地描述“梯度值像爆炸一样迅速变大”的现象。

相关词 Related Words

文献与著作 Notable Works

  • Ian Goodfellow, Yoshua Bengio, Aaron Courville:《Deep Learning》(讨论深度网络训练中的梯度消失/爆炸及常见应对方法)
  • Sepp Hochreiter (1991):Untersuchungen zu dynamischen neuronalen Netzen(早期系统分析循环网络中的梯度问题)
  • Razvan Pascanu, Tomas Mikolov, Yoshua Bengio (2013):“On the difficulty of training Recurrent Neural Networks”(明确讨论并分析 exploding gradients,并推广梯度裁剪等处理思路)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1873 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 08:53 · PVG 16:53 · LAX 00:53 · JFK 03:53
♥ Do have faith in what you're doing.