梯度下降 | 电子创新网 Imgtec 社区

一文读懂机器学习的6种优化方法：提升模型性能的关键路径

demi 在周二, 03/25/2025 - 17:15 提交

随着数据量的爆发式增长和模型复杂度的不断提升，如何高效地调整模型参数，使模型性能达到最优，成为了研究者和从业者关注的核心问题。

三种梯度下降算法的区别(BGD, SGD, MBGD)

demi 在周四, 01/21/2021 - 16:08 提交

我们在训练网络的时候经常会设置 batch_size，这个 batch_size 究竟是做什么用的，一万张图的数据集，应该设置为多大呢，设置为 1、10、100 或者是 10000 究竟有什么区别呢？

梯度下降优化算法综述

demi 在周三, 04/01/2020 - 15:27 提交

众所周知，梯度下降算法是机器学习中使用非常广泛的优化算法，也是众多机器学习算法中最常用的优化方法。几乎当前每一个先进的(state-of-the-art)机器学习库或者深度学习库都会包括梯度下降算法的不同变种实现。但是，它们就像一个黑盒优化器，很难得到它们优缺点的实际解释。

mini-batch梯度下降

demi 在周二, 09/03/2019 - 10:43 提交

传统的梯度下降，每次梯度下降都是对所有的训练数据进行计算平均梯度，这种梯度下降法叫做full-batch梯度下降法。考虑一种情况，当训练数据量在千万级别时，一次迭代需要等待多长时间，会极大的降低训练速度。

我们在训练神经网络模型时，最常用的就是梯度下降，这篇博客主要介绍下几种梯度下降的变种（mini-batch gradient descent和stochastic gradient descent），这里主要介绍Mini-batch gradient descent和stochastic gradient descent（SGD）以及对比下Batch gradient descent、mini-batch gradient descent和stochastic gradient descent的效果。

关于梯度下降方法四知四会

demi 在周一, 08/05/2019 - 11:55 提交

梯度下降方法是机器学习中常用的参数求解方法。本文将从四个方面为大家详细介绍梯度下降的算法理论，具体包括：① 梯度下降方法原理；② 关于梯度，为什么负梯度方向是下降最大方向？③ 实践，以回归分析为例；④ 梯度下降的其他问题。

深度学习优化方法——梯度下降算法

demi 在周五, 05/10/2019 - 09:27 提交

梯度下降的框架主要分三种：1，全量梯度下降：每次使用全部的样本来更新模型参数，优点是收敛方向准确，缺点是收敛速度慢，内存消耗大。；2，随机梯度下降：每次使用一个样本来更新模型参数，优点是学习速度快，缺点是收敛不稳定。；3，批量梯度下降：每次使用一个batchsize的样本来更新模型参数，平衡了全量梯度下降和随机梯度下降的方法。。