神经网络中如何确定隐藏层的层数和大小

在前馈神经网络中，隐藏层的数量和层数的确定尚无依据，一般是由经验决定。查阅了大量相关的文章之后我对其进行了综合梳理。这里需要明确的一点是，这些只是根据经验提出的一些参考的方法，具体的层数和大小还是要在实际实验中进行验证。二分类问题方法出自：Beginners Ask “How Many Hidden Layers/Neurons to Use in Artificial Neural Networ

LolitaAnn

18860人浏览 · 2022-03-29 19:37:20

LolitaAnn · 2022-03-29 19:37:20 发布

在前馈神经网络中，隐藏层的数量和层数的确定尚无依据，一般是由经验决定。

查阅了大量相关的文章之后我对其进行了综合梳理。

这里需要明确的一点是，这些只是根据经验提出的一些参考的方法，具体的层数和大小还是要在实际实验中进行验证。

在此之前我们还需要理解一点，就是当我们神经元足够多，隐藏层足够多的时候我们甚至能完美拟合所有的点，但是也会带来过拟合的问题。因此我们要把握一个适中的度。

二分类问题

方法出自：Beginners Ask “How Many Hidden Layers/Neurons to Use in Artificial Neural Networks?”¹

对于二分类比较好理解。但是我对这个方法持保留态度。

先看下边这两类，我们只需要一条斜线就可以完成映射。所以不需要隐藏层，直接input到output即可。
在这里插入图片描述
对于这样要靠两个方向的直线才能分开的这样想：一个神经元只能学习一条方向的直线，所以两个方向需要两个神经元，最后把两个方向的神经元拼起来获得最后的分割线。

以此类推，第一个隐藏层学到单方向的直线，第二个隐藏层将两条线拼接，以此类推直到最后都拼接起来。
在这里插入图片描述
但是对于这个我存在一个疑问，二分类问题本来就很简单了，需要那么多层隐藏层吗？我觉得根本没必要那么多层隐藏层。

虽然从理论上说，层数越多拟合函数越强，但是实际上更深的层数可能会带来过拟合的问题，同时也会增加训练难度，使模型难以收敛。

回归问题

评论区有人问回归问题怎么设置网络。

❓ 不就是画一条线把他们分开变成画一条线把他们连起来吗……
在这里插入图片描述

隐藏层数量

从上边我们可以得到一个结论：在神经网络中，当数据需要非线性分离的时候才需要隐藏层。

什么是线性？
²

对于隐藏层的层数我找到一个说法：

Table: Determining the Number of Hidden Layers³

Num Hidden Layers	Result
none	Only capable of representing linear separable functions or decisions.
1	Can approximate any function that contains a continuous mapping from one finite space to another.
2	Can represent an arbitrary decision boundary to arbitrary accuracy with rational activation functions and can approximate any smooth mapping to any accuracy.
>2	Additional layers can learn complex representations (sort of automatic feature engineering) for layer layers.

翻译过来就是：