对于某些问题来说,深层神经网络相对于浅层神经网络解决该问题的效果会较好。所以问题就变成了神经网络层数的设置。
其中
n
[
i
]
n^{[i]}
n[i]表示第i层神经节点的个数,
w
[
l
]
w^{[l]}
w[l]代表计算第l层所采用的权重系数,
b
[
l
]
b^{[l]}
b[l]代表计算第l层所用的偏移量,
g
[
i
]
g^[i]
g[i]表示第i层所配置的激活函数,常见的激活函数有sigmoid,tanh、relu和leaky-relu等。
b
[
i
]
b^[i]
b[i]表示第i层配置的参数/偏移量
为了统一格式,可以将输入向量x改写成
a
[
0
]
a^{[0]}
a[0]