SiLU 函数是一种神经网络中的激活函数,全称是 Sigmoid Linear Unit, 也被称为 Swish 函数。它由 Google Brain 在 2017 年提出,是一种非线性激活函数,能够有效地对神经网络的输入进行非线性变换。
f ( x ) = x ? σ ( x ) f(x) = x * \sigma (x) f(x)=x?σ(x)
其中: σ ( x ) = 1 1 + e ? x \sigma(x) = \frac{1}{1+e^{-x}} σ(x)=1+e?x1?
SiLU 函数的特点如下:
m = nn.SiLU()
input = torch.randn(2)
output = m(input)