由于是拓展到向量空间 R n R^n Rn, 所以可由高数中的极值条件进行类比
一阶必要条件
设函数
f
(
x
)
f(x)
f(x) 在点
x
ˉ
\bar{x}
xˉ 处可微, 若
x
ˉ
\bar{x}
xˉ 是局部极小点,则
▽
f
(
x
ˉ
)
=
0
\bigtriangledown f(\bar{x}) = 0
▽f(xˉ)=0
类比于若
x
ˉ
\bar{x}
xˉ 是极小值点则
f
′
(
x
ˉ
)
=
0
f'(\bar{x}) = 0
f′(xˉ)=0
二阶必要条件
设
f
(
x
)
f(x)
f(x) 在
x
ˉ
\bar{x}
xˉ 处二阶可微,若
x
ˉ
\bar{x}
xˉ 是局部极小点, 则
▽
f
(
x
ˉ
)
=
0
\bigtriangledown f(\bar{x}) = 0
▽f(xˉ)=0, 且
H
e
s
s
i
a
n
Hessian
Hessian 矩阵
▽
2
f
(
x
ˉ
)
\bigtriangledown^2f(\bar{x})
▽2f(xˉ) 是半正定的。
类比于 若
x
ˉ
\bar{x}
xˉ是极小值点则
f
′
(
x
ˉ
)
=
0
,
且
f
′
′
(
x
ˉ
)
≥
0
f'(\bar{x}) = 0, 且 f''(\bar{x}) \geq 0
f′(xˉ)=0,且f′′(xˉ)≥0
二阶充分条件
设函数
f
(
x
)
f(x)
f(x) 在点
x
ˉ
\bar{x}
xˉ 处二次可微,若梯度
▽
f
(
x
ˉ
)
=
0
\bigtriangledown f(\bar{x}) = 0
▽f(xˉ)=0, 且
H
e
s
s
i
a
n
Hessian
Hessian 矩阵
▽
2
f
(
x
ˉ
)
正
定
\bigtriangledown^2f(\bar{x})正定
▽2f(xˉ)正定, 则
x
ˉ
\bar{x}
xˉ是严格局部极小点。
类比于
f
′
(
x
ˉ
)
=
0
,
f
′
′
(
x
ˉ
)
>
0
f'(\bar{x}) = 0, f''(\bar{x}) > 0
f′(xˉ)=0,f′′(xˉ)>0则
x
ˉ
\bar{x}
xˉ 是极小值点
充要条件
设
f
(
x
)
f(x)
f(x) 是定义在
R
n
R^n
Rn 上的可微凸函数
,
x
ˉ
∈
R
n
\bar{x} \in R^n
xˉ∈Rn, 则
x
ˉ
\bar{x}
xˉ 为整体极小点的充要条件是
▽
f
(
x
ˉ
)
=
0
\bigtriangledown f(\bar{x}) = 0
▽f(xˉ)=0
注:如果
f
(
x
)
f(x)
f(x) 是严格凸的,则全局极小点是唯一的。
定义: 对 m i n f ( x ) min f(x) minf(x), 设 x ˉ ∈ R n \bar{x} \in R^n xˉ∈Rn 是任给一点, d =? 0 d \not = 0 d?=0, 若存在 δ > 0 \delta > 0 δ>0, 使得对任意的 λ ∈ ( 0 , δ ) \lambda \in (0, \delta) λ∈(0,δ), 有 f ( x ˉ + λ d ) < f ( x ˉ ) f (\bar{x} + \lambda d) < f(\bar{x}) f(xˉ+λd)<f(xˉ), 则称 d d d 为 f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 处的下降方向。
引理: 设函数
f
(
x
)
f(x)
f(x) 在点
x
ˉ
\bar{x}
xˉ 可微, 若存在
d
=?
0
d \not = 0
d?=0, 使得
▽
f
(
x
ˉ
)
T
d
<
0
\bigtriangledown f(\bar{x})^T d < 0
▽f(xˉ)Td<0, 则存在
δ
>
0
\delta > 0
δ>0, 是使得对
?
λ
∈
(
0
,
δ
)
\forall \lambda \in (0, \delta)
?λ∈(0,δ), 有
f
(
x
ˉ
+
λ
d
)
<
f
(
x
ˉ
)
f(\bar{x} + \lambda d)<f(\bar{x})
f(xˉ+λd)<f(xˉ)。
即与梯度方向成钝角的方向是下降方向
表示为
F
0
=
{
d
∣
▽
f
(
x
ˉ
)
T
d
<
0
}
F_0 = \{ d | \bigtriangledown f(\bar{x})^T d < 0\}
F0?={d∣▽f(xˉ)Td<0}
定义: 设集合
S
?
R
n
,
x
ˉ
∈
c
l
S
.
S \subset R^n, \bar{x} \in clS.
S?Rn,xˉ∈clS.,
d
d
d 为非零向量, 若存在数
δ
>
0
\delta > 0
δ>0, 使得对任意
λ
∈
(
0
,
δ
)
,
\lambda \in (0, \delta),
λ∈(0,δ), 都有
x
ˉ
+
λ
d
∈
S
\bar{x} + \lambda d \in S
xˉ+λd∈S 则称
d
d
d 为集合
S
S
S 在
x
ˉ
\bar{x}
xˉ 的可行方向。
就是移动方向在可行域内
表示为
D
=
{
d
∣
d
=?
0
,
x
ˉ
∈
c
l
S
,
?
δ
>
0
,
?
λ
∈
(
0
,
δ
)
,
有
x
ˉ
+
λ
d
∈
S
}
D = \{ d | d \not = 0, \bar{x} \in clS, \exists \delta > 0, \forall \lambda \in (0, \delta), 有 \bar{x} + \lambda d \in S \}
D={d∣d?=0,xˉ∈clS,?δ>0,?λ∈(0,δ),有xˉ+λd∈S}
x
ˉ
处
的
可
行
方
向
锥
\bar{x} 处的可行方向锥
xˉ处的可行方向锥
定义: 若问题的可行点
x
ˉ
\bar{x}
xˉ 是某个不等式约束
g
i
(
x
)
≥
0
g_i(x) \geq 0
gi?(x)≥0 变成等式, 则该不等式约束称为关于可行点
x
ˉ
\bar{x}
xˉ 的起作用约束; 否则称为不起作用约束。
表示为
I
=
{
i
∣
g
i
(
x
ˉ
=
0
,
x
ˉ
∈
S
)
}
I = \{ i| g_i(\bar{x} = 0, \bar{x} \in S) \}
I={i∣gi?(xˉ=0,xˉ∈S)}
定义:在起作用约束作对应切线,获得对应梯度,与这两个梯度同时呈锐角的方向为积极约束的可行方向。
表示为
G
0
=
{
d
∣
▽
g
i
(
x
ˉ
)
T
d
>
0
,
i
∈
I
(
x
)
}
G_0 = \{d | \bigtriangledown g_i(\bar{x})^T d > 0, i \in I(x) \}
G0?={d∣▽gi?(xˉ)Td>0,i∈I(x)}
即由约束条件求出的可行方向
有
G
0
?
D
G_0 \subset D
G0??D
问题标准形式:
????????
m
i
n
f
(
x
)
\ \ \ \ \ \ \ \ min f(x)
????????minf(x)
s . t . { g i ( x ) ≥ 0 , 不 等 式 约 束 h j ( x ) = 0 , 等 式 约 束 x ∈ R n s.t.\left \{\begin{matrix} g_i (x) \geq 0,不等式约束 \\ \\h_j(x) = 0,等式约束 \\ \\ x \in R^n \end {matrix} \right. s.t.????????????gi?(x)≥0,不等式约束hj?(x)=0,等式约束x∈Rn?
几何最优性条件:设
S
S
S 是
R
n
R^n
Rn 的非空集合,
x
ˉ
∈
S
,
f
(
x
)
\bar{x} \in S, f(x)
xˉ∈S,f(x)在
x
ˉ
\bar{x}
xˉ 处可微, 若
x
ˉ
\bar{x}
xˉ 是局部最优解, 则
F
0
∩
D
=
?
F_0 \cap D = \emptyset
F0?∩D=?
即所有的可行方向都是上升方向
由于 G 0 ? D G_0 \subset D G0??D 所以也有 F 0 ∩ G 0 = ? F_0 \cap G_0 = \emptyset F0?∩G0?=?,可行域之内不能有空洞
为必要条件,极小值点一定是 F-J点, 但 F-J点不一定为极小值点
当
w
0
=
0
w_0 = 0
w0?=0 是另外另个约束条件的梯度必须能相互抵消,这种情况才有最优解,因此更多的是关注
w
0
=?
0
w_0 \not = 0
w0??=0的情况
凸规划的判别方法:
求KKT点
通过这个表述方式,加上原来的约束
然后将所有的方程列出来求解
有人会算的话请留言,感谢