A
=
[
0.1
0.01
0.3
0.2
0.99
0.3
0.7
0
0.4
]
A = \begin{bmatrix} 0.1 & 0.01 & 0.3 \\ 0.2 & 0.99& 0.3\\ 0.7 & 0& 0.4 \end{bmatrix}
A=
?0.10.20.7?0.010.990?0.30.30.4?
?
形如矩阵 A,任何元素非负,且每列的元素加和为 1 的矩阵被称为马尔可夫矩阵。马尔可夫矩阵主要应用在概率领域。将一个马尔可夫矩阵进行方幂运算得到的仍旧是马尔可夫矩阵。
当处理一个微分方程问题时,特征值 0 意味着得到一个稳态。当进行矩阵的方幂运算时,特征值给出稳态的条件包括:
如我们所知,如果矩阵具有 n 个线性无关的特征向量,则有:
U
k
=
A
k
U
0
=
c
1
λ
1
k
X
1
+
c
2
λ
2
k
X
2
+
.
.
.
.
.
.
+
c
n
λ
n
k
X
n
U_k = A^kU_0 =c_1λ_1^kX_1 + c_2λ_2^kX_2 + ...... +c_nλ_n^kX_n
Uk?=AkU0?=c1?λ1k?X1?+c2?λ2k?X2?+......+cn?λnk?Xn?
如果 λ 1 λ_1 λ1?=1 并且其他的特征值都小于 1,则系统在 k 增大过程中趋近于 u 0 u_0 u0?的分量 c 1 x 1 c_1x_1 c1?x1?,即给出了一个稳态状况。这里特征向量 x 1 x_1 x1?的每一分量都是正的,因此若初始值为正,则最终的稳态也是正的。
Markov 矩阵每一列的元素加和为 1 这个条件,保证了矩阵具有 1 这个特征值。
A
?
I
=
[
?
0.9
0.01
0.3
0.2
?
0.09
0.3
0.7
0
?
0.6
]
A - I = \begin{bmatrix} -0.9 & 0.01 & 0.3 \\ 0.2 & -0.09& 0.3\\ 0.7 & 0& -0.6 \end{bmatrix}
A?I=
??0.90.20.7?0.01?0.090?0.30.3?0.6?
?
从每一列减去 1,则每列的加和都从 1 变为 0。这时候行向量相加的结构就是 0向量,因此行向量线性相关,矩阵为奇异矩阵。矩阵 A 有特征向量在 A-I 的零空间中,其对应的特征值为 1。回带计算可得
x
1
x_1
x1? =
[
0.6
33
0.7
]
\begin{bmatrix} 0.6\\33\\0.7 \end{bmatrix}
?0.6330.7?
?
我们用马尔可夫矩阵来研究人口流动问题。
[
u
c
a
l
u
m
a
s
s
]
t
=
k
+
1
=
[
0.9
0.2
0.1
0.8
]
[
u
c
a
l
u
m
a
s
s
]
t
=
k
\begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{t=k+1} = \begin{bmatrix} 0.9 & 0.2 \\ 0.1 & 0.8 \end{bmatrix} \begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{t=k}
[ucal?umass??]t=k+1?=[0.90.1?0.20.8?][ucal?umass??]t=k?
方程中 u 的分量分别代表加利福尼亚州和马萨诸塞州的人口,矩阵中的每一列中元素代表着人口去留比例,比如第一列 0.9 表示留在加州的人口占加州人口的90%,而 10%进入麻省,第二列中由麻省进入加州的人口占麻省的 20%,而 80%选择留在麻省。可以看到列向量分量的加和为 1 保证了整体人数不会变化,而在这种问题中矩阵也不会出现负的元素。
如果取初值 [ u c a l u m a s s ] 0 \begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{0} [ucal?umass??]0? = [ 0 1000 ] \begin{bmatrix} 0 \\ 1000 \end{bmatrix} [01000?]
则经过一次迁徙 [ u c a l u m a s s ] 1 \begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{1} [ucal?umass??]1? = [ 0.9 0.2 0.1 0.8 ] \begin{bmatrix} 0.9 & 0.2 \\ 0.1& 0.8 \end{bmatrix} [0.90.1?0.20.8?] [ 0 1000 ] \begin{bmatrix} 0 \\ 1000 \end{bmatrix} [01000?] = [ 200 800 ] \begin{bmatrix} 200 \\ 800 \end{bmatrix} [200800?]
为了获取长时间后的人口分布,我们需要了解矩阵的特征值和特征向量。因为这是马尔可夫矩阵,所以有一个特征值 1,则另一个特征值为
0.9+0.8-1=0.7。可以求得 x1= [ 2 1 ] \begin{bmatrix} 2\\1 \end{bmatrix} [21?],x2= [ 1 ? 1 ] \begin{bmatrix} 1\\-1 \end{bmatrix} [1?1?]。从 [ 2 1 ] \begin{bmatrix} 2\\1 \end{bmatrix} [21?],可知最后的稳态为加州人口 2/3,麻省人口 1/3。
通解为: u k = c 1 [ 2 1 ] + c 2 ( 0.7 ) k [ ? 1 1 ] u_k = c_1 \begin{bmatrix} 2 \\ 1 \end{bmatrix} + c_2(0.7)^k \begin{bmatrix} -1 \\ 1 \end{bmatrix} uk?=c1?[21?]+c2?(0.7)k[?11?] ,可以从 u0解得 c1=1000/3,c2=2000/3。
如果有一组标准正交基 q 1 , q 2 … … q n q_1,q_2……q_n q1?,q2?……qn?为则任意向量 v 可以写成:
v
=
x
1
q
1
+
x
2
q
2
…
…
x
n
q
n
v = x_1q_1+x_2q_2……x_nq_n
v=x1?q1?+x2?q2?……xn?qn?
因为当 i,j 不相等时有
q
i
T
q
j
q_i^Tq_j
qiT?qj?=0。因此有
q
i
T
v
=
x
1
q
i
T
q
1
+
x
2
q
i
T
q
2
…
…
x
n
q
i
T
q
n
=
x
i
q_i^Tv=x_1q_i^Tq_1+x_2q_i^Tq_2……x_nq_i^Tq_n=x_i
qiT?v=x1?qiT?q1?+x2?qiT?q2?……xn?qiT?qn?=xi?。
我们得到了分量 xi的公式:
x
i
=
q
i
T
v
x_i=q_i^Tv
xi?=qiT?v。
因为
v
=
[
q
1
.
.
.
q
n
]
[
x
1
.
.
.
x
n
]
v=\begin{bmatrix} q_1&...& q_n\end{bmatrix}\begin{bmatrix} x_1\\...\\ x_n\end{bmatrix}
v=[q1??...?qn??]
?x1?...xn??
?,即
v
=
Q
x
v=Qx
v=Qx,所以
x
=
Q
?
1
v
x =Q^{-1}v
x=Q?1v
因为 Q 为正交矩阵,所以有 Q ? 1 = Q T Q^{-1}=Q^T Q?1=QT。 x = Q T v x=Q^Tv x=QTv,这与我们之前得到的 x i = q i T v x_i=q_i^Tv xi?=qiT?v 完全相同。这里给出了求分量的思路就是用空间的一组标准正交基去点乘目标向量,利用其标准正交的性质得到所求。
标准正交是此处的核心概念。而傅里叶级数也是在这个概念上构建的。我们可以对任意函数做傅里叶展开,得到表达式:
f
(
x
)
=
a
0
+
a
1
c
o
s
x
+
b
1
s
i
n
x
+
a
2
c
o
s
2
x
+
b
2
s
i
n
2
x
+
.
.
.
f(x) = a_0 + a_1cosx +b_1sinx +a_2cos2x +b_2sin2x +...
f(x)=a0?+a1?cosx+b1?sinx+a2?cos2x+b2?sin2x+...
与之前的有限个标准正交向量组成的正交矩阵不同,这个空间是无限维,它的一组基是 1,cosx,sinx,cos2x,sin2x……
此处的正交概念与 Rn空间不同,点积的概念也不同。
向量
V
T
W
=
v
1
w
1
+
v
2
w
2
+
.
.
.
+
v
n
w
n
向量 V^TW =v_1w_1+v_2w_2+...+v_nw_n
向量VTW=v1?w1?+v2?w2?+...+vn?wn?
函数
f
T
g
=
∫
0
2
π
f
(
x
)
g
(
x
)
d
x
函数 f^Tg =\int^{2π}_0{f(x)g(x)}{\rm d}x
函数fTg=∫02π?f(x)g(x)dx