一阶线性微分方程组

线性微分方程组的基本概念

线性微分方程组的定义

矩阵函数

定义:
\(\boldsymbol{A}(t)=(a_{ij}(t))_{n \times m}, t \in \boldsymbol{I}\),其中 \((a_{ij}(t))_{n \times m}\)\(\boldsymbol{I}\) 上的函数。

  • 若所有函数 \(a_{ij}\) 均在区间 \(\boldsymbol{I}\) 上连续,则称矩阵函数 \(\boldsymbol{A}(t)\) 在区间 \(\boldsymbol{I}\) 上连续。
  • \(a_{ij}(t)\) 在区间 \(\boldsymbol{I}\) 上可导(可积),则称矩阵函数 \(\boldsymbol{A}(t)\) 在区间 \(\boldsymbol{I}\) 上可导(可积)。

矩阵函数的运算

\[ \dot{\boldsymbol{A}(t)} = \frac{\mathrm{d}}{\mathrm{d}t} \boldsymbol{A}(t) = \frac{\mathrm{d}}{\mathrm{d}t} (a_{ij}(t))_{n \times m} = \left( \int_{a}^{b} a_{ij}(t) \mathrm{d}t \right)_{n \times m} \]

容易验证矩阵函数的导数满足如下法则:

  • \(\frac{\mathrm{d}}{\mathrm{d}t}(\boldsymbol{CA}) = \boldsymbol{C} \frac{\mathrm{d}\boldsymbol{A}}{\mathrm{d}t}\),其中 \(\boldsymbol{C}\) 是可与 \(\boldsymbol{A}\) 相乘的常数矩阵;
  • \(\frac{\mathrm{d}}{\mathrm{d}t}(\boldsymbol{A} \pm \boldsymbol{B}) = \frac{\mathrm{d}\boldsymbol{A}}{\mathrm{d}t} \pm \frac{\mathrm{d}\boldsymbol{B}}{\mathrm{d}t}\)
  • \(\frac{\mathrm{d}}{\mathrm{d}t}(\boldsymbol{A} \cdot \boldsymbol{B}) = \boldsymbol{A} \cdot \frac{\mathrm{d}\boldsymbol{B}}{\mathrm{d}t} + \boldsymbol{B} \cdot \frac{\mathrm{d}\boldsymbol{A}}{\mathrm{d}t}\)

向量值函数

定义:
\(\boldsymbol{x}(t)=(x_1(t), \dots, x_n(t))^{T}\) 可以看成一个列矩阵,是上述的一个特例,因此可以使用上述运算法则。例如:
\(\frac{\mathrm{d}\boldsymbol{x}(t)}{\mathrm{d}t} = (\dot{x_1}(t), \dots, \dot{x_n}(t))^{T}\)

那么我们就得到了线性微分方程组的向量形式: \[ \frac{\mathrm{d}\boldsymbol{x}(t)}{\mathrm{d}t} = \boldsymbol{A}(t) \boldsymbol{x}(t) + \boldsymbol{f}(t) \]\(\boldsymbol{f}(t) \equiv 0\) 时,上式变为: \[ \frac{\mathrm{d}\boldsymbol{x}(t)}{\mathrm{d}t} = \boldsymbol{A}(t) \boldsymbol{x}(t) \] 称为 齐次线性微分方程组
\(\boldsymbol{f}(t) \neq \boldsymbol{0}\) 时,称上式为 非齐次线性微分方程组

线性微分方程组的解

由于方程组的左端由 \(\boldsymbol{x}\)\(n\) 个分量的导数组成,则它的解中可以含有 \(n\) 个独立的任意常数,并称这样的解为方程组的 通解,不含任意常数的则称为 特解
要确定通解中的 \(n\) 个任意常数,需要 \(n\) 个独立的附加条件(定解条件)。若定解条件是由函数 \(\boldsymbol{x}(t)\) 在一点 \(t = t_0\) 处的值给出:
\(\boldsymbol{x}(t_0) = \boldsymbol{x_0} = (x_{0,1}, \dots, x_{0,n})^{T}\),则此条件称为初值条件,即求解如下方程组: \[ \left\{ \begin{array}{l} \frac{\mathrm{d} \boldsymbol{x} (t)}{\mathrm{d}t} = \boldsymbol{A}(t) \boldsymbol{x}(t) + \boldsymbol{f}(t), \\ \boldsymbol{x}(t_0) = \boldsymbol{x}_0 \end{array} \right. \] 该问题称为 初值问题,或 Cauchy问题。它与方程式一样有类似的性质:

解的存在唯一性定理

当系数矩阵 \(\boldsymbol{A}(t)\) 与非齐次项 \(\boldsymbol{f}(t)\)\((a, b)\) 内连续时,初值问题的解在 \((a, b)\) 内是存在且唯一的。

由此我们有以下结论:

定理

线性微分方程组满足初始条件: \[ \boldsymbol{x}(t_0) = \boldsymbol{x_0} \] 的解 \(\boldsymbol{x} = \boldsymbol{x}(t)\) 在区间 \((a,b)\) 上是存在且唯一的,其中初值 \(t_0 \in (a,b)\)\(\boldsymbol{x_0} \in \mathbb{R}^{n}\) 是任意给定的。

齐次线性微分方程组

  1. \(\boldsymbol{x}(t) \equiv \boldsymbol{0}\) 是方程组的解,称为 平凡解零解
  2. 若方程组的解 \(\boldsymbol{x}(t)\) 满足初值条件 \(\boldsymbol{x}(t_0) = \boldsymbol{0}\),则由解的存在唯一性定理可知必有 \(\boldsymbol{x}(t) \equiv \boldsymbol{0}\)
  3. \(\boldsymbol{x}_i(t) \ (i = 1, \dots, n, t \in (a, b))\) 均为方程组的解, \(C_1, \dots, C_n\) 皆为常数,则其线性组合 \(\sum_{i=1}^{n} C_i \boldsymbol{x}_i(t) \quad (t \in (a,b))\) 也是方程组的解。

线性相关与线性无关

当在区间 \((a, b)\) 上的向量函数满足以下条件时: \[ c_1 \boldsymbol{\phi}_1(x) + c_2 \boldsymbol{\phi}_2(x) + \cdots + c_m \boldsymbol{\phi}_m(x) \equiv \boldsymbol{0}, \quad \boldsymbol{x} \in (a, b) \] 其中 \(c_1, c_2, \dots, c_m\) 为不全为零的任意常数,那么我们称 \(\boldsymbol{\phi}_1(x), \boldsymbol{\phi}_2(x), \dots, \boldsymbol{\phi}_m(x)\)线性相关,否则,称为 线性无关

我们知道方程组的通解由 \(n\) 个线性无关的向量构成一个解空间(线性无关与线性相关的概念参考线性代数的内容)。我们称这样的解为 基本解组,以这些解的分量构成的矩阵称为方程组的 基解矩阵,记为: \[ \boldsymbol{X}(t) = \left[ \begin{array}{cccc} x_{11}(t) & x_{21}(t) & \ldots & x_{n1}(t) \\ \vdots & \vdots & \ddots & \vdots \\ x_{1n}(t) & x_{2n}(t) & \ldots & x_{nn}(t) \end{array} \right] = (\boldsymbol{x}_1(t), \dots, \boldsymbol{x}_n(t)) \]

利用基解矩阵可将方程组的通解表示为: \[ \boldsymbol{x}(t) = \boldsymbol{X}(t)\boldsymbol{C}, \quad t \in (a,b) \] 其中 \(\boldsymbol{C} = (C_1, \dots, C_n)^{T}\) 是由任意常数构成的常向量。

由此可见,求解齐次线性微分方程组的关键就是求出其基解矩阵,也就是 \(n\) 个线性无

关的特解。我们有下列简单的线性无关的判别法:

Wronski行列式

\(n\)\(n\) 维向量值函数 \(\boldsymbol{x}_i(t) \ (t \in \boldsymbol{I}, i = 1, 2, \dots, n)\) 的分量 \(x_{ij}\)\(i,j = 1, 2, \dots, n\))依次为列所构成的行列式,称为这 \(n\) 个向量值函数的 Wronski行列式,记作 \(W(t) = \det(x_{ij}(t)), t \in \boldsymbol{I}\)

\[ W(t) = \left| \begin{array}{cccc} x_{11}(t) & x_{12}(t) & \cdots & x_{1n}(t) \\ x_{21}(t) & x_{22}(t) & \cdots & x_{2n}(t) \\ \ldots & \ldots & \vdots & \ldots \\ x_{n1}(t) & x_{n2}(t) & \cdots & x_{nn}(t) \end{array} \right| \]

Liouville公式

如果 Wronski 行列式 \(W(t)\) 满足: \[ W(t) = W(t_0) \exp\left( \int_{t_0}^{t} \text{tr} \boldsymbol{A}(\tau) \, \mathrm{d}\tau \right), \quad a < t_0, t < b \] 其中: \[ \text{tr} \boldsymbol{A}(t) = \sum_{i=1}^n a_{ii}(t) \] 为矩阵 \(\boldsymbol{A}(t)\) 的迹。

由上述定理可知,Wronski 行列式 \(W(t)\) 在区间 \((a, b)\) 上只有两种可能,恒为 \(0\) 或恒不为 \(0\)

定理

齐次微分方程组的 \(n\) 个解 \(\boldsymbol{x}_i(t) \ (i=1, 2, \dots, n)\)\((a,b)\) 内线性无关的充要条件是存在一点 \(t_0 \in (a, b)\),使得这 \(n\) 个解的 Wronski 行列式在 \(t_0\) 处的值 \(W(t_0) \neq 0\)

接下来我们来看基解矩阵所具有的性质:

  1. 基解矩阵 \(\boldsymbol{X}(t)\) 满足矩阵方程: \[ \frac{\mathrm{d} \boldsymbol{X}}{\mathrm{d}t} = \boldsymbol{A}(t) \boldsymbol{X} \]
  2. \(\boldsymbol{X}(t)\) 是方程组在 \((a,b)\) 内的任一基解矩阵,\(\boldsymbol{B}\) 是任一 \(n\) 阶非奇异常数矩阵,则 \(\boldsymbol{X}(t) \boldsymbol{B}\) 也是方程组在 \((a,b)\) 内的一个基解矩阵。
  3. \(\boldsymbol{X}(t)\)\(\boldsymbol{X}^*(t)\) 是方程组在 \((a,b)\) 内的任意两个基解矩阵,则必存在一个 \(n\) 阶非奇异常数矩阵 \(\boldsymbol{B}\),使得: \[ \boldsymbol{X}(t) = \boldsymbol{X}^*(t) \boldsymbol{B}, \quad t \in (a,b) \]

非齐次线性微分方程组

定理:非齐次线性微分方程组解的结构

非齐次线性微分方程组的任一解 \(\boldsymbol{x}(t)\) 可以表示为它的任一特解 \(\boldsymbol{x}^{*}(t)\) 与它所对应的齐次线性微分方程组的通解之和,即:

\[ \boldsymbol{x}(t) = \boldsymbol{X}(t) \boldsymbol{C} + \boldsymbol{x}^{*}(t), \quad t \in (a,b) \]

定理:非齐次线性微分方程组的特解

\(\boldsymbol{X}(t)\) 是齐次线性微分方程组的一个基解矩阵,则非齐次线性微分方程组的特解为:

\[ \boldsymbol{x}^{*}(t) = \boldsymbol{X}(t) \int_{t_0}^{t} \boldsymbol{X}^{-1}(\tau) \boldsymbol{f}(\tau) \, \mathrm{d} \tau, \quad t \in (a,b) \]

因此,非齐次线性微分方程组的通解为:

\[ \boldsymbol{x}(t) = \boldsymbol{X}(t) \boldsymbol{C} + \boldsymbol{X}(t) \int_{t_0}^{t} \boldsymbol{X}^{-1}(\tau) \boldsymbol{f}(\tau) \, \mathrm{d} \tau \]

代入初值条件 \(\boldsymbol{x}(t_0) = \boldsymbol{x}_0\) 可得特解:

\[ \boldsymbol{x}(t) = \boldsymbol{X}(t) \boldsymbol{X}^{-1}(t_0) \boldsymbol{x}_0 + \boldsymbol{X}(t) \int_{t_0}^{t} \boldsymbol{X}^{-1}(\tau) \boldsymbol{f}(\tau) \, \mathrm{d} \tau \]

常系数线性微分方程组

当微分方程组的系数为常数时,称该方程组为常系数线性微分方程组。其矩阵形式为:

\[ \frac{\mathrm{d}\boldsymbol{x}}{\mathrm{d}t} = \boldsymbol{A} \boldsymbol{x} \]

常系数齐次微分方程组

常系数齐次微分方程组的形式为:

\[ \frac{\mathrm{d}\boldsymbol{x}}{\mathrm{d}t} = \boldsymbol{A} \boldsymbol{x} \]

通过待定系数法,可以设解为 \(\boldsymbol{x} = \boldsymbol{r} e^{\lambda t}\),代入方程中得到:

\[ \boldsymbol{r} \lambda = \boldsymbol{A} \boldsymbol{r} \quad \text{或} \quad (\boldsymbol{A} - \lambda \boldsymbol{E}) \boldsymbol{r} = 0 \]

这表明方程组的解为 \(\boldsymbol{A}\) 的特征值和对应的特征向量。

(1) \(\boldsymbol{A}\)\(n\) 个线性无关的特征向量

当矩阵 \(\boldsymbol{A}\)\(n\) 个线性无关的特征向量时,可以对角化 \(\boldsymbol{A}\)。此时,基解矩阵为:

\[ \boldsymbol{X}(t) = \left( \boldsymbol{r}_1 e^{\lambda_1 t}, \boldsymbol{r}_2 e^{\lambda_2 t}, \dots, \boldsymbol{r}_n e^{\lambda_n t} \right) \]

其中 \(\boldsymbol{r}_i\) 为特征向量,\(\lambda_i\) 为特征值。常系数齐次微分方程组的通解为:

\[ \boldsymbol{x}(t) = \boldsymbol{X}(t) \boldsymbol{C} = C_1 e^{\lambda_1 t} \boldsymbol{r}_1 + C_2 e^{\lambda_2 t} \boldsymbol{r}_2 + \dots + C_n e^{\lambda_n t} \boldsymbol{r}_n \]

例子

求解以下方程组的通解:

\[ \frac{\mathrm{d}\boldsymbol{x}}{\mathrm{d}t} = \begin{bmatrix} 4 & -1 & -1 \\ 1 & 2 & -1 \\ 1 & -1 & 2 \end{bmatrix} \boldsymbol{x} \]

特征方程为:

\[ \text{det}(\boldsymbol{A} - \lambda \boldsymbol{E}) = (\lambda - 3)^2 (\lambda - 2) = 0 \]

得到特征值 \(\lambda_1 = 2\)\(\lambda_2 = \lambda_3 = 3\)。对应的特征向量为:

\[ \boldsymbol{r}_1 = \begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix}, \quad \boldsymbol{r}_2 = \begin{bmatrix} 1 \\ 1 \\ 0 \end{bmatrix}, \quad \boldsymbol{r}_3 = \begin{bmatrix} 1 \\ 0 \\ 1 \end{bmatrix} \]

基解矩阵为:

\[ \boldsymbol{X}(t) = \begin{bmatrix} e^{2t} & e^{3t} & e^{3t} \\ e^{2t} & e^{3t} & 0 \\ e^{2t} & 0 & e^{3t} \end{bmatrix} \]

通解为:

\[ \boldsymbol{x}(t) = C_1 e^{2t} \begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} + C_2 e^{3t} \begin{bmatrix} 1 \\ 1 \\ 0 \end{bmatrix} + C_3 e^{3t} \begin{bmatrix} 1 \\ 0 \\ 1 \end{bmatrix} \]

(2) \(\boldsymbol{A}\) 没有 \(n\) 个线性无关的特征向量

\(\boldsymbol{A}\) 没有 \(n\) 个线性无关的特征向量时,不能对角化矩阵,采用 Jordan 标准型。此时,解的形式为:

\[ \boldsymbol{x}(t) = e^{\lambda_i t} \left( \boldsymbol{r}_0 + \frac{t}{1!} \boldsymbol{r}_1 + \frac{t^2}{2!} \boldsymbol{r}_2 + \dots + \frac{t^{n_i - 1}}{(n_i - 1)!} \boldsymbol{r}_{n_i - 1} \right) \]

其中,\(\boldsymbol{r}_0\) 是齐次线性方程组的非零解,\(\boldsymbol{r}_1, \dots, \boldsymbol{r}_{n_i - 1}\) 由下列递推关系式确定:

\[ \boldsymbol{r}_1 = (\boldsymbol{A} - \lambda_i \boldsymbol{E}) \boldsymbol{r}_0, \quad \boldsymbol{r}_2 = (\boldsymbol{A} - \lambda_i \boldsymbol{E}) \boldsymbol{r}_1, \dots \quad \boldsymbol{r}_{n_{i}-1} = (\boldsymbol{A} - \lambda_i \boldsymbol{E}) \boldsymbol{r}_{n_{i}-2} \]

求微分方程组

\[ \frac{\mathrm{d}\boldsymbol{x} }{\mathrm{d}t}=\left[ \begin{array}{ccc} 1 & \frac{2}{3} &-\frac{2}{3} \\ 0 & \frac{2}{3} & \frac{1}{3}\\ 0 & -\frac{1}{3} & \frac{4}{3} \end{array} \right]\boldsymbol{x} \]

的通解.

首先列出\(\boldsymbol{A}\)的特征方程并求其特征值

\[ \mathrm{det}(\boldsymbol{A}-\lambda\boldsymbol{E})=(\lambda-1)^{3}=0,\ \ \lambda_{1}=\lambda_{2}=\lambda_{3}=1 \]

对于三重特征值\(\lambda_{1}=1\),由于\((\boldsymbol{A}-\boldsymbol{E})\)不满秩,故先求出方程组\((\boldsymbol{A}-\boldsymbol{E})^{3}\boldsymbol{r}=\boldsymbol{0}\)的解:

\[ \boldsymbol{r}_{0}^{(1)}=\left[ \begin{array}{c} 1 \\ 0 \\ 0 \end{array} \right] \quad \boldsymbol{r}_{0}^{(2)}=\left[ \begin{array}{c} 0 \\ 1 \\ 0 \end{array} \right] \quad \boldsymbol{r}_{0}^{(3)}=\left[ \begin{array}{c} 0 \\ 0 \\ 1 \end{array} \right] \]

\(\boldsymbol{r}_{0}^{(1)}\)\(\boldsymbol{r}_{0}^{(2)}\)\(\boldsymbol{r}_{0}^{(3)}\)分别代入上述公式,可得:

\[ \boldsymbol{r}_{1}^{(1)}=(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{r}_{0}^{(1)} = \left[ \begin{array}{c} 0 \\ 0 \\ 0 \end{array} \right] \quad \boldsymbol{r}_{2}^{(1)}=(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{r}_{1}^{(1)} = \left[ \begin{array}{c} 0 \\ 0 \\ 0 \end{array} \right] \]

\[ \boldsymbol{r}_{1}^{(2)}=(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{r}_{0}^{(2)} = \left[ \begin{array}{c} \frac{2}{3} \\ -\frac{1}{3} \\ -\frac{1}{3} \end{array} \right] \quad \boldsymbol{r}_{2}^{(2)}=(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{r}_{1}^{(2)} = \left[ \begin{array}{c} 0 \\ 0 \\ 0 \end{array} \right] \]

\[ \boldsymbol{r}_{1}^{(3)}=(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{r}_{0}^{(3)} = \left[ \begin{array}{c} -\frac{2}{3} \\ \frac{1}{3} \\ \frac{1}{3} \end{array} \right] \quad \boldsymbol{r}_{2}^{(3)}=(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{r}_{1}^{(3)} = \left[ \begin{array}{c} 0 \\ 0 \\ 0 \end{array} \right] \]

\(\boldsymbol{r}_{0}^{(1)}, \boldsymbol{r}_{1}^{(1)}, \boldsymbol{r}_{2}^{(1)}, \boldsymbol{r}_{0}^{(2)}, \boldsymbol{r}_{1}^{(2)}, \boldsymbol{r}_{2}^{(2)}, \boldsymbol{r}_{0}^{(3)}, \boldsymbol{r}_{1}^{(3)}, \boldsymbol{r}_{2}^{(3)}\)分别代入上述式子,得到三个特解

\[ \boldsymbol{x}_{1}(t)=\mathrm{e}^{t}(\boldsymbol{r}_{0}^{(1)}+t\boldsymbol{r}_{1}^{(1)}+\frac{t^{2}}{2}\boldsymbol{r}_{2}^{(1)})=\mathrm{e}^{t}\left( \left[ \begin{array}{c} 1 \\0 \\0 \end{array} \right] + t \left[ \begin{array}{c} 0\\0\\0 \end{array} \right]+ \frac{t^{2}}{2} \left[ \begin{array}{c} 0\\0\\0 \end{array} \right] \right) = \mathrm{e}^{t} \left[ \begin{array}{c} 1 \\0 \\0 \end{array} \right] \]

\[ \boldsymbol{x}_{2}(t)=\mathrm{e}^{t}(\boldsymbol{r}_{0}^{(2)}+t\boldsymbol{r}_{1}^{(2)}+\frac{t^{2}}{2}\boldsymbol{r}_{2}^{(2)})=\mathrm{e}^{t}\left( \left[ \begin{array}{c} 0 \\1 \\0 \end{array} \right] + t \left[ \begin{array}{c} \frac{2}{3} \\ -\frac{1}{3} \\ -\frac{1}{3} \end{array} \right]+ \frac{t^{2}}{2} \left[ \begin{array}{c} 0\\0\\0 \end{array} \right] \right) = \mathrm{e}^{t} \left[ \begin{array}{c} \frac{2}{3}t \\ -\frac{1}{3}t+1 \\ -\frac{1}{3}t \end{array} \right] \]

\[ \boldsymbol{x}_{3}(t)=\mathrm{e}^{t}(\boldsymbol{r}_{0}^{(3)}+t\boldsymbol{r}_{1}^{(3)}+\frac{t^{2}}{2}\boldsymbol{r}_{2}^{(3)})=\mathrm{e}^{t}\left( \left[ \begin{array}{c} 0 \\0 \\1 \end{array} \right] + t \left[ \begin{array}{c} -\frac{2}{3} \\ \frac{1}{3} \\ \frac{1}{3} \end{array} \right]+ \frac{t^{2}}{2} \left[ \begin{array}{c} 0\\0\\0 \end{array} \right] \right) = \mathrm{e}^{t} \left[ \begin{array}{c} -\frac{2}{3}t \\ \frac{1}{3}t \\ \frac{1}{3}t+1 \end{array} \right] \]

则微分方程组的通解为:

\[ \boldsymbol{x}(t)= \left[ \begin{array}{ccc} \mathrm{e}^{t} &\frac{2}{3}t\mathrm{e}^{t}&-\frac{2}{3}t \mathrm{e}^{t} \\ 0 & (1-\frac{1}{3}t) \mathrm{e}^{t}&\frac{1}{3}t\mathrm{e}^{t} \\ 0 & -\frac{1}{3}t \mathrm{e}^{t}& (1+\frac{1}{3}t)\mathrm{e}^{t} \end{array} \right] \boldsymbol{c} \]

其中\(\boldsymbol{c}\)是任意三维常数向量.

\(\boldsymbol{A}\)有复特征值

定理

设方程组有一个复数解

\[ \boldsymbol{x}_{1}(t)=\boldsymbol{u}(t) \pm \mathrm{i}\boldsymbol{v}(t) \]

\(\boldsymbol{u}(x)\)\(\boldsymbol{v}(x)\)是方程组两个线性无关的特解,可以代替\(\boldsymbol{x}_{1}(t)\)与其共轭.

所以我们如果遇到复特征值时,只需选一组中的一个进行计算就好了.

例子

求解初值问题

\[ \frac{\mathrm{d}\boldsymbol{x}}{\mathrm{d}t}=\left[ \begin{array}{cc} 5 & -1\\ 1 &5 \end{array} \right]\boldsymbol{x} \]

首先求\(\boldsymbol{A}\)的特征值

\[ \mathrm{det}(\boldsymbol{A}-\lambda\boldsymbol{E})=(\lambda-5)^{2}+1=0,\ \lambda_{1}=5+\mathrm{i},\lambda_{2}=5-\mathrm{i} \]

接下来不论是计算\(\lambda_{1}\)还是\(\lambda_{2}\),是一样的,这里以\(\lambda_{1}\)为例,其特征向量为

\[ \boldsymbol{r}_{1}=\left[ \begin{array}{c} \mathrm{i} \\ 1 \end{array} \right] \]

此时有特解

\[ \boldsymbol{x}_{0}(t) =\mathrm{e}^{(5+\mathrm{i})t}\left[ \begin{array}{c} \mathrm{i} \\ 1 \end{array} \right] =\mathrm{e}^{5t} \left( \left[ \begin{array}{c} -\mathrm{sin}t \\ \mathrm{cos}t \end{array} \right] + \mathrm{i} \left[ \begin{array}{c} \mathrm{cos}t \\ \mathrm{sin}t \end{array} \right] \right) \]

则该微分方程组有两个特解

\[ \boldsymbol{x}_{1}(t)=\mathrm{e}^{5t} \left[ \begin{array}{c} -\mathrm{sin}t \\ \mathrm{cos}t \end{array} \right] \quad \boldsymbol{x}_{2}(t)=\mathrm{e}^{5t} \left[ \begin{array}{c} \mathrm{cos}t \\ \mathrm{sin}t \end{array} \right] \]

则微分方程组的通解为

\[ \boldsymbol{x}(t)= \mathrm{e}^{5t} \left[ \begin{array}{cc} -\mathrm{sin}t & \mathrm{cos}t \\ \mathrm{cos}t & \mathrm{sin}t \end{array} \right] \boldsymbol{c} \]

其中\(\boldsymbol{c}\)是任意二维常数向量.

备注

以上就是所用题的通用解法,但当然有些时候还是要因题而异,或许会有更简单的解答方法.

求解微分方程组

\[ \frac{\mathrm{d}\boldsymbol{y}}{\mathrm{d}x}=\boldsymbol{Ay} \]

其中

\[ \boldsymbol{A}=\left[ \begin{array}{ccc} 0 &1 &1 \\ 1 &0 &1 \\ 1 & 1 &0 \end{array} \right] \]

解法

\(\boldsymbol{y}=(y_{1},y_{2},y_{3})^{T}\),则该方程组可以写成

\[ \left\{ \begin{array}{l} \dot{y_{1}}(x)=y_{2}+y_{3} \\ \dot{y_{2}}(x)=y_{1}+y_{3} \\ \dot{y_{3}}(x)=y_{1}+y_{2} \end{array} \right. \]

由此得到

\[ \frac{\mathrm{d}(y_{1}+y_{2}+y_{3})}{\mathrm{d}x}=2(y_{1}+y_{2}+y_{3}) \]

于是

\[ (y_{1}+y_{2}+y_{3})=c \mathrm{e}^{2x} \]

将上式代入方程组得

\[ \left\{ \begin{array}{l} \dot{y_{1}}(x)=c\mathrm{e}^{2x}-y_{1} \\ \dot{y_{2}}(x)=c\mathrm{e}^{2x}-y_{2} \\ \dot{y_{3}}(x)=c\mathrm{e}^{2x}-y_{3} \end{array} \right. \]

这是三个一阶线性微分方程。由此得到

\[ \begin{array}{l} y_{1}=\frac{1}{3}c\mathrm{e}^{2x}+c_{1}\mathrm{e}^{-x}\\ y_{2}=\frac{1}{3}c\mathrm{e}^{2x}+c_{2}\mathrm{e}^{-x}\\ y_{3}=\frac{1}{3}c\mathrm{e}^{2x}+c_{3}\mathrm{e}^{-x} \end{array} \]

又由于\((y_{1}+y_{2}+y_{3})=c\mathrm{e}^{2x}\),则\(c_{3}=-(c_{1}+c_{2})\),因此通解为

\[ \begin{array}{l} y_{1}=\frac{1}{3}c\mathrm{e}^{2x}+c_{1}\mathrm{e}^{-x}\\ y_{2}=\frac{1}{3}c\mathrm{e}^{2x}+c_{2}\mathrm{e}^{-x}\\ y_{3}=\frac{1}{3}c\mathrm{e}^{2x}-(c_{1}+c_{2})\mathrm{e}^{-x} \end{array} \]

常系数非齐次微分方程组

对于常系数非齐次微分方程组

\[ \frac{\mathrm{d}\boldsymbol{x}}{\mathrm{d}t}=\boldsymbol{Ax}+\boldsymbol{f}(t) \]

我们可以先求出特解,并求出其齐次的通解后将两者相加。 当然对于特解我们有更加方便的解法

定理

\(\boldsymbol{X}(t)\) 是常系数线性齐次微分方程组满足 \(\boldsymbol{X}(0)=\boldsymbol{E}\)的基解矩阵,则常系数线性非齐次微分方程组的通解可表示为

\[ \boldsymbol{x}(t)=\boldsymbol{X}(t)\boldsymbol{C}+\int_{t_{0}}^{t} \boldsymbol{X}(t-\tau)\boldsymbol{f}(\tau)\mathrm{d}\tau \]

而对于满足初值条件\(\boldsymbol{x}(t_{0})=\boldsymbol{x}_{0}\)的特解可表示为

\[ \boldsymbol{x}(t)=\boldsymbol{X}(t-t_{0})\boldsymbol{x}_{0}+\int_{t_{0}}^{t} \boldsymbol{X}(t-\tau)\boldsymbol{f}(\tau)\mathrm{d}\tau \]

对于该定理的证明,编者会在下一节提及。可以认为此定理的一个必要条件为对于满足\(\boldsymbol{X}(0)=\boldsymbol{E}\)的常系数线性齐次微分方程组的基解矩阵,\(\boldsymbol{X}^{-1}(t_{1})=\boldsymbol{X}(-t_{1}),\ \boldsymbol{X}(t_{1})+\boldsymbol{X}(t_{2})=\boldsymbol{X}(t_{1}+t_{2})\)

例题:求解非齐次微分方程组

求解如下非齐次微分方程组

\[ \left\{ \begin{array}{l} \dot{y}(x)=z+2\mathrm{e}^{x} \\ \dot{z}(x)=y+\mathrm{e}^{x} \end{array} \right. \]

解法

首先整理得

\[ \left[ \begin{array}{c} \dot{y}(x) \\ \dot{z}(x) \end{array} \right] = \left[ \begin{array}{cc} 0 &1 \\1 & 0 \end{array} \right] \left[ \begin{array}{c} y \\ z \end{array} \right] + \left[ \begin{array}{c} 2\mathrm{e}^{x} \\ \mathrm{e}^{x} \end{array} \right] \]

不妨令\(\boldsymbol{m}(x)=(y\ z)^{T}\),求出其一个基解矩阵为

\[ \boldsymbol{M}_{1}(x)=\left[ \begin{array}{cc} \mathrm{e}^{x} &\mathrm{e}^{-x} \\ \mathrm{e}^{x} & -\mathrm{e}^{-x} \end{array} \right] \]

为了使用上述定理,选取基解矩阵

\[ \boldsymbol{M}(x)=\boldsymbol{M}_{1}(x)\boldsymbol{M}_{1}^{-1}(0)=\left[ \begin{array}{cc} \frac{1}{2}\mathrm{e}^{x}+\frac{1}{2}\mathrm{e}^{-x} & \frac{1}{2}\mathrm{e}^{x}-\frac{1}{2}\mathrm{e}^{-x}\\ \frac{1}{2}\mathrm{e}^{x}-\frac{1}{2}\mathrm{e}^{-x} & \frac{1}{2}\mathrm{e}^{x}+\frac{1}{2}\mathrm{e}^{-x} \end{array} \right] \]

这样可以保证\(\boldsymbol{M}(0)=\boldsymbol{E}\)。将\(\boldsymbol{M}(x)\)代入方程,得到

\[ \boldsymbol{m}(x)=\left[ \begin{array}{cc} \frac{1}{2}\mathrm{e}^{x}+\frac{1}{2}\mathrm{e}^{-x} & \frac{1}{2}\mathrm{e}^{x}-\frac{1}{2}\mathrm{e}^{-x}\\ \frac{1}{2}\mathrm{e}^{x}-\frac{1}{2}\mathrm{e}^{-x} & \frac{1}{2}\mathrm{e}^{x}+\frac{1}{2}\mathrm{e}^{-x} \end{array} \right] \boldsymbol{C} + \left[ \begin{array}{c} \frac{3}{2}x\mathrm{e}^{x}+\frac{1}{4}\mathrm{e}^{x} \\ \frac{3}{2}x\mathrm{e}^{x}-\frac{1}{4}\mathrm{e}^{x} \end{array} \right] \]

Jordan标准形与常系数线性微分方程组

相信大家可能对教材上当 \(\boldsymbol{A}\) 没有 \(n\) 个特征向量时为什么要构造解的那种形式。这其实和线性代数中的 Jordan 标准型有关。

前置知识:Jordan 标准形

Jordan 块

定义:Jordan 块

如果一个矩阵主对角线全为 \(\lambda\),副对角线全为 1,其他地方都是 0,我们称这样的矩阵为一个 Jordan 块。

注意一个 Jordan 块主对角线上元素是相同的,而且可以是 0。例如:

\[ \boldsymbol{J} = \begin{bmatrix} 2 & 1 & &\\ &2&1&\\ &&2&1\\ &&&2 \end{bmatrix} \]

这是一个 \(\lambda = 2\) 的四阶 Jordan 块。

Jordan 标准形

定义:Jordan 标准形

Jordan 块组成的对角阵 \(\boldsymbol{J} = \operatorname{diag}(\boldsymbol{J_1}, \boldsymbol{J_2}, \dots, \boldsymbol{J_m})\) 为一个 Jordan 标准形。

我们有如下定理:

定理:Jordan 标准化

对于任何一个方阵 \(\boldsymbol{A}\),总存在可逆阵 \(\boldsymbol{P}\) 使得 \(\boldsymbol{A} = \boldsymbol{PJP}^{-1}\)

这个证明比较复杂,主要对比对角化解释 \(\boldsymbol{J}, \boldsymbol{P}\) 的含义:

  • \(\boldsymbol{J}\) 的主对角线是 \(\boldsymbol{A}\) 的特征值,根据代数重数重复,这一点和对角化相同。

  • \(\boldsymbol{P}\) 的列向量被称为“广义特征向量”。当特征值的几何重数 \(m\) 小于代数重数 \(c\) 时,无法对角化是因为 \((\lambda \boldsymbol{E} - \boldsymbol{A}) x = 0\) 的解空间没有那么多的基。但是,广义特征向量被定义为 \((\lambda \boldsymbol{E} - \boldsymbol{A})^c x = 0\) 的解空间的基。可以证明,这样的基总有 \(c\) 个。因此,总是能找到广义特征向量,也就总是能找到 \(\boldsymbol{P}\)

  • \(\boldsymbol{J}\) 由不同的 Jordan 块构成。显然,不同的特征值对应不同的块,但是相同的特征值也可能在不同的块内。一般地,\(\lambda_i\) 对应的块的数量是 \(\lambda_i\) 的几何重数,而 \(\lambda_i\) 对应 Jordan 块中阶数恰为 \(k\) 的块的数量为:

    \[ \text{rank }(\lambda_i \boldsymbol{E} - \boldsymbol{A})^{k-1} + \text{rank }(\lambda_i \boldsymbol{E} - \boldsymbol{A})^{k+1} - 2 \text{ rank }(\lambda_i \boldsymbol{E} - \boldsymbol{A})^{k} \]

常系数一阶线性微分方程组

在线性常微分方程组中,常系数的方程组可以使用代数方法解出,这里给出一种一般方法,它是借助线性代数里的 Jordan 标准形以及矩阵相似理论给出的一种解法。以下总假设所讨论的方程组的形式为:

\[ \boldsymbol{y}'(x) = \boldsymbol{A} \boldsymbol{y}, \quad \boldsymbol{y}(0) = \boldsymbol{y_0} \]

其中, \(\boldsymbol{A} \in \mathbb{R}^{n \times n}\)

矩阵指数

说明

也许有人难以理解为何会有 \(n\) 个线性无关的解。我们将方程组展开,每一个微分方程都有一个独立常数 \(C_i\)。则所有的解构成一个与 \(\mathbb{R}^n\) 同构的 \(n\) 维空间。

借助矩阵指数的概念,方程组的基解矩阵可以写作:

\[ \exp \boldsymbol{A} x = \sum_{n=0}^\infty \frac{\boldsymbol{A}^n}{n!}x^n \]

规定 \(\boldsymbol{A}^0 = \boldsymbol{E}\)。上述矩阵函数项级数的收敛性按照矩阵范数的概念进行定义(全实数集上收敛),求导法则和一般一元实函数级数的求导无异。

\(\exp \boldsymbol{A} x\) 是一个解矩阵,这是因为:

\[ (\exp \boldsymbol{A} x)' = \boldsymbol{A} \sum_{n=1}^\infty \frac{\boldsymbol{A}^{n-1}}{(n-1)!}x^{n-1} = \boldsymbol{A} \exp \boldsymbol{A} x \]

同时还是基解矩阵,因为在 \(x = 0\) 处, \(\det \exp (\boldsymbol{A} 0) = \det \boldsymbol{E} = 1 \neq 0\)。从而在 \(\mathbb{R}\)\(\det \exp \boldsymbol{A} x \neq 0\)

因此,我们得到了级数表示下的方程组的解,但在实际应用中,我们需要将其具体形式解出,因此还需要借助其他工具。

当然对于矩阵指数函数,还有一些其他的性质。

定理

  1. \(n\) 阶实矩阵 \(\boldsymbol{A}\)\(\boldsymbol{B}\) 可交换,即 \(\boldsymbol{AB} = \boldsymbol{BA}\),则 \[ \exp (\boldsymbol{A} + \boldsymbol{B}) = \exp \boldsymbol{A} \cdot \exp \boldsymbol{B} \]

  2. 对于任意的 \(n\) 维矩阵 \(\boldsymbol{A}\)\(\exp \boldsymbol{A}\) 可逆,且 \[ (\exp \boldsymbol{A})^{-1} = \exp (-\boldsymbol{A}) \]

  3. \(n\) 维矩阵 \(\boldsymbol{A}, \boldsymbol{P}\)\(\boldsymbol{P}\) 可逆,则 \[ \exp (\boldsymbol{P} \boldsymbol{A} \boldsymbol{P}^{-1}) = \boldsymbol{P} \exp \boldsymbol{A} \boldsymbol{P}^{-1} \]

说明

通过这些性质,我们很容易就能理解定理为何成立了。因为当 \(\boldsymbol{x}(0) = \boldsymbol{E}\) 时,\(\boldsymbol{x}\) 就是矩阵指数函数,所以满足上述性质。

可对角化的情形

\(\boldsymbol{A}\) 可对角化,即 \(\boldsymbol{A}\)\(\mathbb{C}\) 上的特征值 \(\lambda_i, i = 1,2,\dots,n\) 都是相异的,那么由线性代数的知识,存在可逆矩阵 \(\boldsymbol{P}\) 使得 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P} = \boldsymbol{D}\) 为对角矩阵,而对于对角矩阵来说,有:

\[ \exp \boldsymbol{D} x = \begin{pmatrix} \text{e}^{\lambda_1 x} & \\ & \text{e}^{\lambda_2 x} \\ && \ddots \\ &&& \text{e}^{\lambda_n x} \end{pmatrix} \]

而可逆矩阵 \(\boldsymbol{P}\) 的第 \(i\) 列形成的列向量就是特征值 \(\lambda_i\) 所对应的特征向量 \(\boldsymbol{v}_i, i = 1,2,\dots,n\)。因此再由矩阵指数的性质:

\[ \exp (\boldsymbol{P} \boldsymbol{D} \boldsymbol{P}^{-1}) = \boldsymbol{P} (\exp \boldsymbol{D}) \boldsymbol{P}^{-1} \]

有:

\[ \exp \boldsymbol{A} x = \boldsymbol{P} (\exp \boldsymbol{D} x) \boldsymbol{P}^{-1} \]

上式就是基解矩阵的确定式,实际上由于 \(\boldsymbol{P}\) 可逆,基解矩阵有性质:它乘上任意可逆矩阵依然是基解矩阵(秩始终是 \(n\))。因此:

\[ (\exp \boldsymbol{A}x) \boldsymbol{P} = \boldsymbol{P} \exp \boldsymbol{D}x \]

也是一个基解矩阵,将它写成列向量(特征向量)分块的形式,就是:

\[ (\text{e}^{\lambda_1x} \boldsymbol{v}_1, \text{e}^{\lambda_2x} \boldsymbol{v}_2, \dots, \text{e}^{\lambda_nx} \boldsymbol{v}_n) \]

这样就避免了求逆的麻烦。

但是上式不一定是实矩阵,当特征根出现复数时,用 \(\exp \boldsymbol{A}x = \boldsymbol{P} (\exp \boldsymbol{D}x) \boldsymbol{P}^{-1}\) 作为基解矩阵更好。

化 Jordan 标准形

对于有重根的情形,确定矩阵 \(\exp \boldsymbol{A} x\) 的具体形式的方法有很多,这里介绍 Jordan 标准形法,其特点是通法清晰,操作机械。

我们由矩阵相似的相关理论可以知道在 \(\mathbb{C}\) 上,实矩阵 \(\boldsymbol{A}\) 一定有 Jordan 标准形:

\[ \boldsymbol{J} = \begin{pmatrix} \boldsymbol{J}_1 \\ &\boldsymbol{J}_2 \\ &&\ddots \\ &&&\boldsymbol{J}_s \\ \end{pmatrix} \]

其中,

\[ \boldsymbol{J}_i = \begin{pmatrix} \lambda_i & 1 \\ & \lambda_i & 1 \\ & & \lambda_i & \ddots \\ & & & \ddots & 1 \\ & & & & \lambda_i \end{pmatrix} \in \mathbb{C}^{t_i \times t_i}, i = 1,2,\dots,s \]

\(\sum_{i=1}^s t_i = n\). 并存在矩阵 \(\boldsymbol{P}\) 使得 \(\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P} = \boldsymbol{J}\) ,于是

\[ \exp \boldsymbol{J}x = \boldsymbol{P} \begin{pmatrix} \exp \boldsymbol{J}_1x \\ & \exp \boldsymbol{J}_2x \\ && \ddots \\ &&& \exp \boldsymbol{J}_sx \end{pmatrix} \boldsymbol{P}^{-1} \]

其中,

\[ \exp \boldsymbol{J_i}x = \begin{pmatrix} 1 \\ x & 1 \\ \dfrac{x^2}{2!} & x & 1 \\ \vdots & \ddots & \ddots & \ddots \\ \dfrac{x^{(t_i-1)}}{(t_i-1)!} & \cdots & \dfrac{x^2}{2!} & x & 1 \end{pmatrix} \text{e}^{\lambda_ix} \]

于是, \(\exp \boldsymbol{A}x = \boldsymbol{P} (\exp \boldsymbol{J}x) \boldsymbol{P}^{-1}\). 就是基解矩阵,在 \(\lambda_i\) 均为实数时,可直接计算 \(\boldsymbol{P} \exp \boldsymbol{J}x\).

例题

求线性微分方程组的通解:

\[ \frac{\mathrm{d}\boldsymbol{x}}{\mathrm{d}t} = \boldsymbol{A}\boldsymbol{x}, \]

其中

\[ \boldsymbol{A} = \begin{pmatrix} 2 & -2 & 3 \\ 10 & -4 & 5 \\ 5 & -4 & 6 \end{pmatrix} \]

解答:

首先求矩阵特征值, 解方程 \(\det(\boldsymbol{I}-\lambda\boldsymbol{A})=0\), 得到

\[ \lambda_1 = 2, \quad \lambda_{2,3} = 1 \]

验证矩阵的秩, 容易得到 \(\boldsymbol{A}\) 的 Jordan 标准形为

\[ \boldsymbol{J} = \boldsymbol{T^{-1}AT} = \begin{pmatrix} 2 & & \\ & 1 & 1 \\ & & 1 \end{pmatrix} \]

其中

\[ \boldsymbol{T} = \begin{pmatrix} 4 & 2 & 1 \\ 15 & 10 & 1 \\ 10 & 6 & 1 \end{pmatrix} \]

做线性变换 \(\boldsymbol{x} = \boldsymbol{T} \boldsymbol{x}^{*}\), 解对应的方程组, 得到通解为

\[ \boldsymbol{x}^{*} = \begin{pmatrix} C_1 \mathrm{e}^{2t} \\ C_2 \mathrm{e}^{t} + C_3 t \mathrm{e}^{t} \\ C_3 \mathrm{e}^{t} \end{pmatrix} \]

从而

\[ \boldsymbol{x} = \boldsymbol{T} \boldsymbol{x}^{*} = \begin{pmatrix} 4C_1 \mathrm{e}^{2t} + (2C_2 + 2C_3 t + C_3) \mathrm{e}^{t} \\ 15C_1 \mathrm{e}^{2t} + (10C_2 + 10C_3 t + C_3) \mathrm{e}^{t} \\ 10C_1 \mathrm{e}^{2t} + (6C_2 + 6C_3 t + C_3) \mathrm{e}^{t} \end{pmatrix} \]