14-1. 状態観測器(演習)
可制御、可観測の双対性
可制御性と可観測性の双対性とは、これらの2つの性質が密接な関係を持っていることを意味し、システムの可制御性に関する問題を、対応する「双対」システムにおける可観測性の問題に置き換えて考えることができるということを意味する。双対システムは、次のように定義される。
・元のシステムの行列\(A\)に対して、双対システムのシステム行列は\(A^{T}\)。
・元のシステムの入力行列\(b\)に対して、双対システムの入力行列は\(c^{T}\)。
・元のシステムの出力行列\(c\)に対して、双対システムの出力行列は\(b^{T}\)。
これにより、可制御性に関する解析を行う代わりに、双対システムの可観測性を調べることができ、逆も同様である。
これを活用すると、以下の双対性と呼ぶ対応関係がいえる。
* \((A,b)\)が可制御であれば、\((A-bf)\)の極が任意に配置できる。(状態フィードバックの極配置)
* \((c,A)\)が可観測であれば、\((A-gc)\)の極が任意に配置できる。(状態観測器の極配置)
システムを以下とすると、$$x(k+1) = A x(k) + b u(k) , \;\;\;\; x(0)=x_0 \\y(k) = c x(k)$$この双対システムは、$$\xi (k+1) = A^{T} \xi(k) + c^{T} u(k), \;\;\;\; \xi(0) = \xi_0 \\ y(k) = b^{T} \xi(k)$$と定義できる。
状態観測器のゲイン
(1)システムが可観測正準形であれば、$$A - gc =\begin{bmatrix} 0 & \cdots & 0 & -a_n - g_1 \\1 & & & -a_{n-1} - g_2 \\ & \ddots & & \vdots \\ & & 1 & -a_1 - g_n \end{bmatrix}$$ となり、状態観測器の特性方程式は、$$\phi(z) = |z I - (A - gc)| = z^n + (a_1 + g_n)z^{n-1} + \cdots + a_n + g_1 = 0$$となる。指定したい極を\(\lambda_1 , \lambda_2, \cdots , \lambda_n\)とすると、特性方程式は、$$\phi(z) = (z - \lambda_1)(z - \lambda_2)\cdots (z - \lambda_n) = z^n + \alpha_1 z^{n-1} + \cdots + \alpha_n = 0$$でなければならないので、2つの特性方程式の係数を比較して、状態観測器のゲイン\(g\)は、$$g_i = \alpha_{n-i+1} - a_{n-i+1} ,\;\;\;\; (i=1,2, \cdots, n)$$と決定できる。
(2)\((c,A)\)が可観測正準形で与えられていない場合は、\((A^{T},c)\)も可制御正準形ではない。双対システムを考えると、その特性方程式は、$$D(z)=|zI -A^{T}|=z^n + a_1 z^{n-1} + a_2 z^{n-2} + \cdots + a_n =0$$と書け、$$|z I -(A^{T} - c^{T} g)| = |zI -(A - g^{T} c)| = (z - \lambda_1)(z - \lambda_2)\cdots (z - \lambda_n) = z^n + \alpha_1 z^{n-1} + \cdots + \alpha_n = 0$$とおくと、\((A - g^{T} c)\)の極を、指定した\(\lambda_1 , \lambda_2, \cdots , \lambda_n\)に配置するゲイン\(g\)は、$$g = V^{-1} S^{-1} (\alpha -a)$$と決定できる。ただし、$$a = \begin{bmatrix} a_n, a_{n-1}, \cdots , a_1 \end{bmatrix} \\ \alpha = \begin{bmatrix} \alpha_n, \alpha_{n-1}, \cdots , \alpha_1 \end{bmatrix} \\ V = \begin{bmatrix} c \\ A^{T} c \\ \vdots \\ (A^T)^{n-1} c \end{bmatrix} \\ S = \begin{bmatrix} a_{n-1} & a_{n-2} & \cdots & a_1 & 1 \\ a_{n-2} & a_{n-3} &\cdots & 1 & 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots \\ a_1 & 1 & 0 & \cdots & \vdots \\1 & 0 & \cdots & & 0 \end{bmatrix}$$ である。
デッドビート状態観測器
離散時間システムを$$x(k+1) = \begin{bmatrix} 0 & 1 \\ -1 & 1 \end{bmatrix} x(k) + \begin{bmatrix} 0 \\1 \end{bmatrix} u(k) \\ y(k) =\begin{bmatrix} 1 & 1 \end{bmatrix}x(k)$$とするとき、このシステムに対する状態観測器を構成する。観測器の極を\(\lambda_1 = 0 , \;\;\; \lambda_2 = 0 \)として、観測器のゲインを求める。(デッドビート観測器となる)
状態観測器は、$$\hat{x}(k+1) = \begin{bmatrix} 0 & 1 \\ -1 & 1 \end{bmatrix} \hat{x}(k) + \begin{bmatrix} 0 \\1 \end{bmatrix} u(k) + \begin{bmatrix} g_1 \\ g_2 \end{bmatrix} \left\{y(k) - \begin{bmatrix} 1 & 1 \end{bmatrix}\hat{x}(k)\right\})$$ なので、特性方程式は、$$|zI - (A - gc)| = \begin{vmatrix} z + g_1 & g_1 -1 \\ g_2 +1 & z + g_2 -1 \end{vmatrix} = z^2 +(g_1 + g_2 -1)z -2 g_1 +g_2 +1 = 0$$ 観測器の極を\(\lambda_1 = 0 , \;\;\; \lambda_2 = 0 \)とするので、特性方程式は、\(z^2 = 0\)とならなければならない。従って、$$g_1 + g_2 -1 = 0 \\ -2g_1 + g_2 +1 = 0$$である。よって、$$g_1 = \frac{2}{3} ,\;\;\;\; g_2 = \frac{1}{3}$$となる。