8. 状態変数の座標変換
現代制御理論において、状態変数の座標変換は状態空間表現を用いた制御系の設計において重要な役割を果たす。状態変数の座標変換によって、制御システムの表現方法を変更することができ、これにより、制御システムの解析や設計が簡単になる。
対象となる状態方程式と出力方程式は、$$\boldsymbol{\dot{x}}(t) = \boldsymbol{Ax}(t) + \boldsymbol{Bu}(t), \;\;\;\; \boldsymbol{y}(t) = \boldsymbol{Cx}(t) \cdots\cdots (1)$$とする。
状態変数変換
状態方程式で与えられたシステムにおいて、ある正則行列(行列式が零でない行列)を使って、状態変数の座標の変換を行う。正則行列\(\boldsymbol{T} (n \times n)\)によって、$$\boldsymbol{x}(t) = \boldsymbol{Tz}(t) \;\;\;\; \{ \boldsymbol{z}(t) = \boldsymbol{T}^{-1} \boldsymbol{x}(t) \}$$とおく。\(\boldsymbol{z}(t)\)は新しい状態変数ベクトルである。これを、式(\(1\))に代入すると、$$\boldsymbol{T\dot{z}}(t) = \boldsymbol{ATz}(t) + \boldsymbol{Bu}(t) \;\;\;\; \boldsymbol{y}(t) = \boldsymbol{CTz}(t)$$となる。この式に左から\(\boldsymbol{T}^{-1}\)をかけると$$\boldsymbol{\dot{z}}(t) = \boldsymbol{\tilde{A}}\boldsymbol{z}(t) + \boldsymbol{\tilde{B}}\boldsymbol{u}(t) \;\;\;\; \boldsymbol{y}(t) = \boldsymbol{\tilde{C}}\boldsymbol{z}(t) \cdots \cdots (2)$$となる。ここで、$$\boldsymbol{\tilde{A}} = \boldsymbol{T}^{-1}\boldsymbol{AT} , \;\;\; \boldsymbol{\tilde{B}} = \boldsymbol{T}^{-1} \boldsymbol{B} , \;\;\; \boldsymbol{\tilde{C}} = \boldsymbol{CT}$$である。これを状態変数変換(座標変換)と呼ぶ。\(\boldsymbol{T}\)を状態変換行列という。
このように状態変数変換したシステム 式(\(2\))と変換前のシステム式(\(1\))は以下の点で等価である。
1)システムの極が不変(同じ極となる)。
$$|s\boldsymbol{I} - \boldsymbol{\tilde{A}}| = |\boldsymbol{T}^{-1}(s\boldsymbol{I} - \boldsymbol{A})\boldsymbol{T}| = |\boldsymbol{T}^{-1}||\boldsymbol{T}||s\boldsymbol{I} - \boldsymbol{A}| = |s\boldsymbol{I} - \boldsymbol{A}|$$ このように特性方程式は同じになるため、極は不変である。
2)伝達関数行列が不変。
$$\boldsymbol{\tilde{C}}(s\boldsymbol{I} - \boldsymbol{\tilde{A}})^{-1} \boldsymbol{\tilde{B}} = \boldsymbol{CT}\{\boldsymbol{T}^{-1} (s \boldsymbol{I} - \boldsymbol{A})\boldsymbol{T}\}^{-1}\boldsymbol{T}^{-1} \boldsymbol{B} = \boldsymbol{C}(s\boldsymbol{I} -\boldsymbol{A})^{-1} \boldsymbol{B}$$このように伝達関数行列が同じとなる。これは同時に極が不変であることも示している。
3)可制御性、可観測性が不変。(可制御、可観測は別で説明する。)
4)不変零点が不変。(不変零点に関しては、専門性が高いので、こちらを参考にしてください。)
座標変換について
\(\boldsymbol{x}(t) = \boldsymbol{Tz}(t) \)において、\(\boldsymbol{T} = [\boldsymbol{t_1 , t_2 , \cdots ,t_n}]\)とすると、$$\boldsymbol{x} = \boldsymbol{t}_1z_1 + \boldsymbol{t}_2z_2 + \cdots + \boldsymbol{t}_n z_n$$とおけるので、\(\boldsymbol{t}_i\)は新しい座標軸になる。\(\boldsymbol{z}_i\)は\(\boldsymbol{x}\)の\(\boldsymbol{t}_i\)方向への座標となる。
例えば、$$\boldsymbol{T} = \begin{bmatrix} t_{11} & t_{12} \\ t_{21} & t_{22} \end{bmatrix}$$とすると、$$ \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = \boldsymbol{Tz} = \begin{bmatrix} t_{11} z_1 + t_{12} z_2 \\ t_{21} z_1 + t_{22} z_2 \end{bmatrix}$$ となる。
等価性の具体例として、システム行列を$$\boldsymbol{A} = \begin{bmatrix} -2 & 1 \\ 1 & -2 \end{bmatrix}$$を考える。この固有値は、\(\lambda_1 = -1 ,\;\;\; \lambda_2 = -3\)となる。$$\boldsymbol{T} = \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix}$$ とすると、$$\boldsymbol{\tilde{A}} = \boldsymbol{T}^{-1}\boldsymbol{AT} = \begin{bmatrix} -1 & 0 \\ 0 & -3 \end{bmatrix}$$が得られる。この固有値は、\(\lambda_1 = -1 ,\;\;\; \lambda_2 = -3\)となり、座標変換しても固有値が不変であることが分かる。