前回MTシステムについての記事を書いたのですが、その詳細としてタグチのT法についてピックアップして書きたいと思います。

T法のイメージ

T法の理論的な部分についていきなり説明を行うと、理解しづらいと思うので簡単な図を混ぜながら説明したいと思います。 田口博士は2005年に学会誌のQ&A内で『はかりでいろいろな質量を総合するのと同じである』と述べているので、それに倣って以下に示します。

具体的なストーリーの方がわかりやすいと思うので、ストーリー仕立てで進めていこうと思います!

設定

まず、ある男性(Aさん)の体重を測りたいとします。そして、Aさんの真の体重がYキロだとします。

真の体重:Y
計測結果:x
秤の特性:\beta


次に、体重を測定するための秤がp個あるとします。   また、秤の特性を\betaとし、秤の精度が一致しておらず、少しずつ異なっているものとします。


これらの秤を使って、Aさんを測定します。すると、それぞれの秤から測定結果がそれぞれ得られます。
要するに、体重の測定結果がp個出てきます。

予測量の計算

Aさんはp回測定したは良いものの、測定結果がp個あっても困ります。また、秤の精度が同一でないため、p個の結果にもバラツキが生じています。そこで、Aさんはp個の結果を1つに統合します。
そして、統合する際に全ての平均を取っても良い問題ないです。しかし、高精度の秤を重要視し、低精度の秤を軽んじて評価することで、より良い予測をすることができます。
秤の精度を\etaとして、加重平均を求めAさんの体重の推定値\hat{Y}を求めます。


以上がT法の簡単なイメージとストーリーでした。

重回帰分析との相違点

上で行っていた体重の測定において、Aさんの秤1での測定結果をx_{A1}のように表記し、実際の体重をy_{A}と表記し、表にすると以下のようになります。

 人   秤1   秤2   \cdots   秤p   体重 
Aさん x_{A1} x_{A2} \cdots x_{Ap} y_A


これはAさん1人だけですが、Aさん以外にも多くの人が存在した場合、人を全て1~nで表記すると次の表のようになります。

    \bf{x_1}   \bf{x_2}   \cdots   \bf{x_p}   \bf{y} 
1 x_{11} x_{12} \cdots x_{1p} y_1
2 x_{21} x_{22} \cdots x_{2p} y_2
\vdots \vdots \vdots \vdots \vdots \vdots
n x_{n1} x_{n2} \cdots x_{np} y_n


この表を見ると、多変量解析を学ばれた方ならわかると思うのですが、重回帰分析で用いるデータと同じ形になっています。
要するに、T法と重回帰でのデータタイプは同じになります!
反対に、T法と重回帰分析における相違点は下記の点が挙げられます。

  • サンプルサイズ<項目数 でも機能
  • データの背景


1点目については別の記事でも触れたので軽めに説明しますが、サンプルサイズが項目(説明変数)数よりも小さいとき,重回帰分析では解が求まりません。しかし、T法では先に示したように秤で計測を行っているだけなので、サンプルサイズが小さくても問題ないです。
2点目は、データの背景についてです。重回帰分析では説明変数から目的変数が発生していると仮定しています。しかし、T法では出力(目的変数)から項目(説明変数)が発生していると考えています。ここについては、また以下に詳しく説明します。

T法の計算手順

まず、T法では単位空間という一風変わった考え方を用いるため、上記にも示しましたが、単位空間について最初におさらいがてら示します。

単位空間とは、集団において正常な集団のことです。また、単位空間のデータはばらつきがほとんどなくなるという仮定を置いています。T法においては、出力が中位にあるものを単位空間と仮定していて、単位空間のデータは1つでも構いません。

では、T法の計算手順について示していきたいと思います。

1.単位空間の平均計算

単位空間のデータが下記の様になっているとします。

   項目1   項目2   \cdots   項目p   出力 
1 x_{11} x_{12} \cdots x_{1p} y_1
2 x_{21} x_{22} \cdots x_{2p} y_2
\vdots \vdots \vdots \vdots \vdots \vdots
a x_{a1} x_{a2} \cdots x_{ap} y_a
平均値 \bar{x_{a1}} \bar{x_{a2}} \cdots \bar{x_{ap}} \bar{y_a}


表における列ごとの平均値を計算します。

\bar{x_j} = \frac{1}{a}(x_{1j}+x_{2j}+\cdots +x_{nj} ) ~~~ (j=1,2,\cdots,p) \\ \bar{y}=\frac{1}{a}(y_1+y_2+\cdots+y_a)


2.信号データの基準化

信号データとは、データにおいて単位空間以外のデータのことです。


信号データが下記の様になっているとします。

   項目1   項目2   \cdots   項目p   出力 
1 x'_{11} x'_{12} \cdots x'_{1p} y'_1
2 x'_{21} x'_{22} \cdots x'_{2p} y'_2
\vdots \vdots \vdots \vdots \vdots \vdots
l x'_{l1} x'_{l2} \cdots x'_{lp} y'_l


これらの信号データを先ほど求めた単位空間の列ごとの平均値で基準化します。

X_{ij} = x_{ij}-\bar{x_j} ~~~ ( i=1,2,\cdots,l , j=1,2,\cdots,p ) \\Y_i = y'_i - \bar{y} ~~~ ( i=1,2,\cdots,l )

一般的な標準化では、 \frac{x_{ij}-\bar{x}_j}{\sigma^2}のように計算されます。しかし、単位空間は正常なデータであり、正常データはバラツキがないと仮定しているため、分母が0になってしまうことが考えられます。そこで、標準化ではなく平均を引くだけの基準化を行っています。


そして、基準化された信号データは次のようになります。

   項目1   項目2   \cdots   項目p   出力 
1 X_{11} X_{12} \cdots X_{1p} Y_1
2 X_{21} X_{22} \cdots X_{2p} Y_2
\vdots \vdots \vdots \vdots \vdots \vdots
l X_{l1} X_{l2} \cdots X_{lp} Y_l

3.比例定数とSN比の算出

T法は項目ごとに単回帰を行い、それらを組み合わせた様な手法です。ゆえにまず、項目ごとに単回帰を行います。特徴的な点は、通常の単回帰はxからyにデータが発生していると考えますが、T法では yからxにデータが発生していると考えていることです。

求めたい式は以下の2つです。

比例定数~~ {\beta_j}= \frac{ \sum_{i=1}^{l}Y_iX_{ij}}{r}\\ SN比~~\eta_j=\begin{cases}\frac{\frac{1}{r}(S_{\beta j}-V_{ej})}{V_{ej}}&(if~ S_{\beta j} > V_{ej} ) \\0 & ( if~ S_{\beta j} \leq V_{ej} )\end{cases}

上記の式に出てくる変数は以下のように求めます。

有効除数~~r= \sum_{i=1}^{l}Y_i^2 \\ 全変動~~S_{Tj}= \sum_{i=1}^{l}X_{ij}^2 \\ 比例項の変動~~ S_{\beta j} = \frac{ \sum_{i=1}^{l}(Y_iX_{ij})^2}{r} \\ 誤差変動~~S_{ej} =S_{Tj} - S_{\beta j} \\ 誤差分散~~V_{ej} = \frac{S_{ej}}{l-1}

比例定数の導出は一見何をしているのかわかりにくいですが、単回帰における比例定数の式と比較すると意味が分かりやすいと思います。
T法 ~~ \hat{\beta}_j = (Y^TY)^{-1}Y^TX_j~~~~~~単回帰~~ \hat{\beta}_1 = (X^TX)^{-1} X^TY

4.総合推定値の算出

基準化された信号データX_{ij}と項目jにおける比例定数 \beta_{j}の関係は以下の式で表せます。

\hat{Y_{ij}}=\frac{X_{ij}}{\beta_j}


しかし,項目がp個あるので、\hat{Y}_i\hat{Y}_{i1} , \hat{Y} _{i2} ,\cdots, \hat{Y} _{ip} p個の予測量が得られます。

得られた\hat{Y_{ij}}\eta_{j}で重みづけし、総合推定値を算出します。そのイメージが以下です。

式で表すとこのようになります。
\hat{Y}_i = \frac{ \sum_{j=1}^{p}\eta_j\cdot\frac{X_{ij}}{\beta_j} }{\sum_{k=1}^{p}\eta_k}=\frac{\sum_{j=1}^{p}\eta_j \cdot \hat{Y} _{ij}}{\sum_{k=1}^{p}\eta_k}

5.基準化前総合推定値の算出

T法の計算手順において、信号データを単位空間によって基準化をしているため、最後に総合推定値に単位空間の平均を足すことで、基準化前総合推定値に戻す必要があります。
\hat{y}_i' = \hat{Y}_i + \bar{y}
以上のようにして、T法では予測を行っていきます。

まとめ

今回はT法の理論的な内容についてまとめました。
皆様の理解の一助になれば幸いです。

参考文献

田口玄一(2005):目的機能と基本機能(6),品質工学,13(3),pp.5-10.
立林和夫・長谷川良子・手島昌一(2008):『 入門MTシステム 』,日科技連出版社.