前回MTシステムについての記事を書いたのですが,その詳細としてタグチのT法についてピックアップして書きたいと思います.
[toc]
T法のイメージ
T法の理論的な部分についていきなり説明を行うと,理解しづらいと思うので簡単な図を混ぜながら説明したいと思います.
田口博士は2005年に学会誌のQ&A内で『はかりでいろいろな質量を総合するのと同じである』と述べているので,それに倣って以下に書いてみました.
具体的なストーリーの方がわかりやすいと思うので,ストーリー仕立てで進めていこうと思います!
まず,ある男性(Aさん)の体重を測りたいとします.そして,Aさんの真の体重がYキロだとします.
真の体重:Y
計測結果:x
秤の特性:\beta

Aさん(Y㎏)
次に,体重を測定するための秤がp個あるとします.
また,秤の特性を\betaとし,秤の精度が一致しておらず,少しずつ異なっているものとします.

秤(p個)
これらの秤を使って,Aさんを測定します.
すると,それぞれの秤から測定結果がそれぞれ得られます.
要するに,体重の測定結果がp個出てきます.

p回測定
Aさんはp回測定したは良いものの,測定結果がp個あっても困ります.また,秤の精度が同一でないため,p個の結果にもバラツキが生じています.なので,p個の結果を1つに統合したいと考えます.
そして,統合する際に全ての平均を取っても良いのですが,高精度の秤を重要視して,低精度の秤を軽んじて評価することで,より良い推定ができると田口博士は考えました.
秤の精度を\etaとして 加重平均を求めAさんの体重の推定値\hat{Y}を求めます.

測定結果の統合
以上がT法の簡単なイメージとストーリーでした.
重回帰分析との相違点
上で行っていた体重の測定において,Aさんの秤1での測定結果をx_{A1}のように表記し,実際の体重をy_{A}と表記し,表にすると以下のようになります.
人 | 秤1 | 秤2 | \cdots | 秤 p | 体重 |
A さん | x_{A1} | x_{A2} | \cdots | x_{Ap} | y_{A} |
これはAさん1人だけなのですが,Aさん以外にも多くの人が存在した場合,人を全て1~nで表記すると次の表のようになります.
x_1 | x_2 | \cdots | x_p | y | |
1 | x_{11} | x_{12} | \cdots | x_{1p} | y_{1} |
2 | x_{21} | x_{22} | \cdots | x_{2p} | y_{2} |
\vdots | \vdots | \vdots | \vdots | \vdots | \vdots |
n | x_{n1} | x_{n2} | \cdots | x_{np} | y_{n} |
この表を見ると,多変量解析を学ばれた方ならわかると思うのですが,重回帰分析で用いるデータと同じ形になっています.
要するに,T法と重回帰でのデータタイプは同じです!
では, T法 と重回帰分析は何が異なっているのかというと以下が挙げられます.
- サンプルサイズ<項目数 でも機能
- データの背景
1点目については別の記事でも触れたので軽めに説明しますが,サンプルサイズが項目(説明変数)数よりも小さいとき,重回帰分析では解が求まりません.しかし,T法では先に見せたように秤で計測を行っているだけなので,サンプルサイズが小さくても問題ないです
2点目は,データの背景についてです.重回帰分析では説明変数から目的変数が発生していると仮定しています.しかし,T法では出力(目的変数)から項目(説明変数)が発生していると考えています.ここについては,また以下に詳しく説明します.
T法の計算手順
まず,T法では単位空間という一風変わった考え方を用いるので,前にも書いたのですが,単位空間について最初におさらいがてら書いておきます.
単位空間とは,集団において正常な集団のことです.また,単位空間のデータはばらつきがほとんどなくなるという仮定を置いています.T法においては,出力が中位にあるものを単位空間と仮定していて,単位空間のデータは1つでも構いません.
では,T法の計算手順について書いていきたいと思います.
単位空間の平均計算
単位空間のデータが以下の様になっているとします.
項目1 | 項目2 | \cdots | 項目p | 出力 | |
1 | x_{11} | x_{12} | \cdots | x_{1p} | y_{1} |
2 | x_{21} | x_{22} | \cdots | x_{2p} | y_{2} |
\vdots | \vdots | \vdots | \vdots | \vdots | \vdots |
a | x_{a1} | x_{a2} | \cdots | x_{ap} | y_{a} |
平均値 | \bar{x_{1}} | \bar{x_{2}} | \cdots | \bar{x_{p}} | \bar{y} |
表における列ごとの平均値を計算します.
\bar{x_j} = \frac{1}{a}(x_{1j}+x_{2j}+\cdots +x_{nj} ) ~~~ (j=1,2,\cdots,p) \\ \bar{y}=\frac{1}{a}(y_1+y_2+\cdots+y_a)信号データの基準化
信号データとは,データにおいて単位空間以外のデータのことです.
信号データが以下の様になっているとします.
項目1 | 項目2 | \cdots | 項目p | 出力 | |
1 | x'_{11} | x'_{12} | \cdots | x'_{1p} | y'_{1} |
2 | x'_{21} | x'_{22} | \cdots | x'_{2p} | y'_{2} |
\vdots | \vdots | \vdots | \vdots | \vdots | \vdots |
l | x'_{l1} | x'_{l2} | \cdots | x'_{lp} | y'_{l} |
これらの信号データを先ほど求めた単位空間の列ごとの平均値で基準化します.
X_{ij} = x_{ij}-\bar{x_j} ~~~ ( i=1,2,\cdots,l , j=1,2,\cdots,p ) \\Y_i = y'_i - \bar{y} ~~~ ( i=1,2,\cdots,l )一般的な標準化では, \frac{x_{ij}-\bar{x}_j}{\sigma^2}のように計算されます.しかし,単位空間は正常なデータであり,正常データはバラツキがないと仮定しているため,分母が0になってしまうことが考えられます.そこで,標準化ではなく平均を引くだけの基準化を行っています.
そして,基準化された信号データは次のようになります.
項目1 | 項目2 | \cdots | 項目p | 出力 | |
1 | X_{11} | X_{12} | \cdots | X_{1p} | Y_{1} |
2 | X_{21} | X_{22} | \cdots | X_{2p} | Y_{2} |
\vdots | \vdots | \vdots | \vdots | \vdots | \vdots |
l | X_{l1} | X_{l2} | \cdots | X_{lp} | Y_{l} |
比例定数とSN比の算出
T法は 項目ごとに 単回帰を行い,それらを組み合わせた様な手法です.なのでまず,項目ごとに単回帰を行います.特徴的な点は,通常の単回帰はx からyにデータが発生していると考えますが,T法では y からxにデータが発生していると考えていることです.
求めたい式は以下の2つです.
比例定数~~ {\beta_j}= \frac{ \sum_{i=1}^{l}Y_iX_{ij}}{r}\\SN比~~\eta_j=\begin{cases}\frac{\frac{1}{r}(S_{\beta j}-V_{ej})}{V_{ej}}&(if~ S_{\beta j} > V_{ej} ) \\0 & ( if~ S_{\beta j} \leq V_{ej} )\end{cases}
上記の式に出てくる変数は以下のように求めます
有効除数~~r= \sum_{i=1}^{l}Y_i^2 \\全変動~~S_{Tj}= \sum_{i=1}^{l}X_{ij}^2 \\ 比例項の変動~~ S_{\beta j} = \frac{ \sum_{i=1}^{l}(Y_iX_{ij})^2}{r} \\誤差変動~~S_{ej} =S_{Tj} - S_{\beta j} \\誤差分散~~V_{ej} = \frac{S_{ej}}{l-1} \\比例定数の導出ですが,一見何をしているのかわかりにくいですが,単回帰における比例定数の式と比較すると意味が分かりやすいと思います.
T法 ~~ \hat{\beta}_j = (Y^tY)^{-1}Y^tX_j~~~~~~単回帰~~ \hat{\beta}_1 = (X^tX)^{-1} X^tY
総合推定値の算出
基準化された信号データX_{ij}と項目jにおける比例定数 \beta_{j}の関係は以下の式で表せ,図にすると右のようになります.
\hat{Y_{ij}}=\frac{X_{ij}}{\beta_j}
しかし,項目がp個あるので,\hat{Y}_iも \hat{Y}_{i1} , \hat{Y} _{i2} ,\cdots, \hat{Y} _{ip} と p個得られます.

得られた\hat{Y_{ij}}を\eta_{j}で重みづけし,総合推定値を算出します.そのイメージが以下です.

式で表すとこのようになります.
\hat{Y}_i = \frac{ \sum_{j=1}^{p}\eta_j\cdot\frac{X_{ij}}{\beta_j} }{\sum_{k=1}^{p}\eta_k}=\frac{\sum_{j=1}^{p}\eta_j \cdot \hat{Y} _{ij}}{\sum_{k=1}^{p}\eta_k}
基準化前総合推定値の算出
T法の計算手順において,信号データを単位空間によって基準化をしているため,最後に総合推定値に単位空間の平均を足すことで,基準化前総合推定値に戻す必要があります.
\hat{y}_i' = \hat{Y}_i + \bar{y}このようにして,T法では予測を行っていきます.
まとめ
今回はT法の理論的な内容についてまとめました.
要するに,単回帰を何回も繰り返したような手法です.
参考文献
田口玄一(2005):目的機能と基本機能(6),品質工学,13(3),pp.5-10.
立林和夫・長谷川良子・手島昌一(2008):『 入門MTシステム 』,日科技連出版社.
(著:中山 翔太)
関連記事
Deepblueでは統計やAIの平和的活用を一緒に取り組んでいただける方を募集してます。詳しくはRecruitをご覧ください。