第四章 テレビCMを見たかどうかの変数 Zについて(P76,77)
Opened this issue · 4 comments
質問です
シグモイド関数にx1,x2を引数として Zを導出しているので、d分離できていない様に思うのですが、如何でしょうか?
@mizoono さま
ご質問ありがとうございます。
実際のところ、回帰モデルとその後のIPTW、DR法は
グラフに対するアプローチ、取り扱い方が若干異なっており、頭がこんがりそうになる部分です。
ですが質問に対しての回答は次の通りと考えています。
「商品購入量:Y」と「テレビCMを見たかどうか:Z」の関係性を求める際に、
構築した回帰式にZからYへの間接経路での影響が生じていると、d分離ができていないことになります。
すなわち、回帰式にx1もしくはx2が入っていない場合、
例えば、Y=(x1,Z)として、交絡変数のx2が入っていない場合は、x2による間接的効果を回帰式が追えていないことになります。
(x2の値が変化したときに、ZとYの値も変化するが、それを回帰式では表現できない)
d分離とは、バックドアパス(間接経路)を閉じる操作であり、
その際交絡因子は考慮する(回帰式の場合は変数として加える)となります。
つたない説明で大変申し訳ございませんが、どうぞよろしくお願い致します。
ご多用の中、早速のご回答誠にありがとう御座いました。
理解力が無く大変恐縮で御座いますが、追加で質問をさせて頂きます。
(質問1)
>例えば、Y=(x1,Z)として、交絡変数のx2が入っていない場合は
こちらは、P75 図4.1.1.における③-1の矢印が無い場合、という認識でよろしいでしょうか?
(質問2)
>d分離とは、バックドアパス(間接経路)を閉じる操作であり、
図3.2.9を参考にすると、こちらは、P75 図4.1.1.における①-1、②-2の矢印を無くす、という認識でよろしいでしょうか?
その認識でしたので、Zの値がx1,x2に影響を受けて変化するため、結局は①-1、②-2の矢印は残ったままと理解していました。
(質問3)
d分離が出来ていない場合の回帰式は、どのような式になりますでしょうか?
お手数をおかけして大変申し訳ございません、何卒宜しくお願い申し上げます。
@mizoono さま
ご質問ありがとうございます。
(質問1)
こちらは、P75 図4.1.1.における③-1の矢印が無い場合、という認識でよろしいでしょうか?
正確には、③-1の矢印があるのに無視している場合、という認識になります
(質問2)
d分離とは、バックドアパス(間接経路)を閉じる操作であり、・・・。
図3.2.9を参考にすると、こちらは、P75 図4.1.1.における①-1、②-2の矢印を無くす、という認識でよろしいでしょうか?
その認識でしたので、Zの値がx1,x2に影響を受けて変化するため、結局は①-1、②-2の矢印は残ったままと理解していました。
これは私の説明不足であり、誤解を招いており、大変申し訳ございません。
本Isuueの冒頭にて、
実際のところ、回帰モデルとその後のIPTW、DR法は
グラフに対するアプローチ、取り扱い方が若干異なっており、頭がこんがりそうになる部分です。
と記載しましたが、図3.2.9のようにグラフを変換して、調整化公式を用いるアプローチはIPTW、DR法に密接に関わるものです。
回帰法においてはグラフを変換する代わりに、回帰式に明示的に変数を追加します。
すると、間接パスを明示的に式に組み込むことになります。
結果、間接パスの影響(x1, x2の影響)をきちんと考慮し、ZからYへの「直接の影響」をきちんと求められる回帰式になります
(求まる直接の影響は回帰式のZの係数として表されます)。
(質問3)
d分離が出来ていない場合の回帰式は、どのような式になりますでしょうか?
d分離するには、交絡因子、x1、x2を考慮したいので、これらを式に含めます。
そのためd分離できていない場合の回帰式は
Y=f(x1,Z)
Y=f(x2,Z)
Y=f(Z)
のパターンです。
d分離され、Zの直接の影響がきちんとYへ反映される回帰式は
Y=f(x1,x2,Z)
となります。
どうぞよろしくお願い致します。
ご丁寧に解説頂き誠にありがとうございました。
お陰様で大変理解が深まりました。
独学している身としては、直接ご教示頂くことができ大変ありがたく存じあげます。
ご多用の中誠にありがとう御座いました。