Dive into hoge

データ分析関連の備忘録

集計の軸を探す方法

下記資料から抜粋。
speakerdeck.com



仮説と集計結果が異なる場合、取るアプローチ。

エキスパートジャッジメントで探す

(深いドメイン知識が必要)でいい感じのパラメタ探す

因果推論で探す

共変量の影響を除外して目的変数への影響を知りたい。
傾向スコア等を用いて観測できない集団を推定する。
前提に置く仮定が強すぎて実務上使いにくい気がする。

機械学習で探す

 - feature importance, permutation importance
  機械学習が予測に重要だと思っている変数はなにか
  importanceの高い変数に注目して集計したり
 - Partial Dependence Plot
  ある変数の違いが予測結果にどんな影響を及ぼすか