情報・システム研究機構の
産学連携への取り組み

企業などの皆様からの声

令和4年度第7回 ROIS・統数研 産学連携・知的財産セミナーより

第7回 ROIS・統数研 産学連携・知的財産セミナー

統計的因果推論入門
~ 高度なデータサイエンスの手法が明らかにする「因果」についての新たな知見 ~

開催日:令和5年3月10日(金) Zoomウェビナー

第一部【オープニング】

情報・システム研究機構理事・統計数理研究所長 椿 広計

第二部【講演】 統計的因果推論入門 ~高度なデータサイエンスの手法が明らかにする「因果」についての新たな知見~

統計数理研究所 准教授 野間 久史

第三部 【Q&Aと対談】

椿 広計、野間 久史

セミナー概要:
Evidence-based” という言葉が普及して久しいですが、私たちがデータサイエンスの手法を用いて取り組む科学的分析の多くは、物事の「因果関係」を対象としています。
政策や医療などにおいて、この「因果」についての正しい知見が得られなくては、そこまで成果が上がらない政策に多くの税金が使われてしまったり、大して有効でない治療法(しかし、副作用は起こり得ます)が多くの方々に使われてしまう問題が起こり得ます。
統計的因果推論とは、従来の統計学の方法で解決できない、この「因果関係」に迫る分析を実現するため発展したデータサイエンスの方法論です。
本セミナーでは、この統計的因果推論の入門的な解説を行い、高度な分析手法を用いることで従来の方法では誤った結果が得られてしまう問題から、まったく異なる知見が得られた、最新の学術研究の事例を紹介します。

本セミナー参加者の皆様から多くの感想と質問をお寄せいただきました。皆様からの声として、それらをまとめてキーワードまたは箇条書きの形にして下記にご紹介します。これらの声は今後のセミナー企画に活かしたいと思います。

講演への感想

●食品分野のヒト試験の際にも、統計解析を検討したい

●計測しなかったデータを、交絡の考え方を含めどう考えていくのか難しい

●ものづくりの場でも学ぶべき学問

●まずはデータの層別的に交絡の帽子が必要と理解

●グラフィカルモデリングとの比較は別の機会に学びたい

●データの見方については日常でも役に立つ

●製造業で故障原因を探る手法としても有効

●社会科学分野での応用事例などを調べてみたい

●因果の高度化が医療の高度化、とくに医療の質の向上・改善にどうしたら結びつくかなどを考えさせられた

●医学において臨床推論が診断における重要な課題だが、医師等によりばらつきがあるのも現実

●傾向スコアの出し方に関し、様々な手法を用いてその確度を高めることができる

●高度な手法によって完全ランダム試験のようにバイアスを除去できることを理解

●数学的にバイアスを取り除くことが現実に役立てることにどれだけ有効なのかを理解したい

●人文・社会科学系の研究者にとっても重要なテーマ

●ゼロ近傍確率「丸める」に興味を持った

●解析方法のみならず、その結果の”解釈”をいかにできるかが大切

●研究・専門分野の知識の向上、統計専門家の方々と十分な相談をしながら進めていく必要性を感じた

●ヒドロキシクロロキン研究の紹介スライドで、多変量解析と統計的因果推論は全く異なる手法のように感じるが、同じような結果が得られるとしたら興味深い

講演への質問

●マッチングと回帰の重みの付け方の所について詳しく知りたい

●傾向スコアマッチングなどを用いた分析に疑問があり、自信をもって主張する際の適切な根拠を知りたい

●厳格なランダム割付の結果、リスク因子の偏りが“偶然に”生じてしまった場合、それは交絡と呼ぶのか

●「未知のリスク要因」を探す手段としての「因果探索」研究は行われているか、そのような研究に可能性を感じられるか、知りたい

●時間依存性交絡の調整の際に行う調整の時間感覚はどの程度が良いのか

●因果効果を評価する際の交絡因子の洗い出しについて、洗い出しをどこまでやるのか、どこで止めるのか、定量的または定性的な基準を知りたい

●時間依存性共変量が複数ある場合でもモデル化は可能か

●交絡変数を考慮すべきかを決める際の手順を知りたい

●観察研究においては、未知の交絡要因によるバイアスを補正する方法はないのか

●傾向スコアを計算するときに、説明変数の選択で気をつけることは何か

●相関と時間の前後以外に、データから導出できる(人間が観測できる)因果の因と果に常時存在する関係はあるか

●未知の交絡因子を発見する方法はあるのか

●勾配ブースティング決定木など非線形にも対応したアルゴリズムで因果推論を行うことは可能か

●多くの変数を傾向スコアに含めすぎることによるデメリットはあるのか