2020年08月08日

多重共線性(Multicollinearity)は何が問題なのか――日本の選挙研究の実例から


 今回は多重共線性(Multicollinearity、マルチコ)について実例を元に解説したいと思います。

 マルチコは、よく問題になるなる言われるわりに、実際に問題になっているのを見たことがないという方も多いでしょう。院生同士の研究会でマウントの取り合いに使われるくらいの存在かもしれません。

 たまたまツイッターを見ていたら、神戸大学の藤村直史先生がよい材料を提供してくださっていたので、感謝しつつこれを使います。

Fujimura, N. (2020). Effect of Malapportionment on Voter Turnout: Evidence from Japan's Upper House Elections. Election Law Journal: Rules, Politics, and Policy: Published Online:7 Jul 2020. (pdf)

htmlの別ソース

 選挙がテーマですが、広くデータ分析を行っているみなさん、データ・サイエンティスト等を目指すみなさんに参考となると思います。こういう生の実例が手に入ることは珍しいですし。

 ただ、先に述べておきますが、自分は方法を開発するような立場の人間ではないので、以下の記述に間違いや誤解を生む内容が含まれているかもしれません。わかりやすい言い回しに努めていますので、厳密でない単純な言い方になっているところもあります。あと、うまく言語化できず珍妙な表現になっている場合もあります。

 それでよろしければ、長いですがお読みいただければと思います。続きを読む
タグ:参院選
posted by suga at 06:42 | 分析記事

2020年07月07日

宇都宮健児候補と山本太郎候補の自治体別得票率からわかること(2020年東京都知事選データ分析)


(7/10、わかりにくいのでタイトル変えました)

 引き続き、野党系2候補について簡単にデータを見て議論してみます。前回の記事は下記ですが、連続はしていないのであちらを読まなくてもこちらのお話を理解することはできます。まあ今回は、文章は大したことを言っておらず、図がお役に立てればという感じです。

小池百合子圧勝の簡単なデータ分析(2020年東京都知事選挙)

 今回の都知事選では、告示直前に山本太郎候補が出馬を表明したために、革新系の野党系2候補間で票割れが起きることが危惧されました。実際には、2候補合わせてもまったくもって1位に全く届かないという結果となったので、単純に両勢力とも支持不足が敗因なのは明らかですが、それでもデータを観察することで得られる示唆はあります。そういうわけで、地域別得票構造を観察して、そこから何が言えそうか考えていきたいと思います。

2020東京都知事選 図7 野党系候補得票率と2019年参院選れいわ新選組比例区得票率続きを読む
posted by suga at 22:50 | 分析記事

小池百合子圧勝の簡単なデータ分析(2020年東京都知事選)


 2020年東京都知事選挙は現職の小池百合子都知事の圧勝に終わりました。ツイッターなどでは野党側の敗因についての分析というか個人的主張が溢れていて、勝ったほうの分析があまりないようなので簡単にデータで示しておきたいと思います。

2020年東京都知事選挙 図1 小池百合子自治体別得票率(2016年、2020年比較、折れ線)続きを読む
posted by suga at 17:49 | 分析記事

2020年01月28日

安倍首相演説:島根県江津市の転入が増えたのは若者の起業促進策が成功したからでなく〇〇〇〇のため

 安倍晋三首相は、施政方針演説で地方創生政策に絡み、島根県江津市(ごうつし)において「若者の起業を積極的に促した結果、ついに、一昨年、転入が転出を上回り、人口の社会増が実現しました」と論じました。

 「社会増」とは、人の生死以外の理由による人口の増減を指します。人が引っ越して来たり(転入)、引っ越して行ったり(転出)することによる人口の増減です。イメージとしては、自治体が発展していれば社会増、衰退していれば社会減となります。つまり、地方創生政策が成功して自治体が発展しだしたと主張しているわけです。

 しかし、政府統計を分析すれば江津市において若者の起業促進が社会増をもたらしたと述べることはできないことがわかります。以下、これを3つの図表により指摘しています。

 なお、この結論を導くまでの筆者の分析と考察の経過はツイッターで呟きました。これは別エントリでまとめ、公開していますので、参考にしていただければと思います。続きを読む
posted by suga at 05:52 | 分析記事

2020年01月27日

安倍首相演説:島根県江津市が若者の起業を積極的に促した結果、人口の社会増を実現させたというのは本当か


Prof. Nemuroというアカウントがここでまとめた内容を典拠なく利用した記事をnoteに上げています。ご注意いただければ。
https://megalodon.jp/2020-0128-2022-57/https://note.com:443/prof_nemuro/n/n53a85c81b6e3



 安倍首相の施政方針演説で、島根県江津市が「若者の起業を積極的に促した結果、ついに、一昨年、転入が転出を上回り、人口の社会増が実現しました」と述べられていました。

 太平洋ベルト外の人口流出自治体が、工場の立地や公共事業を理由とした大規模転入を介さずに、普通に雇用を創出して社会増を達成するのはなかなか難しいと思います。なので何か裏があるのではと直感しました。その調べた結果を1月28日朝に長々ツイートしたのでこのエントリでまとめておきます。

 なお、実際にデータを示して確認したエントリが別にあります。合わせてお読みいただければ。
 →安倍首相演説:島根県江津市の転入が増えたのは若者の起業促進策が成功したからでなく〇〇〇〇のため

 事前にある程度調べて考えた結果を流しているとはいえ、不可思議なデータ言及に出くわしたときにどのように捉え、どのように調べるのか、参考になると思います。数字が事実かどうかまず調べ、その背景を探ることができる詳細なデータを確認するというのが基本です。

 読むのが面倒という人もいると思うので、結論を述べておけば、確かにある一定期間について転入が転出を上回る社会増となっていたが、それは15-19歳男性の就学による転入が統計上急増したことによるものであり、ほとんどは若者の起業により生じたものではないと推測される、となります。続きを読む
posted by suga at 12:52 | 分析記事