アメリカ大統領選のデータサイエンティスト

先日の大統領選でデータサイエンティストが活躍したと評判であったが、どんな風に選挙活動していたのかの記事( http://www.technologyreview.com/featuredstory/509026/how-obamas-team-used-big-data-to-rally-voters/ )があったので読んでみた。

まずは2008年の選挙の際にベースとなるデータとして、

  1. 10000人くらいの簡単なインタビュー
  2. 1000人くらいの詳細なインタビュー結果

を作成した。各人には約1000個くらいの特徴が付けられている。

まずは、下記のことが分かった。

  1. 意外にもMedicareの政策について話すと65歳以上の人よりも45〜65歳の人に好評のようなのでこの世代に積極的にMedicareをアピールする
  2. 女性の同一労働同一賃金についてが最も反響が多く、しかも支持率が低かったことが分かった。そのためはっきりと政党を決めていないが女性問題に特に関心がある女性の支持を得るために、女性の話題にしか触れていないダイレクトメールについて公開した。

そしてここからが面白い
オバマは支持者を使う方法としてはマスメディアやダイレクトメールよりも、ボランティアや支持者の人に他の人を1対1で説得してもらうのを中心に支持者を増やしていった。
その際にあらかじめ対象者を解析し、支持者になりやすいかどうかを0〜10の間でスコア付けを行い、支持者になりやすそうな人に対して片っ端から電話して説得していった。

ケーブルテレビの放送枠を買ったが、効率的に放送するために先の分析で支持者になりやすそうな人の視聴履歴をプライバシーは保護しながらケーブルテレビの会社から購入。支持者になりやすそうな人のテレビがよく見る時間を付きあわせ、金額あたりで支持者になりやすそうな人がもっとも多く見るような最適な時間配分を計算して(線形計画か整数計画かしら?)から放送を行う。