読書リレー(35) 数字はこうして作られるー門倉貴史「統計数字を疑う~なぜ実感とズレるのか?~」

データは客観的なものですが、データは主観的に作られるのです。

 

 

経済評論家の門倉貴史氏の著書(この人結構テレビにも出ていますよね?)。巷にあふれている「統計」というデータ。普段からよく聞き慣れた言葉ではありますが、少しわかりづらいという人も多いかと思います。そして、そのわかりにくさのために、その統計数字をそのまま鵜呑みにする人も多くいらっしゃるのではないでしょうか?この本では、そうした統計には、実感と数字にズレが生じたり、場合によっては嘘だったりします。そうした統計が出てきてしまう理由についてこの本では説明しています。

 

特に、経済効果に関する部分が面白いです。経済効果というと、一般的な人でもよく耳にする言葉かと思います。例えば野球のチームが優勝したら、テレビのニュースなどでは、「優勝セールなどを含めて経済効果は●円!」というようなフレーズを発する機会が多くなります。私はもともとあらゆるものを疑ってかかるタイプのひねくれた人間でしたので、「そんなのありえないよ、うそうそ」と思っていたのですが、どうやら私のこの直感は正しかったようです。

 

直感が正しいというよりかは、「疑ってかかる」という行為そのものが正解だった、ということになります。この経済効果については、計算が単純で(詳しくは本書を参考ください)、すぐに計算が可能ということなのですが、その計算はあくまで推測という主観的な要素が含まれてしまうために、データとして出現する数字というものには、その主観性がどうしても反映されてしまう、ということになります。例えば野球チームの優勝によってグッズ販売が増えたとしましょう。その場合、そのグッズ販売をどのように見るかで変わってきます。具体的に言えば、優勝によってお父さんが家族のためにユニフォームを購入するかどうか、という行為をカウントするかどうか(少し極端ですが)で考えた場合、ユニフォームが一着1万円で、その年の世帯が10万世帯だとすると、その行為を考慮するかしないかで、たちまち10億円の数値が変わってくるわけです。このように、経済効果は「掛け算」の数字ですので、いくら一人一人の行為が少なくても、それを多くの人がするだけでたちまち数値が膨れ上がってしまうのです。

 

また、経済効果の場合には、トレードオフ、すなわち「あちらが立てばこちらが立たない」という状況が考えられるため、影響の範囲というものも考える必要があります。野球チーム優勝ネタを引っ張りますが、例えば地元のチームの優勝によって野球への関心が高まり、それで「このことによる経済効果は●円!」と出たとしましょう。しかしながら、本来スポーツに興味があった人たちが、他のスポーツから野球に興味を移すことになっただけにすぎない可能性もあるわけです。そうなると、他のスポーツ、例えば作家やーやテニスなどでは、経済的な損失が発生する可能性があるわけです。このため、こうした経済効果というのも、限定的に考える必要があるようです。

 

最後に、これらの統計数字には、「統計数字が世の中に出されることによってえられる効果」という点を考慮せざるをえません。例えば、統計上、どうしても低く抑えておきたいもの、もしくは高く抑えておきたいもの、というのが存在します。犯罪率は前者にあたり、先に述べた経済効果については後者にあたります。それらの中には往々にして主観的なバイアスが入ることになり、結果として実態と乖離した値が出てきてしまう可能性を孕んでいる、ということになるのです。

 

しかし、これはある意味、「統計」の存在意義に関係するところなので、ある程度は仕方のないことかもしれません。実際に私は、その疑われる方のデータ作りを、今の仕事で経験しています。今どちらかというとデータ分析の仕事をしている時間の方が長くなったのですが、これらデータ分析には「目的」があるわけです。例えば、ある主張がしたい、と誰かが手を挙げたとします。そのある主張を成立させるために、データを作る必要があるわけです。こうなると、データ作成者としては、「いかにこの主張を支えるようなデータを、客観的に近い形で作り出すことができるか?」という点を考えるわけです。このため、データ作成者はその資料が主観的であることをなるべく隠そうとします。その隠蔽はあまりにも高度なため、作成者にしかわからないところもあるのです。こうして、見かけ上は客観的なデータが作られているわけです。

 

私がやっているのは微々たるものですが、それの延長線上にあるのが、これら経済に関する統計なのかもしれません。疑ってかかる、まずこの姿勢が、統計を読む方には大事なのかもしれませんね。

 

では、では