AIを学ぶ

統計学とは?

更新日:

統計学について

現在統計学が学問領域として、とても盛り上がっています。

 

以前は専門書が多かった統計学の書籍も、現在では一般向けの書籍が多く出版されており、 実務面でもますます統計を用いた分析、統計を用いた戦略が流行っています。

 

2013年に発売された「統計学が最強の学問である」はベストセラーにもなりました。 多くの「統計」に関連した書籍が出版され、多くの人に読まれています。

 

この背景には、 2000年代における「情報の電子化」が様々な業界業種で一斉に行われたことが、大きく影響していると考えられています。「管理」、「可視化」を目的としてデータベース化が行われ、データ利活用の下地が整いました。


その結果、構造化されたデータ(csv、excel)や、画像、音声のような非構造データの収集が進み、 データをまとめて、全体の傾向を見るということが一般的に行われるようになりました。

 

 

「統計」とはどういう意味か?

そもそも、統計とはどういう意味なのでしょうか。

「統計」の出自は、「統べる」+「計る」の組み合わせから成り立ちます。統べるとは、「全体をまとめて支配する」という意味、 計るは「計量する」という意味です。


すなわち、全体を俯瞰した上で、計量することによってデータの性質を計ることに統計の目的があります。 複数の様々なデータを要約し、中にある情報を把握しやすくするということが「統計」と言えるでしょう。

また、英語では、統計学を「statistics (スタティスティクス)」と言いますが、語源はラテン語で「状態」を意味する「statisticum (スタティスティークム)」です。


この言葉がイタリア語で「国家(State)」を意味するようになります。そして、国家の人力、財力等といった国勢データを比較検討する学問=「statistics (スタティスティクス)」を意味するようになりました。


国家のような「大きな状態」を計る学問こそ、統計の出自にもなっているのです。

統計の歴史

生命保険の出自

ハレー彗星の軌道計算で有名なエドモンド・ハレーは、1693年に終身年金に関する論文を発表しました。
当時、ドイツのブレスラウという都市(今のポーランド)が、住民の死亡記録を詳細に残していたのですが、そのデータを活用し、出生と死亡の関係値から、生命表を作りました。生命表とは、年齢別・性別に次の誕生日までの間の生存率・死亡率および平均余命などを示した表で、
死亡年齢の統計的解析を行ったと言われています。

この生命表を使って、イギリス政府は終身年金の保険料を計算できるようになり、購入者の年齢に応じた適切な価格で年金サービスを供給することができるようになりました。

また、ハレーのこの研究は保険数理学の発展に強い影響を及ぼし、現在の生命保険料は、このハレーの計算が元になっていると言われています。

サイコロ賭博

パスカル(Blaise Pascal 1623-62)とフェルマー(Pierre de Fermat 1600年代初頭-1665)はサイコロ賭博の問題をテーマに手紙をやりとりし、その中から確率論の基礎が芽生えました。そのときのサイコロ賭博の問題のテーマは、現在統計学で有名になっている「ド・メレの2つのサイコロ(ダイス)」と呼ばれています。統計には欠かせない標本空間、期待値、推定、検定などは、そこから発展していったものです。

地動説で有名な「ガリレオ」も「サイコロゲームについての考察」という論文を出しています。ギャンブルにおいて「自分がどの立場を取ったときにどのぐらい得になるか」というテーマは、「大きな状態」を仮定し、その状態がどう動くかという「パターン」とそのパターンが「起きる頻度」を明らかにすることで、最適な戦略に落とし込むことができます。

医療

医療における統計の実例です。ナイチンゲールが統計の専門家であったことは有名な話です。
彼女が「クリミアの天使」と呼ばれるようになった背景には、戦争時にあるデータを用いて、劇的な成果を残したことにあるのです。

ナイチンゲールはイギリスの上流階級の生まれで幼いころから数学や統計について学んでいました。
クリミア戦争に派遣された彼女は、戦死者・傷病者に関する膨大なデータを分析し、実は彼らの多くが戦闘で受けた傷そのものではなく、傷を負った後の治療や病院の衛生状態が原因で死亡したことを明らかにしたのです。

統計に馴染みの薄いイギリスの国会議員にも分かるように、グラフを用いて視覚的に訴えました。
彼女たちの尽力により、病院内を衛生的に保つことが命令され、42%まで跳ね上がっていた兵舎病院での死亡率は、着任後2ヶ月間で14.5%、その1ヶ月後に5%まで低下しました。

こうした生命保険、ギャンブル、医療における統計の活用事例は全て、データを収集し全体の傾向を導き出すという統計の本質に従って活用された事例と言えるでしょう。

問わず、たくさんのデータが集まるようになってきています。

-AIを学ぶ

Copyright© 人工知能/AIならAILearn(あいらーん) , 2019 All Rights Reserved Powered by AFFINGER5.