Subscribed unsubscribe Subscribe Subscribe

一寸先は靄

文系学部から理系大学院に進学し四苦八苦するだけの日記。

初等的統計学 (1)

初等的統計学と題して、統計学の(自身が信ずるところに依る)理念的部分を書き留めるという、技術ブログまがいのことをしばらく継続する。

まずは一旦統計学というキーワードを忘れるところから始める。データに基づいた判断は数式など持ち出さなくともこれまで幾度となく行われてきた人類の営みである。例えばデータを見て「Xが多いときにはYも多いような気がする」ために、「Xが多いときにはYも多い」と結論づけるのも確かにデータに基づいた判断である。実社会においては恐らくこのような仕方でのデータ活用が多いのではないだろうか。

データに基づく判断のうち初歩的なものとしてまずこの「直感的推測」を置く。これで問題が生じないならばこの直感的推測で十分であるし、問題が生じた場合に新たな方策を考えれば良い。

さて、この直感的推測が問題を生む文脈も容易に考えつくだろう。この直感的推測では、判断基準が外部から明確ではない・客観性に欠ける、等の問題が生じる。つまりこれではビジネス或いは学術において他者を説得することは難しく、またその判断の技能が個人依存になる点は経営の視点から考えれば望ましくはない。したがって直感的推測ではその客観性において不足の生じる状況下で「その手法の下では誰でも同じ判断が出来る」方法論が必要になる。その方法論の一種として「統計学」や「機械学習」が挙げられるのである。

統計学機械学習の特徴として、その再現可能性は強調すべきである。つまりベテラン社員だろうと新卒一年目の社員であろうと、同一の仮定・方法を用いれば同一の結果を得ることが出来るのである。経営の観点から言えば、新人が早期から力強い結論を下すことが出来ることや、経験豊富なベテランが退職してもその判断技能を引き継ぐことが出来ることを考えれば、確かに利点のある方法論だと言えよう。