ゼロからはじめる!統計学見るだけノート
著者 永野清一
出版社 株式会社宝島社
分類 実用書
出版日 2018/6/28
前回に引き続き、役に立つ実用書『ゼロからはじめる!統計学見るだけノート』を紹介させていただきますね。
統計学をこれから学びたい方、仕事や暮らしの中で使いたいけど1歩が踏み出せない方にお勧めしたい1冊。
今回は、統計学の具体的な内容に触れていますね。
実用的な構成とイラスト付きでわかりやすい統計学の本 『ゼロからはじめる!統計学見るだけノート』
見慣れない方にとって、言葉は知っていても難しいだけに思える統計学。
ご存知の方でも、できれば避けたいのが統計学の検証方法ですよね。
実践的な、大人の数学を教える専門家 永野清一さんの本は、本の半分がイラストと図解で描かれ、統計学をわかりやすく学べる実用書です。
実用的な統計学は相関係数と仮説検定
統計学では、株価の変動や景気の動向の予想、天気や星の動きまで複雑なことを計算する方法もあります。
そういったとても難しい方法は、統計学の専門家に任せるとして、私も使う機会がある2つの統計を取り上げみます。
仕事の現場で役に立つ機会が多いのは、相関関係と仮説検定の2つだと思います。
『ゼロからはじめる!統計学見るだけノート』でも、後半の2つのChapterで取り上げていましたよ。
アレとコレはどういう関係なのかを調べる相関関係
1つ目の相関関係は、2つの物事の関係を調べる方法です。
業界に関わらず、売り上げなどの実績や製品の性能からお客さんの傾向を知ることができる便利な統計学です。
相関関係とは?
相関関係
2つのデータの関係性の分析は、統計学の得意分野です。
立地と店舗の売り上げの関係や、年齢と記憶力の関係など、相関とは一方の値が変化するともう一方の値が変化する関係性のことです。
世の中には相関がある物事が数多く存在するため、使いこなせれば仕事や暮らしに大きく役立てることができます。
Chapter06 相関係数で関係性を分析する p116〜p117
本の中では、店舗の立地と売り上げの高さに関係があるかを調べていました。
他にも、「夏休みに入る学校の数」と「美容室の予約の変化」など実用的なことを調べることもできます。
正の相関と負の相関
相関関係は「相関とは一方の値が変化するともう一方の値が変化する関係性」です。
一方が増えると片方も増えることも、その逆もあり得ます。
正の相関
一方が増えるほど、もう一方も増えていくのが正の相関。
グラフ上では右肩上がりの直線で表される。
Chapter06 相関係数で関係性を分析する p118〜p119
先ほどの、「夏休みに入る学校の数」と「美容室の予約の変化」で学校の数が増えると予約の人数も増える結果なら、正の相関ということになります。
夏休みで時間ができるので、学生さんが美容室を訪れる機会が増えるという予想ができます。
負の相関
一方が増えるほど、もう一方が減っていくのが負の相関。
グラフ上では右肩下がりの直線で表される。
Chapter06 相関係数で関係性を分析する p118〜p119
こちらも、「夏休みに入る学校の数」と「美容室の予約の変化」に当てはめてみると、学校の数が増えると美容室の予約は減る結果が出たとします。
学生さんが夏休みで帰省してしまうため、美容室のお客さんは減ってしまう負の相関になったといえるでしょう。
相関関係を読み解く相関係数rの見方
相関関係は、相関係数rという数値で表されます。
相関係数r
相関係数は『賃料』と『駅からの距離』といったふたつの変量から導き出される数値。
相関関係をrとすると、rは-1以上1以下になる性質があります。
プラスだと正の相関、マイナスだと負の相関になります。
相関係数rが0に近ければ近いほど、相関関係がないといえます。
Chapter06 相関係数で関係性を分析する p120〜p121
「夏休みに入る学校の数」と「美容室の予約の変化」に当てはめると、相関係数rが1に近いほど正の相関、つまり学校の数が増えれば増えるほどお客さんも増えるといえます。
逆の場合、相関係数rが-1に近いほどお客さんは減る結果といえます。
物事の効果を比べる仮説検定と確率p値
2つめの仮説検定では、2つのデータの差を調べる方法です。
美容室を例に挙げると、「去年の夏に比べて明るいカラーを注文するお客さんが減っているかもしれない」とスタッフで話題になったとします。
そこで、去年と今年の夏にカラーの注文をしたお客さんのデータから、明るいカラーを注文した人数を比べてみることにします。
仮説検定とは?
アンケート結果の活用は「仮説」を立てることからスタートします。
中略)
『関東と関西でのメニューの好みに差がない』という仮説を立てて、検証してみましょう。
この検証は統計学では仮説検定と言います。
Chapter07 仮説検定で論理的な答えを出す p158〜p159
仮説検定と聞くと、とても難しい分析を行うように思えます。
実はいたってシンプルで、「差がない」という仮説を立てて、パソコンの計算で否定(棄却)するか肯定するかを決めるだけなんです。
帰無仮説と対立仮説
帰無仮説とは?
仮説を立てる時のポイントは、確率が計算できるかどうかなのです。
中略)
仮でもいいので厳密な数値を設定できれば、あとはExcelの『x二乗検定』という関数を使って、それが起こりうる確率を調べることができるのです。
このように計算が可能な仮説のことを帰無仮説といいます。
Chapter07 仮説検定で論理的な答えを出す p160〜p161
「去年の夏に比べて明るいカラーを注文するお客さんが減っているかもしれない」という話題では、「差がない」ことが帰無仮説ということになります。
美容室のお話では、「去年の夏に明るいカラーを注文したお客さんの人数」と「今年の夏に明るいカラーを注文したお客さんの人数」に差はないという仮説か帰無仮説です。
対立仮説とは?
確率がわかるということは、その出来事が何%くらいで起こるか計算ができるということです。
先ほどのサイコロの例で言えば、全ての目が均等に出るサイコロを使ったとして、何%の確率であの目が出るかを求めることができます。
実際には十分に起こりうる値になりますが、そ」が限りなく0%に近い値だとしたらどうでしょう?
中略)
帰無仮説が間違っていたら、背理法の考えで反対の仮説、つまり対立仮説が採用できるわかです。
Chapter07 仮説検定で論理的な答えを出す p164〜p165
一方で対立仮説は、帰無仮説の反対です。
「去年の夏に明るいカラーを注文したお客さんの人数」と「今年の夏に明るいカラーを注文したお客さんの人数」に差はある。
つまり、「去年の夏に比べて明るいカラーを注文するお客さんが減っている」ことになります。
統計学によく出てくるp値とは?
p値とは?
計算の結果出た確率をp値と言いますが、p値をもとに帰無仮説を採択すべきかどうか自分の感覚で判断することは大切なことです。
しかし、採択すべきかどうかの目安となる値があります。
一般的には確率が5%を下回ると帰無仮説を棄却できると考えることが多く、10%を超えると仮説を棄却するのに十分とは言えなくなります。
Chapter07 仮説検定で論理的な答えを出す p172〜p173
p値というのは、帰無仮説が起こる確率のことです。
p=0.01のようにグラフに書かれていることがありますが、そのまま1%と見るとわかりやすいですよね。
先ほどの帰無仮説、「去年と今年の夏で明るいカラーを注文するお客さんの人数に差はない」とする説が起こるのは1%(p=0.01)です、ということになります。
その結果は信頼していいの?
有意水準とは?
こうした『採択するかどうかの基準』のことを有意水準と言います。
立てた仮説を意味がある(有意)とみなすかどうかの基準ということです。一般的な有意水準
p>0.1以上………N.S 有意水準として使用さらない
p≧0.05〜0.1……+ 有意水準とするには注意が必要
p<0.05〜0.01………* 有意水準として使用できる
p<0.01〜0.001………** 有意水準として信頼できる
Chapter07 仮説検定で論理的な答えを出す p172〜p173
このp値には目安があって、上のように有意水準と呼ばれる基準があります。
有意水準に照らし合わせると、「去年と今年の夏で明るいカラーを注文するお客さんの人数に差はない」という仮説を否定して、「差はある」と判断するのはとても信頼できる結果になります。
それでも、判断するのはやはり人です。
「わたくしの長年の感によるとねぇ、これは顧客のニーズの誤差なのですよ」
店長が長年の感を頼りに「ただの誤差」としてしまうと、「差は無かったことになる」こともあるでしょう。
今後のカラー剤の仕入れと、スタッフの配置が気になるところではありますね。
統計学に興味を持っている方におすすめ
『ゼロからはじめる!統計学見るだけノート』は、統計学という言葉は難しくてなかなか1歩が踏み出せなかった方にお勧めしたい1冊です。
この本でを読むと、統計学が身近になる2つのメリットがあります。
データが読めるようになる
もう1つは、データが読めるようになることです。
政府の発表する内容が合っているかは無理ですが、本格的に勉強していない私でも他社の発表するお客さんの傾向や商品の性能のデータは読めるようになりました。
これから統計学を知りたい方、暮らしや仕事の中で活用したい方にはぜひおすすめしたい本です。
もし、明日にでもパソコンを開いて統計学に取り組むほど急いでいる方は、Excelの使い方が具体的に書かれていて、アドインソフトをダウンロードできるこちらの2冊の本もおすすめです。
EXCELビジネス統計分析[ビジテク] 第3版 2016/2013/2010対応 末吉正成
4Stepエクセル統計 第4版 柳井久江