統計を基本から勉強をしたいけど、何から勉強して良いのか分からない。
職場で統計検定2級の資格を取る様に言われたけど、色々なwebサイトを見ても良く分からなかった。
統計の勉強や、統計検定2級の資格を分かりやすく、また効率よく学習したい。
自己紹介です
- 私は現在医師として勤務しつつ大学院の医学博士課程に所属しています。
- 研究テーマが人工知能やビッグデータに関する事もあり、統計学については自分の専門分野のうちの1つでもあります。
対象としては、統計検定2級の取得を目指している方、または資格取得に限らず統計の基本的な知識を学びたい方に向けた記事となります。
個人的には資格の取得にこだわる必要はないという考えなのですが、就職の際にも有利となる統計検定2級の取得を目指している方に、統計検定2級に合格できるよう、しっかりサポートしていきますので、一緒に頑張っていきましょう。
何より、楽しく統計を勉強して頂ければと思います。
ここで参考までに、統計検定2級の実施趣旨や試験内容を載せておきます。
統計検定2級|統計検定:Japan Statistical Society Certificate
続きを見る
統計検定2級の取得を目指している方は、確認しておく様にしましょう。
本記事の学習内容
- なぜ研究をするのか
- 研究方法は2種類だけ~実験研究と観察研究~
2-1. 治療薬の介入効果を見たい場合に行うのが実験研究
2-2. 研究対象者の違いを見たい場合に行うのが観察研究 - 原因と結果~説明変数と目的変数~
- 公式が出る計算が「統計」と思っていませんか?実は「統計」には2種類ある~記述統計と推測統計~
4-1.平均値を計算したり、グラフ・表を作るのが記述統計
4-2.テレビの視聴率のように一部の代表者のデータから全体の特徴をつかむ推測統計 - 何で推測統計するの?推測統計のメリット
- 推測統計も万能ではない~第1種の過誤と第2種の過誤~
※ 本記事には医療の内容も含まれていますが、医療従事者だけではなく一般の方に向けて解説している記事になります。
その為、噛み砕いて解説している箇所で専門用語と齟齬がある場合にはご了承頂けます様、宜しくお願いいたします。(誤った記載がある場合にはTwitterのDMまでご連絡頂けましたら幸いです。)
では早速、学習していきましょう。
統計学とは【そもそも何故研究をするのか?】
統計学とは
統計学とは、データの特徴を把握し、予測や比較を行うための学問です。
統計学とは、統計に関する研究を行う学問である。 統計学は、経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす。
データとは「ばらつきのある複数の数値、符号の集まり」を意味します。
そのままの状態でデータを眺めているだけでは何の特徴も把握できません。
統計学の「記述統計学」では、平均の算出、表やグラフの作成などによってデータの特徴を見出します。
また、抽出した「標本」の特徴から、さらに元となる「母集団」の特徴を推測可能です。
これにより、実際には取得が困難なデータの特徴を推測することができます。
「推測統計学」では、この推測の方法が体系化されています。
統計学で学ぶ大まかな内容としては以下です。
- 「データ」とは何か
- データの扱い方(代表値、データの基本処理)
- データのばらつきと傾向の表し方(分布、分散、標準偏差、確率)
- データ性質の調査(推定・検定)
- データの関係性把握(相関分析・回帰分析)
「確率」「偏差」などが入っていることからも分かる通り、統計学には数学が密接に関係しています。
統計学入門として考え方を理解するだけであれば、必ずしも数学の知識は必要ありません。
しかし、背景を理解し実際にデータを活用するためには数学の理解が必須です。
そのため、学習にかかる時間は、どこまで深く統計学を理解したいかによって変わります。
例えを使って統計学を体験してみましょう
高血圧って、加齢によりゴミやカスなどが溜まって狭くなった血管に血液を流すために必要不可欠なことであり、自然なことでしょ。
ましてや血圧を下げる薬を使うなんておかしいでしょ。
信じられませんが、この考えは血圧測定ができるようになった1900年代の初頭位までは信じられていたと言われている事です。
参考文献
- 高血圧の成因と治療の研究を振り返って
- 「齊藤郁夫:Framingham study の果たした役割 .内科 90:221-224,2002」
あなたならこの考えが間違っている事を、どうやって指摘しますか?
高血圧が体に悪いと指摘したのは、アメリカのある生命保険会社でした。
高血圧と寿命の関係について、60~80歳の人の血圧と寿命のデータを8年間にわたって調べました。
その結果、血圧が高い人ほど寿命が短いことが分かったのです。
こうして、「高血圧は体に悪い」と証明されました。
補足
もちろん、「1つの調査だけでたまたまそうなった」という反論をされる方もいらっしゃるかもしれません。
その後も「高血圧と寿命の関する」研究が進められ、1935~1954年の間アメリカで生命保険会社26社による延べ400万人の初回血圧と平均余命を調べた結果、初回に測定した血圧が高いほど平均余命は短いことが明らかとなりました。
こうして、「高血圧は体に悪い」という事が盤石となったのです。
引用
このように研究とは、「ある考え方が本当に正しいのか、ある治療が本当に効果的であるのか」などを調べて事実を深く探究することです。
研究とは、ある特定の物事について、人間の知識を集めて考察し、実験、観察、調査などを通して調べて、その物事についての事実を深く追求する一連の過程のことである。
実験研究と観察研究【2種類の研究方法】
研究方法には、実験研究と観察研究の2つあります。
実験研究と観察研究の違い
- 実験研究:研究対象に対して介入(投薬や治療など)を行い、その効果を検証するための研究デザイン
- 観察研究:研究対象に対して介入(投薬や治療など)を行わなずに、観察によってデータを集めて解析を行う研究デザイン
ざっくりと、以上の様に分けれます。
これらの違いについて、学習していきましょう。
実験研究【治療薬の介入効果を見たい場合に行う】
実験研究とは、研究対象者に何らかの介入を行って、その効果を明らかにする研究方方法です。
治療方法や薬の効果が見たい場合によく行われます。
実験研究の例
- 目的:新しい降圧薬に降圧効果があるか調べたい
- 方法:条件Aの研究対象者 100名に新薬を投与する
条件Bの研究対象者100名に既存薬を投与する
→もし、条件Aの研究対象者の方が条件Bの研究対象者よりも血圧が下がれば、
新しい降圧薬は既存の薬よりも効果がある可能性がある
研究対象者の違いを見たい場合に行うのが観察研究
観察研究とは、研究対象者に介入を行わず、そのままの状態を観察することによって、研究対象者群の違いを明らかにする研究のやり方です。
ある病気になった人は健康な人と違って、どんな症状が出るのかを明らかにしたい場合は、観察研究となります。
他にも性別や年齢など、実験者がどうにかできないものによる違いを明らかにする場合も観察研究となります。
観察研究の例
- 研究目的:男女で血圧の高さに違いがあるか調べたい。
- 方法:男性100名の血圧を調べる。
女性100名の血圧を調べる。
→男性のほうが女性より血圧が高ければ、血圧には男女差があると証明できる。
説明変数と目的変数とは【原因と結果について】
多くの研究では、何かが何かにどんな影響を及ぼすのかを明らかにします。
例えば、「降圧薬」が「血圧」に「下げる影響」を及ぼすかを調べるといった具体です。
一言でいえば、因果関係を明らかにするのが研究とも言えます。
ただしこれはちょっと言い過ぎで、因果関係ではなく関連しか明らかにできない研究もあります。
例えばある会社で調査を行った結果、TOEICの点数が高い人は仕事でも優れた成果を上げていたとします。
ただし、元々仕事の成果が高い人が、他のスキルを身に着けようとしてTOEICを勉強したという逆の因果関係も考えることができます。
また、そもそも頑張り屋な性格という原因がTOEICの得点と仕事への成果の両方に影響を与えていて、TOEICの得点と仕事への成果の間に関連が見られていたということもありえます。
降圧薬と血圧の関係のように明確に因果関係とみなせないものについては関連を明らかにするにすぎません。
統計の言葉を使えば、原因にあたるものを説明変数といい、結果にあたるものが目的変数といいます。
説明変数と目的変数の違い
- 原因にあたるものを「説明変数」と言います。
- 結果にあたるものを「目的変数」と言います。
例えば、降圧薬が血圧に及ぼす影響を見たい場合は、
- 説明変数は降圧薬
- 目的変数は血圧
になります
原因と結果にあたる言葉は説明変数と目的変数だけではありません。
原因 | 結果 |
説明変数 | 目的変数 |
予測変数 | 応答変数 |
独立変数 | 従属変数 |
※ 横並びで対応するものを使います。
例えばですが、説明変数と目的変数という言い方はしますが、説明変数と従属変数という言い方はしません。
記述統計と推測統計【統計には2種類ある】
皆さんの中で、公式を使える計算が「統計」と思っていませんか?
「統計」といえば、以下のように数式で計算するものと思っている方はいませんでしょうか。
これから、記述統計と推定統計について解説していきたいと思います。
記述統計【平均値を計算したり、グラフ・表を作る】
記述統計とは得られたデータの特徴を丁寧に簡単に表現することです。
以下に、新しい降圧薬の効果を調べたい為に集めてきた高血圧者20人の最高血圧のデータを載せています(※ 以下のデータは架空のデータです)。
番号 | 降圧剤投与前の血圧(収縮期血圧) |
1 | 141 |
2 | 148 |
3 | 72 |
4 | 152 |
5 | 168 |
6 | 172 |
7 | 137 |
8 | 146 |
9 | 149 |
10 | 150 |
11 | 146 |
12 | 132 |
13 | 141 |
14 | 157 |
15 | 136 |
16 | 190 |
17 | 142 |
18 | 139 |
19 | 131 |
20 | 147 |
皆さんもよく知っている代表的な記述平均として、平均値を出しましょう…
と言いたいところですが、丁寧にデータを見ていくにあたり、まずは収縮期血圧が異常な値の人はいなかったかと確認する必要があります。
でも、今のデータではゴチャゴチャしているので、スムーズに確認ができません。
単純に並び替えてもいいのですが、以下の様にグラフにすると色々とメリットがあります。
グラフにした結果、高血圧者を集めたはずなのに、最高血圧が71~80mmHgの範囲にいる人が1人いることが分かりました。
元の表のデータを見ると、確かに72mmhgと明らかに血圧が低い人がいることに気づきました。
このように、グラフを作ると直感的にデータを見ることができます。
正しい結果を出せない恐れがあるので、先ほどの男性のデータは削除しましょう。
改めて下記の様な最高血圧のグラフを作りました。
平均値を出したところ、148.6mmHgでした。
ただしグラフを見ると、181~190mmHgのように非常に収縮期血圧が高い人もいることが分かります。
平均値を出すことも大切ですが、グラフにするとこんなふうに細かいことにも気づくことができます。
このように、記述統計とは今あるそのデータの特徴を分かりやすく説明することです。
なお、グラフについてはカリキュラム②「2.色々なグラフ・表」で説明します。
テレビの視聴率のように一部の代表者のデータから全体の特徴をつかむ推測統計
一方推測統計とは、今あるデータから明らかにしたい大元の集団の特徴を推測する統計のことです。
例えば、視聴率で推測統計が使われています。
例えば関東地区には約2,000万世帯いますが、視聴率はランダムに選ばれた2,700世帯が見たテレビ番組を元に計算されます。
「" 2,700世帯のうちどのくらいの割合がそのテレビ番組を見たか "というのが、" 約2,000万世帯のテレビ番組を見た割合を反映している "」という考えがこの背景にあります。
もちろん、2,700世帯なんて2,000万世帯の0.014%ぐらいなので、(例えば)8%の視聴率だとしても実際には幅があります。
正確に視聴率を知ろうとすると、2,000万世帯すべてを対象に実際に見たテレビ番組を調べなければなりません。(つまり、記述統計ですね。)
でも、2,000万世帯が見たテレビ番組を調べるなんて不可能ですよね。
それで、ランダムに一部の人をピックアップして、その人たちの視聴データを取って推測することで、大元の関東地区全世帯の視聴率を知ろうとします。
なお、このピックアップされた一部は標本あるいはサンプル、大元の全体は母集団と呼ばれます。
今回の関東地区の視聴率でいうと、標本は2,700世帯、母集団は2,000万世帯となります。
仮説検定【何で推測統計するの?推測統計のメリット】
記述統計は平均とかだから分かりやすかったけど、推測統計の話になると急に何だか難しくなった…。
やっぱり統計を勉強するのは無理だ…。
確かに、記述統計と違って推測統計は簡単ではありません。
しかし、推測統計には記述統計にはできない「自分の考えが正しいものだと証明することができる」というメリットがあります。
例えば、新しく開発した降圧薬が高血圧の患者の血圧を下げるか検証したいシチュエーションを考えます。
この「降圧薬は血圧を下げる効果がある」という考え・主張のことを仮説と言います。
そして、仮説が正しいものか統計を使って明らかにすることを仮説検定と言います。
検証を行った結果、以下のような結果になったとします。
既存の薬を使用して降圧出来た血圧の値(mmHg) | 新薬を使用して降圧出来た血圧の値(mmHg) | |
1 | 5 | 11 |
2 | 12 | 15 |
3 | 15 | 14 |
4 | 9 | 19 |
5 | 7 | 12 |
6 | 1 | 5 |
7 | 0 | 7 |
8 | 8 | 23 |
9 | 22 | 19 |
10 | 11 | 20 |
11 | 4 | 14 |
12 | 5 | 13 |
13 | 6 | 7 |
14 | 7 | 5 |
15 | 9 | 16 |
16 | 8 | 13 |
17 | 15 | 25 |
18 | 14 | 18 |
19 | 18 | 17 |
20 | 6 | 8 |
既存の降圧剤を使用して下がった収縮期血圧の平均値が9.1mmHgで、新しい降圧剤を使って下がった収縮期血圧の平均値は14.1mmHgでした。
これは、新しい降圧剤は既存の薬より効果があると言えるでしょうか。
約5mmHgも下がったのだから降圧剤の効果はあると考える人もいるでしょう。
でも、5mmHgぐらいの差なら偶然下がったと考える人もいるでしょう。
この論争に決着をつけるのが推測統計です。
今回の例の場合なら、このように血圧が下がるのは何%の確率で起きるのかを計算できます。
一般的に5%よりも低い確率で起きるということが分かれば、そのような事態はめったに起きないことなので、降圧薬の効果はあったと結論づけることができます。
これからのカリキュラムでは色々な統計のお話をしていきます。
それらを使えば、例えば以下のことを明らかにすることができます。
様々な統計の種類の例
- t検定:新しい降圧薬は本当に役に立つのか
- 一要因の分散分析:ストレスが多い事は体にストレスがないのも悪い、ほどほどが一番
- 二要因の分散分析:身体的魅力と内面的魅力が好意度に 及ぼす影響の性差
- $χ$2 検定:時代劇で見るサイコロ博打はイカサマサではないのか。
- 相関分析:笑いは健康に良いのは科学的に本当か
- 回帰分析、重回帰分析:「自称」専門家ほど実は知ったかぶりするので注意!
参考文献
- 新しい降圧薬は本当に役に立つのか
- ヤーキーズ・ドットソンの法則(ストレスが中程度のほうが成績が良い)に準拠
- 他にも以下の様な研究があります。
- The effects of stress and stress hormones on human cognition: Implications for the field of brain and cognition
参考文献
- 「身体的魅力と内面的魅力が好意度に 及ぼす影響の性差」に準拠しています。
- 「ただしイケメンに限る」は本当なのか?という事を検証しています。
- これは "外見的魅力と内面的魅力が好感度に及ぼす影響" を検討した研究です。
- 尚、女性では 「
身体魅力 〇 内面魅力〇
>身体魅力 × 内面魅力 〇
」、「身体魅力 × 内面魅力 ×
>身体威力 〇 内面魅力 ×
」のように、「イケメンでも中身がダメなら好感度は低い」という結果でした(先行研究では、かっこいい人はうぬぼれやすいという「美しい者は自己中心ステレオタイプ」というのがあるそうです)。 - なお、男性では 「
身体魅力× 内面魅力×
」< 「それ以外
」というように、どこか魅力があれば好感度はそれなりにあるという結果でした。
参考文献
- 「笑いは健康に良いのは科学的に本当か」という研究です。
- ユーモア研究などで、よく話題になる内容です。
- 以下の参考文献です。
- Longitudinal Trends in Blood Pressure Associated with the Frequency of Laughter: Longitudinal Study of Japanese General Population: the Circulatory Risk in Communities Study (CIRCS)
参考文献
- 「自称」専門家ほど実は知ったかぶりするので注意。
- 以下参考文献です。
- When Knowledge Knows No Bounds: Self-Perceived Expertise Predicts Claims of Impossible Knowledge.
- オープンデータとして実験データが公表されているのでそれを使って具体的に説明しようと思います。
- 尚、以下のブログの「存在しない言葉なのに…」というところでも実験の概要が説明されています。
第1種の過誤と第2種の過誤【推測統計も万能ではない】
推測統計を行えば、仮説検定が行えます。
しかし、先ほどの新旧降圧薬の比較実験の例で「このように血圧が下がるのは何%の確率で起きるのかを計算できます」と述べたように、血圧が下がらない確率も当然あります。
このように、本当は効果がないのに、効果があると間違えてしまうことを第一種の過誤と言います。
「だったら、基準となる%の値をもっと小さなものにすればいい」と考える人もいるかもしれません。
そうすると今度は、本当は効果があるのに、効果がないと間違えてしまう第二種の過誤を犯してしまうことになるでしょう。
第一種の過誤と第二種の過誤は表にすると以下のようになります。
真実(神のみぞ知る) | |||
統計の結果 | 効果がある | 正しい | 第2種の過誤 |
効果がない | 第2種の過誤 | 正しい |
第一種の過誤と第二種の過誤はよく混同されがちです。
覚え方のコツとして、以下があります。
- うっかり第一種の過誤:本当は効果がないのに早とちりして「ある」と言ってしまう
- ぼんやり第二種の過誤:本当は効果があるのに見逃す
なお、統計の限界は第一種の過誤と第二種の過誤だけではありません。
「平均値を計算したり、グラフ・表を作るのが記述統計」でお話ししたように、そもそも入力したデータに誤りがあったら、統計の結果はおかしくなります。
そのため、記述統計よりも推測統計が優れているというので、推測統計だけをすればよいというわけではありません。
記述統計で丁寧にデータを見た上で推測統計を行うというのが正しいあり方です。
それでは、今まで学習した知識を確認する為に、簡単な練習問題で復習してみましょう。
練習問題
実験研究と観察研究の確認
(Q)以下の研究は実験研究と観察研究のどちらでしょうか?
- 新しい痛み止め薬の効果を既存の痛み止め薬よりも優れているか調べたい
- 新しい痛み止め薬の効果が頭や腹部などの痛む場所によって違うか調べたい
解答
- 実験研究が解答です。
- 観察研究は、頭や腹部など、痛む場所は研究者にはどうにもできないため。
説明変数と目的変数の確認
(Q) 以下の研究で、説明変数と目的変数は何でしょうか?
- スマホ使用時間が肩こりにどんな影響を及ぼしているか知りたい。
- 職場の騒音が頭痛とどう関係しているのか知りたい。
(A)
- 説明変数:スマホの使用時間 目的変数:肩こり
- 説明変数:職場の騒音 目的変数:頭痛
※ このレベルの知識は統計検定2級には出ませんが、これからの講座を読む上で前提となります。必ず理解しておきましょう。
推測統計の母集団と標本の関係
(Q) 以下のうち、母集団と標本は何でしょうか?
日本の小学6年生の学力を把握したいため、各都道府県の6年生計15クラスにテストを受けさせた。
- 母集団:日本の小学6年生
- 標本:各都道府県の6年生計15クラス
推測統計の母集団と標本の関係
(Q) 日本の小学6年生は以下の推論を行う場合、母集団と標本のどちらになりますか。
- 日本の小学6年生全員について推論を行う場合
- 世界中の小学6年生全員について推論を行う場合
- 母集団
- 標本
※ 母集団の場合は記述統計、標本の場合は推測統計になります。
第一種の過誤と第二種の過誤
(Q) 以下は、第一種の過誤と第二種の過誤のどちらでしょうか。
- 本当は男女で血圧に違いがあるのに、血圧に男女差はないと言ってしまった
- 本当は健康なのに、感染症検査で陽性と出てしまった
(A)
- 第二種の過誤
- 第一種の過誤
※ 2 の場合を偽陽性という言い方をします。
如何でしたでしょうか。
少しずつ統計学の知識を付けていきましょう。
今回は以上になります。