トップページ

 新着記事

AI

2023/4/16

説明可能なAIとは|Explainable AIについて学ぶべきこと

Explainable AI(説明可能なAI)は、AIシステムがどのように意思決定を行っているのか、人間が理解しやすい形で説明する技術です。AIについて知らない方向けに、Explainable AIについて学ぶべき項目を優先順位に基づいてリスト化してみました。   AIと機械学習の基本:AIと機械学習の基本的な概念を理解することで、Explainable AIがどのような目的で必要とされるのかを把握します。 黒箱問題:AIシステムがどのように意思決定を行っているかが不透明な「黒箱問題」について学 ...

続きを読む

R データフレーム 使い方 考え方

R

2023/4/16

Rによるデータフレームの計算チュートリアル

こんにちは。産婦人科医のtommyです。(Twitter:@obgyntommy)   本記事ではRを用いたデータフレームの計算チュートリアルを行います。   対象としては、Rに全く触れたことのない方やRの学習初心者の方向けになります。   非常に簡単な四則演算の内容になりますが、RStudioを用意して実際に手を動かしてみてください。   RStudioを手軽にセットアップするにはRStudio Cloudが便利です。詳しい内容は以下を参照してください。 &nbs ...

続きを読む

説明可能なAI LIME SHAP

AI

2023/4/16

LIMEとSHAPの具体的な使い方と実装方法について

こんにちは。産婦人科医のとみー(Twitter:@obgyntommy)といいます。   私はふだんは産婦人科の臨床に携わりつつ、画像系の機械学習の研究をしています。   研究の過程で「説明可能なAI」について学習し、"LIMEやSHAP"について使い方や実装方法などをまとめました。   以下に「説明可能なAI」について分かりやすい記事がありましたので、ご紹介させて頂きます。 説明可能なAIとは、米国のDARPAの研究が発端の概念で、モデルの予測が人間に理解可能であり、十分信 ...

続きを読む

R データフレーム 使い方 考え方

R

2021/11/20

Rのデータフレームについて

こんにちは。産婦人科医のtommyです。(Twitter:@obgyntommy)   本記事では基本的なRのオブジェクトについて解説します。   対象としては全くRに触れたことのない方に向けになります。   非常に簡単な四則演算の内容になりますが、R Studioを用意して実際に手を動かしてみてください。   R Studioを手軽にセットアップするには RStudio Cloud が便利です。詳しい内容は以下を参照してください。     R ...

続きを読む

AWSにおけるcloud9の環境構築と使い方【完全マニュアル】

プログラミング 環境構築

2021/11/15

AWSにおけるcloud9の環境構築と使い方【完全マニュアル】

こんにちは。産婦人科医で人工知能を研究している、とみー(Twitter:@obgyntommy)です。   この記事では AWSにおけるcloud9 の使い方について基本から応用まで詳しく解説していきます。   プログラミング学習において最初に行うべきことは、実行する環境構築です。   環境構築の1つとして、Google Colaboratory を使用する方法もあるのですが、AWSも良質なクラウドサービスです。   AWSにおけるcloud9の環境構築と使い方につ ...

続きを読む

U-net semantic segmentation セグメンテーション AI 機械学習

AI

2021/11/15

U-netの使い方と実装方法について【PytorchによるSemantic segmentation】

こんにちは。産婦人科医のとみー(Twitter:@obgyntommy)といいます。   私は普段は画像系の機械学習の研究をしています。   研究の過程で Semantic segmentation を学習し、"U-net"についてまとめました。   U-netはFCN(fully convolution network)の1つであり、画像のセグメンテーション(物体がどこにあるか)を推定するためのネットワークです。   この記事の対象者は機械学習の初学者〜中級者の方 ...

続きを読む

回帰分析 練習問題

統計学入門

2021/11/7

回帰分析の練習問題

この記事では回帰分析の基本を理解して頂いてから、知識を確認するための練習問題(統計検定2級レベル)となります。 まずは以下の記事を読んで見て下さい。 それでは理解がまとまったところで、問題に移りましょう。   ① 単回帰分析の確認 【前提】 各都道府県の直近1週間の人口10万人あたりの、ある感染症の感染者数と2回目のワクチン接種率のデータを用いて、次の単回帰モデルを推定しました。 直近1週間の人口10万人あたりの$ 感染者数 = a+b×2回目のワクチン接種率+ u(誤差)$  とします。 なお ...

続きを読む

層別解析 傾向スコアマッチング

統計学入門

2021/9/18

層別解析の基本から演習まで|傾向スコアマッチングも解説

この記事では傾向スコアマッチングについて主に解説させて頂きます。 記事を読むだけだと理解が深まりにくいかもしれませんので、傾向スコアマッチングの理解を深めるために有益な動画(京都大学大学院の授業の一部)を紹介します。   動画を見て、ある程度理解出来たところで、記事にて復習しましょう。 層別解析とは何か? 講座⑩相関分析で説明した通り、対象者の性質(性別、年代、行動習慣など)によってデータの分布が異なることがあります。 例えば、労働政策研究・研修機構が2021年3月に発表した「就業者のライフキャ ...

続きを読む

相関分析について

統計学入門

2021/9/19

相関分析について

この記事では相関分析について、初心者の方向けに詳しく解説します。 ここで、まず量的データについて解説します。   枚数、身長、金額など、数値で推し測ることができ、数字の大小に意味をもつデータです。 人数、回数など、整数として表現されるデータで、一般的に連続して測ることができないデータ例)人数を数える時、1人の次は一般的に2人であり、1.00……001人とは数えない。 » データ・データセットの種類-総務省統計局より引用   ここで量的データの分析は、以下のように大きくは2つに分けること ...

続きを読む

回帰分析について

統計学入門

2021/10/30

回帰分析について

この記事では以下の相関分析に続いて、同じく関係性の分析の1つである回帰分析を解説します。   「回帰」とは、一般的には「元の場所や状態に戻ること」を意味する言葉ですが、統計学では「因果関係」を意味します。 変数 $y$ に対して変数xがどのように影響を及ぼしているのかを明らかにする、つまりデータの動きを予測する分析が、回帰分析です。 相関分析では1対1の変数同士の関連しか見れませんでしたが、回帰分析では1つの変数 $y$ に対して複数の変数 $x$ がどのように影響を及ぼしているかを調べることが ...

続きを読む

分散分析 練習問題

統計学入門

2021/9/20

分散分析の練習問題

この記事では分散分析を理解して頂いてから、練習として解くための練習問題となります。 上記の記事と以下の動画を視聴した上で、分散分析についての理解を深めていきましょう。       それでは理解がまとまったところで、問題に移りましょう。 ① 分散分析の基礎知識 【問題】以下の3つの文章について正誤判断してください。 分散分析では、全体のデータの散らばりは、条件による散らばりと偶然誤差による散らばりの和からなる。 分散分析における対立仮説は「全ての条件群の母平均は異なっている」で ...

続きを読む

χ2検定について

統計学 統計学入門

2021/4/30

χ2(カイ)検定について

この記事では χ2分布、母分散の区間推定、クロス集計表の適合度検定について解説させて頂きます。   実験や調査を行ってデータを集めるというと、血圧のように数値で表せる量的データをイメージされるかもしれません。   しかし、数値では表せないデータを集めることもあります。   例えば、年代ごとのコロナ感染者数を調べる場合、各感染者のデータは「20代」や「40代」となります。   例えば、2021年4月23日の東京都における年代ごとのコロナ感染者数を表にすると、以下のよう ...

続きを読む

2要因の分散分析  二元配置分散分析 

統計学入門

2021/5/3

2要因の分散分析(二元配置分散分析)について

調査や実験を行うとき、独立変数が2要因以上になることもあります。   この際に重要となってくるのが、「実験計画と、2つの条件群の平均値を比較する分散分析(2要因の(二元配置)分散分析)」です。   独立変数が2要因、3要因の場合は、1要因だけの場合と異なり、相乗効果のように要因が組み合わさることで見られる影響も出てきます。   また、1要因のときは各水準を無作為の順序で実験すればよかったですが、2要因以上になると、実験を行う順序もしっかり考えなければなりません。   ...

続きを読む

統計 初心者 統計検定2級 t検定

統計学入門

2021/3/18

t検定とは【2つの条件・群の平均値を比較する検定】

こんにちは。産婦人科医のとみー(Twitter:@obgyntommy)です。   統計とは少し話が逸れますが、医学の領域では常により良い治療法が探求されています。(もちろん、他の分野もそうです。)   新しい治療方法が本当に有効かを確認するには、従来の治療方法と新しい治療方法を比較して評価するのが、最も直感的に理解しやすいです。(※ 本当はこんな簡単なものではないのですが、カンタンに言うと、です。)   この2つの条件の比較で最も利用される統計手法が、t検定です。 &nbs ...

続きを読む

統計 初心者 2級 一元配置 分散分析

統計学入門

2021/3/14

一元配置の分散分析について

実験を行うとき、2つの条件群しか設定しないということは、それほど多くありません。   例えば、新しい降圧薬の効果を調べる場合には、新しい降圧薬を飲む条件と薬を飲まない条件、それからプラセボ条件の3つの条件を設けることもあります。   ここで出てくるのが、3つ以上の条件群の平均値を比較する分散分析になります。   このような3つ以上の条件群の平均値を比較する際に使われるのが分散分析です。   この記事では、1要因の分散分析について詳しく見ていきます。   な ...

続きを読む

 人気記事
本サイトについて

Copyright© Tommy blog  , 2024 All Rights Reserved.