論文でよく使う統計手法!検定の選び方や一覧のまとめ

研究でデータ分析をする目的の1つに、測定したデータ間に有意差があるか調べることがあります。研究発表、論文を書く経験が少ない場合、どのように統計を使ったらいいのか判断に迷うかもしれません。

これから論文をはじめて書いたり、研究の入門として、よく使われる統計手法をまとめてみました。医学分野は、統計を学問として理解するというより、さらに実践的に使うこと多いのです。

パラメトリック検定とノンパラメトリック検定

統計で使うデータ(変数)の種類

統計で扱うデータにはさまざまな種類のものがあります。大きくは質的データと量的データに分かれます。質的データは性別「男,女」やアンケートの満足度「満足した,普通,不満だった」など、それ自体は分類(カテゴリー)で定性的な性質を示します。統計で処理する場合、これらのデータを名義的に数値化をし前者は「1,2」、後者は「1,2,3」と対応させます。一方、量的データはテストの点数、体重など数や量を示すものです。

質的データの名義尺度・順序尺度と量的データの間隔尺度・比例尺度

あらゆるデータとして数値の意味する性質を尺度(変数と呼ぶこともある)と呼びます。定性的である質的データは、名義尺度と順序尺度に分類されます。定量的うである量的データは間隔尺度と比例尺度に分類されます。

尺度の種類
名義尺度
(カテゴリカル尺度)
名称、種類など
順序尺度順位、病期
間隔尺度温度、テスト
比例尺度身長、体重、時間
名義尺度

単に同質・異質を決定するために名目的・名義的に名前を付けただけの特性。

順序尺度

大小関係のみ存在し、単に順序をつけただけの特性。
病期やn段階スコア(満足度)など、和や差の値に絶対的な意味を持たない。
中央値で評価できる(平均はNG)。

間隔尺度

大小関係が意味を持ち、かつ数値間の間隔(距離)が等しい特性。
和や差に意味がある。
比率は意味を持たない。(例えば10℃と20℃→2倍としない)

比例尺度

間隔尺度の性質に、絶対的な原点を加え持つ特性。
原点に意味を持つ。

身長や血圧など実際に測定した値など数量的データである「間隔尺度」と「比例尺度」の2つは統計的に同様に扱うので、間隔尺度か比例尺度か神経質になる必要はありません。

パラメトリックとノンパラメトリック

身長や水量などの量的変数(間隔尺度と比例尺度)でその分布が正規性をもつ場合、平均値や分散などのパラメータ(parameter)が意味を持ちます。このようなパラメータを用いた統計学をパラメトリック統計学(parametric statistics)と呼びます。一方、性別(男1,女2)や病期の程度(1,2,3)などの質的変数(名義尺度と順序尺度)では、その平均値が意味をもたず、異なるカテゴリーに属する人や者の数で構成され、これらのデータ処理にはノンパラメトリック統計学(nonparametric statistics)が使われます。

パラメトリックとノンパラメトリックの検定を以下にまとめておきます。

対応あり、なしを見極る方法として、標本内のデータが入れ替え可能かみると考えてみると良いです。入れ替えできる場合は「対応がない」データで、入れ替えると矛盾が生じる場合は、「対応がある」データです。

パラメトリック統計

解析するデータが2群なのか、3群以上かどうかで分かれます。

2群定
対応なし対応あり
F検定対応のあるt検定
(t検定: 1対の標本による平均の検定)
p>0.05(0.01)

スチューデントのt検定
(t検定: 等分散を仮定した2標本による検定)
p<0.05(0.01)

ウェルチのt検定
(t検定: 分散が等しくないと仮定した2標本による検定 )

3群以上
対応なし/対応あり
一元配置分散分析
二元配置分散分析
多元配置分散分析

2群のデータの関係に対応がある場合、対応のあるt検定(Paired t-test)を行います。対応なしの場合、F検定を行います。その結果によってスチューデントのt検定(Student t-test)を行うかウェルチのt検定(Welch’s t-test)を行うか決めます。

3群以上では上記検定を行い、有意差があればどのデータ群で差があるのか比較します(多重比較)。分散分析で分かるのははあくまで同じかそうでないかまでです。どの水準によるものかを調べるために多重比較をします。

ノンパラメトリック統計

ノンパラメトリック統計には、χ2検定(chi-square test)や符号検定、符号付き順位和検定(Wilcoxon検定)、順位相関検定、Mann-Whitney検定などがあります。

χ2検定は2つのデータ群の差やずれの有無を調べる適合度の検定、独立性の検定に用いられます。注意点としてこの検定は対象が名義変数であること、どれか1つのセルの期待度数が5より小さいとその検定は正確性を欠くことです。
2群
対応なし対応あり
マン・ホイットニーのU検定ウィルコクソンの符号付き順位検定

3群以上
対応なし対応あり
クラスカルウォリス検定フリードマン検定

3群以上では上記検定を行い、有意差があればどのデータ群で差があるのか比較します(多重比較)。

2値データの場合

0/1などの2値データの場合、2群ならマクネマー検定、3群ならコクランのQ検定を用います。マクネマー検定やコクランのQ検定は対応ありのデータを扱います。

対応なしの場合、クロス集計表を用いてχ2検定を用います。

まとめ

最後に、おおまかに理解できるように図にまとめました。

ANOVA(analysis of variance)は分散分析のことです。一元・二元・多元はデータに合わせて1つを選びます。


アンケート調査でよく使われるノンパラメトリック統計は、省略してます。
これから研究へ取り組む多くの方に、少しでも役立てば幸いです。

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする