医療統計学 vol.11

医療統計学
木村 朗
オッズ比
vol.11
オッズ比とは
• オッズ比(Odds Ratio)とは、
オッズ(Odds)の比のこと。
• オッズとは何?
オッズは、ある事象の起きる確率(P)と起
きない確率(1-P)の比のこと。
確率は0%~100%
つまり、0~1の範囲をとる
起きる確率をPとすると、起きない確率は1-P
このときの、P / (1-P)がオッズ。
例)オッズ
• ある事象が起きる確率が50%(0.5)とすると、起き
ない確率は50%(1-0.5)になる。事象の起きる
オッズは、0.5 / (1-0.5) = 1 。
• オッズが1になるということは、事象の起きる確率と
起きない確率が同じことを意味する。
練習問題 オッズ
ある事象が起きる確率が80%(0.8)だったとすると、
オッズはいくつになるか?
事象の起きない確率は20%(1-0.8)、
オッズは、0.8 / (1-0.8) = 0.8 / 0.2 = 4
すなわち、オッズは4になり、これは起きる確率は
起きない確率の4倍であることを意味する。
オッズ比
オッズ比は、ある条件におけるオッズ
比のこと。
と別の条件におけるオッズの
例)
• 男性において、事象の起きる確率が50%(0.5)だとする
と、起きない確率は50%(1-0.5)。オッズは1(0.5/0.5)。
• 女性において、事象の起きる確率が75%(0.75)だとする
と、起きない確率は25%(1-0.75)。オッズは3(0.75/
0.25)。
• 事象が起きる確率について、男性のオッズが1、女性の
オッズが3です。このときの比がオッズ比になります。
つまり、男性に対して女性のオッズは3倍になるとい
うことで、「女性のほうが男性に対して3倍事象
が起きやすい」といえます。
練習
• 男性において、事象の起きる確率が30%(0.3)で
あった。
• 女性において、事象の起きる確率が45%(0.45)で
あった。
この事象について、女性が男性より生じ易い程度
について、オッズ比を求めて、その程度を示して下
さい。
オッズ比は医療データの解析に
おいてよく利用される!
このオッズは、2×2分割表(クロス集計表)における
解析や、ロジスティック回帰分析において計算しま
すが、例えば、医療データ解析においてよく利用さ
れ、「喫煙者は非喫煙者に対して、ある疾病のリス
クが○○倍になる」などのような解釈に使われたり
する。
注意!オッズ比とリスク比!!
• オッズ比は死亡生存のように2値変数のアウトカムと研究
要因の相関の強さを示すMeasure of Associationです。
• 例えばタバコを吸うと心筋梗塞のリスクが50%で吸わない
人はその半分の25%だとします。
• リスク比は50%割る25%で2となり、タバコを吸うとリスクが
2倍になるといえます。
• この場合のオッズ比は3となり、オッズ比から結果を論じると、
喫煙で心筋梗塞のリスクが3倍になったという間違った結果
を導いてしまいます。
• 臨床研究では2値変数のアウトカムではオッズ比を用いる
ことが多く、リスク比を使うことは珍しいのです。
• 2値変数のアウトカムの解析に必ずと言っていいほど使わ
れるロジスティック回帰モデルは結果はオッズ比を用いて
表します。
• リスク比をオッズ比に変えるにはコントロール群
(暴露のない群)でのイベント率が必要です。
• たとえばそのイベント率が1%と50%ではオッズ比
が10の時、リスク比は9,と1.8となりかなり変わって
きます。
○○オッズが3倍になったと表現する。
有意差があった。そのオッズ比はXX(LL~HH)であった。
名義尺度の相関
• データが名義尺度の時について説明しましょう。
表5.1のデータを8cm未満と8cm以上の2種類に分
類し、名義尺度にしてみましょう。
マウスの体長分類と尾長分類
体長分類
\尾長分
類
8cm未満
8cm以上
計
8cm未満
4
0
4
8cm以上
2
5
7
計
6
5
11
• 名義尺度のデータでは一般に分類間に大小関係はない
ので、今までのような意味での相関関係はあり得ません。
しかし2つの分類の間に何らかの関連性があり、一方の
分類が他方の分類に影響を与えるということは考えられ
ます。 上の表でいいますと、体長と尾長の間に正の相関
性があれば両者が同じ分類になるようなマウスが多くな
り、左上と右下のカラムの例数が増えると思われます。
もう少し一般化していいますと、縦または横の分類ごとに
ながめた時、横または縦の分類パターン(表では「4-0」
と「2-5」)に違いがあることになります。
• このような関連性を要約する値としては、χ2値があります。
しかしχ2値は例数と自由度によって最大値が異なり、値
を比較するのに不便です。 そこで総例数をNとし、縦と横
の分類数のうち小さい方の値をsとして、
θ2=R2=
χ o2
――――
N(s-1)
• と、総例数と自由度で割った値を用います。 この
値を「クラメール(Cramer)の連関係数(coefficient of
contingency)」と呼びますが、実はχ2検定における
寄与率R2に他なりません。
• データが2×2分割表の時は自由度が1になります
ので、次のようにχ2値を総例数Nで割るだけになり
ます。
θ2=R2=
χo2
―――
N
=φ2
• この値の平方根を特に「φ(ファイ)係数」または「4分点相
関係数」と呼び、心理学の分野でよく用いられています。
また当然のことながら、χ2検定を利用して連関係数につ
いての検定を行なうことができます。
• しかし、この検定に実質的な意味はほとんどありません。
また順序尺度のデータと違って名義尺度のデータは計
量尺度のデータとして扱うことはできないので、回帰分
析を適用することはできません。
重要!但し、似ているがオッズ
比の検定では効果を発揮する
ので、勘違いしないように
• 表のデータについて実際に計算すると次のようになりま
す。
• θ2=φ2=0.476(47.6%)
θ=φ=0.690
χo2=2.753(p=0.0971)<χ2(1,0.05)=3.841…有意水
準5%で有意ではない
• 以上のように検定結果は有意ではありませんが、連関
係数が50%近くありますので、体長と尾長の分類間に
は関連があるかもしれないと考えておいた方が良いで
しょう。
• 2×2分割表において2種類の分類間の関連性を表す
指標としては、φ係数の他にオッズ比ORがあります。
この値は関連性が全くない時は1になり、関連性があ
る時は1未満または1よりも大きくなります。 ただしφ係
数のように上下限が決まっているわけではないので、
関連性の程度を表す指標としてはφ係数ほど便利では
ありません。 またこの値は比に基づいているので、
データの中に0のものがあると計算できなかったり、関
連性を的確に表さなかったりすることがあります。 表
データについて実際に計算すると次のようになります。
• OR=19.8
χo2=3.179(p=0.0745)<
χ2(1,0.05)=3.841…有意水準5%で有
意ではない
参考 オッズ比の復習
正常人10例と慢性肝炎患者10例のGOT
GOT
正常
異常
計
正常群
5
5
10
慢性肝炎群
1
9
10
計
6
14
20
このように2群のデータを2種類に分類したものを、「2×2分割表」また
は「4分表」と呼びます。 縦と横の分類は群や正常・異常だけではなく
どんな分類法でもかまわず、統計学ではよく利用される表です。 この
場合、両群合わせた正常率と異常率は、
正常率:1-p1=
異常率:p1=
6
――
20
14
――
20
=0.3
=0.7
Chi二乗の復習も・・・
• ですから、もし正常人と慢性肝炎患者のGOTが等
しく、同じ割合で正常と異常が発生
するのなら、理論的には次表のよ
うな結果になるはずです。
理論度数
GOT
正常
異常
計
正常群
3
7
10
慢性肝炎
群
3
7
10
計
6
14
20
• この理論度数と実際の例数つまり実現度数とのく
い違いを利用すれば、両群の母集団における正
常例・異常例の発生率が等しいかどうかを検定す
ることができます。 その手法を「フィッシャーの正
確検定(Fisher's exact test)」または「フィッシャーの
直接確率計算法による検定」といい、二項検定と
同じように、t値のような検定統計量を用いずに有
意確率p値を直接計算することができます。
実現度数と理論度数のくい違いを平方し、それを理論度数で割った値を合
計して検定統計量χo2値とします。 m×n分割表における度数の自由度は
(m-1)×(n-1)になります
• 正常人群と慢性肝炎群のGOT異常率をそれぞれ
πN、πHとしますと、この場合の帰無仮説は、
H0:πH=πN(≒p1=0.7)
または、
H0:πH-πN=δ=δ0=0
• と表すことができます。 有意水準5%として例題に
ついて計算すると、次のような結果になります。
•正常群の異常率:pN1=
5
―
10
=0.5 (50%)
慢性肝炎群の異常率
:pH1=
9
――
10
=0.9 (90%)
• 検定:
• p=0.1409>0.05…有意水準5%で有意ではない
• 実現度数と理論度数のくい違いは、計量値でいえば個々のデー
タと平均との偏差に相当します。 そこでそのくい違いを平方し、
理論度数で割って1理論度数当りのくい違い量とした値はちょう
ど分散のようなものに相当し、それによって実現度数と理論度数
のくい違いの大きさを要約することができます。 その値を各度数
ごとに計算して合計したものを「χ2(カイジジョウ)値」といい、この
値はくい違いが大きくなるほど大きな値になり、くい違いがなけ
れば0になります。
• したがってこのχ2値は、有意確率p値すなわち「実現度数と理論
度数のくい違いはない」という帰無仮説が正しい確率と反比例的
な関係があることになり、t値と同じように検定統計量として利用
することができます。 このχ2値を用いてフィッシャーの正確検定
を行う手法を「2×2のχ2検定」といい、フィッシャーの正確検定を
正規近似した手法に相当します。
• 分割表における縦と横の合計度数のことを「周辺度数」といい、
周辺度数を変化させないで、自由に値を変えられる度数の個数
を「自由度」といいます。 例えば表3.17では10、10、6、14が周辺
度数であり、5、5、1、9の度数のうちどれか1つを変化させますと、
周辺度数を変えないためには他の3つの値を変えなければなり
ません。 つまり1つの度数は自由に値を変えられますが、他の3
つの値は自動的に決まってしまいます。 したがって2×2分割表
における度数の自由度は1になります。
• t検定と同様にχ2検定でも、実験結果のχ2値からp値を求めて有
意水準と比べる代わりに、p値がちょうど有意水準と等しくなる時
のχ2値と実験結果のχ2値を比べることができます。 その基準の
χ2値は度数の自由度によって違い、当然、自由度が増えるほど
大きな値になります。 自由度がφの時の基準のχ2値のことを「自
由度φのχ2分布における100・α%点」といい、「χ2(φ,α)」と書きま
す。 この値は統計の教科書などに載っていて、
• Χ2(1,0.05)=3.841
χ2(1,0.01)=6.635
• χ2(2,0.05)=5.991
χ2(2,0.01)=9.210
などがよく使われます。 またt値とχ2値の間には次のよ
うな関係があります。
χ2(1,α)={t(∞,α)}2
• 2×2のχ2検定に用いられるのは自由度が1の時のも
ので、実験結果から求められたχ2値をχo2と書きますと、
• χo2≧χ2(1,α)の時有意水準100・α%で有意
となります。 有意水準5%、信頼係数95%として例題に
ついて計算しますと次のようになります。
χo2=2.143(p=0.1432)<χ2(1,0.05)=3.841…有意水準5%
で有意ではない
δ(両群の母異常率の差)の95%信頼区間:下限δL=-0.06
上限δU=0.86
• 2×2のχ2検定と同じような原理を利用しているも
のの、正確検定に対する近似法が若干異なったも
のに「マンテル・ヘンツェル(Mantel-Haenszel)の検
定」と呼ばれる手法があります。 この手法は2×2
のχ2検定よりわずかに小さいχ2値が得られ、χ2検
定よりも一般性があるので生命表解析など色々な
場面で利用されます。 これは2×2分割表のデータ
を順位が2つだけの順序分類尺度と考えて、ウィ
ルコクソンの2標本検定を適用したものと本質的に
同一の手法です
• 横の分類数が2つ以上の時にもフィッシャーの正確検
定と同じような原理を利用した同じような手法が適用
でき、2群における分類パターンの違いを検討すること
ができます。 この場合、正確検定は非常に計算が複
雑になるため、一般にはχ2検定が用いられます。 群
が2つで分類数がnの時のχ2検定を「2×nのχ2検定」と
呼び、さらに一般化して群がmで分類数がnの時のχ2
検定を「m×nのχ2検定」と呼びます。
• どれも原理は2×2の時と同じで、実現度数と理論度数
のくい違いを平方し、それを理論度数で割った値を合
計して検定統計量χo2値とします。 m×n分割表におけ
る度数の自由度は(m-1)×(n-1)になりますので、検定
は、
• 自由度φ=(m-1)×(n-1)
• χo2≧χ2(φ,α)の時有意水準100・α%で有意
「有意ではない」ということは「データの信頼性が低いか
ら結論を保留する」という意味であって、「差がない」もし
くは「同等である」などという意味では決してありません。
したがって、検定結果が統計的に有意ではないからと
いって同等性を証明したことにはならず、あくまでも実
験結果を実質科学的に考察し、両群の差が実質科学
的には無視できる程度で両群がほぼ同等と考えられる
時、初めて同等性を証明したことになります。