医療統計学 木村 朗 オッズ比 vol.11 オッズ比とは • オッズ比(Odds Ratio)とは、 オッズ(Odds)の比のこと。 • オッズとは何? オッズは、ある事象の起きる確率(P)と起 きない確率(1-P)の比のこと。 確率は0%~100% つまり、0~1の範囲をとる 起きる確率をPとすると、起きない確率は1-P このときの、P / (1-P)がオッズ。 例)オッズ • ある事象が起きる確率が50%(0.5)とすると、起き ない確率は50%(1-0.5)になる。事象の起きる オッズは、0.5 / (1-0.5) = 1 。 • オッズが1になるということは、事象の起きる確率と 起きない確率が同じことを意味する。 練習問題 オッズ ある事象が起きる確率が80%(0.8)だったとすると、 オッズはいくつになるか? 事象の起きない確率は20%(1-0.8)、 オッズは、0.8 / (1-0.8) = 0.8 / 0.2 = 4 すなわち、オッズは4になり、これは起きる確率は 起きない確率の4倍であることを意味する。 オッズ比 オッズ比は、ある条件におけるオッズ 比のこと。 と別の条件におけるオッズの 例) • 男性において、事象の起きる確率が50%(0.5)だとする と、起きない確率は50%(1-0.5)。オッズは1(0.5/0.5)。 • 女性において、事象の起きる確率が75%(0.75)だとする と、起きない確率は25%(1-0.75)。オッズは3(0.75/ 0.25)。 • 事象が起きる確率について、男性のオッズが1、女性の オッズが3です。このときの比がオッズ比になります。 つまり、男性に対して女性のオッズは3倍になるとい うことで、「女性のほうが男性に対して3倍事象 が起きやすい」といえます。 練習 • 男性において、事象の起きる確率が30%(0.3)で あった。 • 女性において、事象の起きる確率が45%(0.45)で あった。 この事象について、女性が男性より生じ易い程度 について、オッズ比を求めて、その程度を示して下 さい。 オッズ比は医療データの解析に おいてよく利用される! このオッズは、2×2分割表(クロス集計表)における 解析や、ロジスティック回帰分析において計算しま すが、例えば、医療データ解析においてよく利用さ れ、「喫煙者は非喫煙者に対して、ある疾病のリス クが○○倍になる」などのような解釈に使われたり する。 注意!オッズ比とリスク比!! • オッズ比は死亡生存のように2値変数のアウトカムと研究 要因の相関の強さを示すMeasure of Associationです。 • 例えばタバコを吸うと心筋梗塞のリスクが50%で吸わない 人はその半分の25%だとします。 • リスク比は50%割る25%で2となり、タバコを吸うとリスクが 2倍になるといえます。 • この場合のオッズ比は3となり、オッズ比から結果を論じると、 喫煙で心筋梗塞のリスクが3倍になったという間違った結果 を導いてしまいます。 • 臨床研究では2値変数のアウトカムではオッズ比を用いる ことが多く、リスク比を使うことは珍しいのです。 • 2値変数のアウトカムの解析に必ずと言っていいほど使わ れるロジスティック回帰モデルは結果はオッズ比を用いて 表します。 • リスク比をオッズ比に変えるにはコントロール群 (暴露のない群)でのイベント率が必要です。 • たとえばそのイベント率が1%と50%ではオッズ比 が10の時、リスク比は9,と1.8となりかなり変わって きます。 ○○オッズが3倍になったと表現する。 有意差があった。そのオッズ比はXX(LL~HH)であった。 名義尺度の相関 • データが名義尺度の時について説明しましょう。 表5.1のデータを8cm未満と8cm以上の2種類に分 類し、名義尺度にしてみましょう。 マウスの体長分類と尾長分類 体長分類 \尾長分 類 8cm未満 8cm以上 計 8cm未満 4 0 4 8cm以上 2 5 7 計 6 5 11 • 名義尺度のデータでは一般に分類間に大小関係はない ので、今までのような意味での相関関係はあり得ません。 しかし2つの分類の間に何らかの関連性があり、一方の 分類が他方の分類に影響を与えるということは考えられ ます。 上の表でいいますと、体長と尾長の間に正の相関 性があれば両者が同じ分類になるようなマウスが多くな り、左上と右下のカラムの例数が増えると思われます。 もう少し一般化していいますと、縦または横の分類ごとに ながめた時、横または縦の分類パターン(表では「4-0」 と「2-5」)に違いがあることになります。 • このような関連性を要約する値としては、χ2値があります。 しかしχ2値は例数と自由度によって最大値が異なり、値 を比較するのに不便です。 そこで総例数をNとし、縦と横 の分類数のうち小さい方の値をsとして、 θ2=R2= χ o2 ―――― N(s-1) • と、総例数と自由度で割った値を用います。 この 値を「クラメール(Cramer)の連関係数(coefficient of contingency)」と呼びますが、実はχ2検定における 寄与率R2に他なりません。 • データが2×2分割表の時は自由度が1になります ので、次のようにχ2値を総例数Nで割るだけになり ます。 θ2=R2= χo2 ――― N =φ2 • この値の平方根を特に「φ(ファイ)係数」または「4分点相 関係数」と呼び、心理学の分野でよく用いられています。 また当然のことながら、χ2検定を利用して連関係数につ いての検定を行なうことができます。 • しかし、この検定に実質的な意味はほとんどありません。 また順序尺度のデータと違って名義尺度のデータは計 量尺度のデータとして扱うことはできないので、回帰分 析を適用することはできません。 重要!但し、似ているがオッズ 比の検定では効果を発揮する ので、勘違いしないように • 表のデータについて実際に計算すると次のようになりま す。 • θ2=φ2=0.476(47.6%) θ=φ=0.690 χo2=2.753(p=0.0971)<χ2(1,0.05)=3.841…有意水 準5%で有意ではない • 以上のように検定結果は有意ではありませんが、連関 係数が50%近くありますので、体長と尾長の分類間に は関連があるかもしれないと考えておいた方が良いで しょう。 • 2×2分割表において2種類の分類間の関連性を表す 指標としては、φ係数の他にオッズ比ORがあります。 この値は関連性が全くない時は1になり、関連性があ る時は1未満または1よりも大きくなります。 ただしφ係 数のように上下限が決まっているわけではないので、 関連性の程度を表す指標としてはφ係数ほど便利では ありません。 またこの値は比に基づいているので、 データの中に0のものがあると計算できなかったり、関 連性を的確に表さなかったりすることがあります。 表 データについて実際に計算すると次のようになります。 • OR=19.8 χo2=3.179(p=0.0745)< χ2(1,0.05)=3.841…有意水準5%で有 意ではない 参考 オッズ比の復習 正常人10例と慢性肝炎患者10例のGOT GOT 正常 異常 計 正常群 5 5 10 慢性肝炎群 1 9 10 計 6 14 20 このように2群のデータを2種類に分類したものを、「2×2分割表」また は「4分表」と呼びます。 縦と横の分類は群や正常・異常だけではなく どんな分類法でもかまわず、統計学ではよく利用される表です。 この 場合、両群合わせた正常率と異常率は、 正常率:1-p1= 異常率:p1= 6 ―― 20 14 ―― 20 =0.3 =0.7 Chi二乗の復習も・・・ • ですから、もし正常人と慢性肝炎患者のGOTが等 しく、同じ割合で正常と異常が発生 するのなら、理論的には次表のよ うな結果になるはずです。 理論度数 GOT 正常 異常 計 正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 • この理論度数と実際の例数つまり実現度数とのく い違いを利用すれば、両群の母集団における正 常例・異常例の発生率が等しいかどうかを検定す ることができます。 その手法を「フィッシャーの正 確検定(Fisher's exact test)」または「フィッシャーの 直接確率計算法による検定」といい、二項検定と 同じように、t値のような検定統計量を用いずに有 意確率p値を直接計算することができます。 実現度数と理論度数のくい違いを平方し、それを理論度数で割った値を合 計して検定統計量χo2値とします。 m×n分割表における度数の自由度は (m-1)×(n-1)になります • 正常人群と慢性肝炎群のGOT異常率をそれぞれ πN、πHとしますと、この場合の帰無仮説は、 H0:πH=πN(≒p1=0.7) または、 H0:πH-πN=δ=δ0=0 • と表すことができます。 有意水準5%として例題に ついて計算すると、次のような結果になります。 •正常群の異常率:pN1= 5 ― 10 =0.5 (50%) 慢性肝炎群の異常率 :pH1= 9 ―― 10 =0.9 (90%) • 検定: • p=0.1409>0.05…有意水準5%で有意ではない • 実現度数と理論度数のくい違いは、計量値でいえば個々のデー タと平均との偏差に相当します。 そこでそのくい違いを平方し、 理論度数で割って1理論度数当りのくい違い量とした値はちょう ど分散のようなものに相当し、それによって実現度数と理論度数 のくい違いの大きさを要約することができます。 その値を各度数 ごとに計算して合計したものを「χ2(カイジジョウ)値」といい、この 値はくい違いが大きくなるほど大きな値になり、くい違いがなけ れば0になります。 • したがってこのχ2値は、有意確率p値すなわち「実現度数と理論 度数のくい違いはない」という帰無仮説が正しい確率と反比例的 な関係があることになり、t値と同じように検定統計量として利用 することができます。 このχ2値を用いてフィッシャーの正確検定 を行う手法を「2×2のχ2検定」といい、フィッシャーの正確検定を 正規近似した手法に相当します。 • 分割表における縦と横の合計度数のことを「周辺度数」といい、 周辺度数を変化させないで、自由に値を変えられる度数の個数 を「自由度」といいます。 例えば表3.17では10、10、6、14が周辺 度数であり、5、5、1、9の度数のうちどれか1つを変化させますと、 周辺度数を変えないためには他の3つの値を変えなければなり ません。 つまり1つの度数は自由に値を変えられますが、他の3 つの値は自動的に決まってしまいます。 したがって2×2分割表 における度数の自由度は1になります。 • t検定と同様にχ2検定でも、実験結果のχ2値からp値を求めて有 意水準と比べる代わりに、p値がちょうど有意水準と等しくなる時 のχ2値と実験結果のχ2値を比べることができます。 その基準の χ2値は度数の自由度によって違い、当然、自由度が増えるほど 大きな値になります。 自由度がφの時の基準のχ2値のことを「自 由度φのχ2分布における100・α%点」といい、「χ2(φ,α)」と書きま す。 この値は統計の教科書などに載っていて、 • Χ2(1,0.05)=3.841 χ2(1,0.01)=6.635 • χ2(2,0.05)=5.991 χ2(2,0.01)=9.210 などがよく使われます。 またt値とχ2値の間には次のよ うな関係があります。 χ2(1,α)={t(∞,α)}2 • 2×2のχ2検定に用いられるのは自由度が1の時のも ので、実験結果から求められたχ2値をχo2と書きますと、 • χo2≧χ2(1,α)の時有意水準100・α%で有意 となります。 有意水準5%、信頼係数95%として例題に ついて計算しますと次のようになります。 χo2=2.143(p=0.1432)<χ2(1,0.05)=3.841…有意水準5% で有意ではない δ(両群の母異常率の差)の95%信頼区間:下限δL=-0.06 上限δU=0.86 • 2×2のχ2検定と同じような原理を利用しているも のの、正確検定に対する近似法が若干異なったも のに「マンテル・ヘンツェル(Mantel-Haenszel)の検 定」と呼ばれる手法があります。 この手法は2×2 のχ2検定よりわずかに小さいχ2値が得られ、χ2検 定よりも一般性があるので生命表解析など色々な 場面で利用されます。 これは2×2分割表のデータ を順位が2つだけの順序分類尺度と考えて、ウィ ルコクソンの2標本検定を適用したものと本質的に 同一の手法です • 横の分類数が2つ以上の時にもフィッシャーの正確検 定と同じような原理を利用した同じような手法が適用 でき、2群における分類パターンの違いを検討すること ができます。 この場合、正確検定は非常に計算が複 雑になるため、一般にはχ2検定が用いられます。 群 が2つで分類数がnの時のχ2検定を「2×nのχ2検定」と 呼び、さらに一般化して群がmで分類数がnの時のχ2 検定を「m×nのχ2検定」と呼びます。 • どれも原理は2×2の時と同じで、実現度数と理論度数 のくい違いを平方し、それを理論度数で割った値を合 計して検定統計量χo2値とします。 m×n分割表におけ る度数の自由度は(m-1)×(n-1)になりますので、検定 は、 • 自由度φ=(m-1)×(n-1) • χo2≧χ2(φ,α)の時有意水準100・α%で有意 「有意ではない」ということは「データの信頼性が低いか ら結論を保留する」という意味であって、「差がない」もし くは「同等である」などという意味では決してありません。 したがって、検定結果が統計的に有意ではないからと いって同等性を証明したことにはならず、あくまでも実 験結果を実質科学的に考察し、両群の差が実質科学 的には無視できる程度で両群がほぼ同等と考えられる 時、初めて同等性を証明したことになります。
© Copyright 2025 Paperzz