space
フィッシャーの正確確率検定
space
QUMA (QUantification tool for Methylation Analysis) top spacer close
各CpGサイトについて、二つのバイサルファイト配列のグループ間で、 メチル化割合に違いがあるかどうかの統計的有意性は、 フィッシャーの正確確率検定 を用いて求めています。フィッシャーの正確確率検定は、 ノンパラメトリックな統計手法で、2つのカテゴリーのデータ間にランダムではない相関があるかを統計的に検定するための方法です。 基本的には、フィッシャーの正確確率検定はカイ二乗検定と同様に独立性の検定に用いることができますが、 CpGのメチル化解析のように、少ない数のメチル化または未メチル化のデータに対しては、 フィッシャーの正確確率検定の方が正確です。 データから2 x 2の分割表を作成した場合に、いずれかの升目の値が5以下ぐらいの小さい値の場合は、 カイ二乗検定は不適当です。カイ二乗検定では近似を用いていますが、フィッシャーの正確確率検定は 近似を用いていないため、フィッシャーの正確確率検定の方が(計算量は大きいですが)正確に検定する ことが可能です。サンプル数が十分に多い場合には、フィッシャーの正確確率検定とカイ二乗検定の 検定結果は同じになります。 フィッシャーの正確確率検定における両側検定でのP値は、下記に示すような 各CpGサイトのメチル化状態についての2 x 2の分割表から計算します。このP値は2つのグループ間での CpGのメチル化の状態が独立している(違いがある)かどうかを示すのに用います。
 list  CpGメチル化状態の2 x 2 の分割表の例
メチル化CpG 未メチル化CpG
グループ1 a b
グループ2 c d
a: あるCpGサイトにおけるグループ1でのメチル化CpGの数
b: あるCpGサイトにおけるグループ1での未メチル化CpGの数
c: あるCpGサイトにおけるグループ2でのメチル化CpGの数
d: あるCpGサイトにおけるグループ2での未メチル化CpGの数
実例として、表1のようなサンプルデータについて、まず、表2のように変換します。
表1 space 表2
CpGサイトの位置 375
メチル化CpG グループ1 12/13
92.3%
グループ2 4/10
40.0%
16/23
69.6%
メチル化CpG 未メチル化CpG
グループ1 12 1 13
グループ2 4 6 10
16 7 23
この事象の確率p は以下のように求められます:
p = a+bCa * c+dCc / a+b+c+dCa+c
   = 13C12 10C4 / 23C16 = (13! 10! 16! 7!) / (12! 1! 4! 6! 23!) = 0.0111357212
ここで、記号 ! は階乗を意味します。
周辺度数(2 x 2分割表の外側の、13, 10 ,16, 7)を固定したとき、全部で以下の9種類の組み合わせが考えられます。
a b c d |ad - bc| 確率p
6 7 10 0 70 0.0069995962
7 6 9 1 47 0.0699959618
8 5 8 2 24 0.2362363710
9 4 7 3 1 0.3499798089
10 3 6 4 22 0.2449858662
11 2 5 5 45 0.0801771926
12 1 4 6 68 0.0111357212
13 0 3 7 91 0.0004894823
これらの組み合わせのうち、"ad - bc"の絶対値がサンプルの事象での値(68)以下となる組み合わせについて、 その確率pを合計したものが両側検定でのP値になります。 この例では、a = 6, 12, 13の場合が該当し、両側検定でのP値は以下のように求まります。
P-value = 0.0069995962 + 0.0111357212 + 0.0004894823 = 0.0186257997
QUMA (QUantification tool for Methylation Analysis) top spacer close