StatMateによる検出力分析例
一番簡単に標準サイズ計算を理解するため、実例を通して学んでみましょう。使用する例は20年前に処理したプロジェクトです。次の例においては、現実に得られた結果を理解するための強力な分析方法を使用します。
※ この例では、StatMateを使用する力学ではなくサンプル・サイズ計算の後ろのロジックを強調します。
標本サイズ分析の背景
血小板(凝結させる血液中の小さなセル)はalpha2-アドレナリン受容体を持っています。血液中のエピネフリン(アドレナリン)は、これらの受容器に拘束しており凝血を支援して集合します。アドレナリン作用の信号システムは高血圧症において異常かもしれないという多くの証拠があります。心臓、血管、腎臓および脳などの組織に、簡単にアクセスすることはできませんでした。代わりに、血小板上のalpha2-アドレナリン受容体の数を数えて、人々を高血圧症と、高血圧症なしで比較することを決定しました。
どれだけの科目を使用すべきでしょうか。
20年前にこの研究を行った時、多かれ少なかれ気まぐれで標本サイズを取りました。しかし、適切な標本サイズ分析を行うべきでした。ここでは、StatMateで適切な標本サイズを行う方法を示します。
Step 1: 分析の種類を選びます
ステップ1では、2つの質問に答え、StatMateが分析する種類を選びます:
・ 分析のゴールは?
この例で、新しい研究のために標本サイズを計算します。その後、完成した実験の検出力の決定をする例題に進みます。
・ 何の実験計画ですか?
この例で、対のないt検定を使用して、2グループの平均値の比較について計画します。
Step 2-1: 標準偏差(SD)の推定
ステップ2において、StatMateは、我々が求めたい標準偏差(SD)の入力について質問します。
たくさんの数値の分散(high SD)を求めたい場合、大きな標本サイズを必要とします。一方、非常に少ない数値の散布 (low SD)を求める場合、それほど多くのテーマを必要としません。求めたいと思う散布量を推定できなければ、必要とする標本サイズを簡単に推定することはできません。
この例では、異なった理由ですが、血小板plaelet alpha2-アドレナリン受容体に関する他の研究からのデータを使用します。これらの研究は、1つの血小板当たり、受容体の平均数が約250で、標準偏差は約65であることを示します。なぜそれほど高いのでしょうか。恐らく、生物学的変化や、受容体を数える際の実験誤差、血小板を数える際の実験誤差の結合結果と思われます。SD値を得るため、通常以前の研究結果を使う方が、試験的な研究結果を使用するよりも良いものです。
どのように海岸の砂浜が形成される
Step2-2: 有意水準の選択
次に、StatMateはa (alpha)の有意水準を選択するよう問いかけます。これは、結果を「統計的に重要である」と考え、以下のように帰無仮説を退けるP値です。
理想的には、Type I errorを作る結果に基づいて数値をセットするべきです。(実際、処理の効果がなく、その差分が偶然の差異であった場合、その差分は統計的に重要であると結論を下してしまいます)。Type I errorを作る結果を重要とする場合、より小さな数値にセットし、もっと多くのテーマを必要とします。Type I errorの結果を重要としない場合、より少ないテーマで大きな数値をセットします。
ほとんどの研究者は、常に、alpha を「0.05, two-tailed」にセットしますし、我々も同じようにします。
注:「Edit powers and Ns..」のボタンは、次の画面で、使用される検出力と標本サイズのリストを変えることができます。ほとんどすべての場合、デフォルトはまったく素晴らしくなります。また、この例題用にデフォルトが維持されます。
Step 3-1: 標本サイズと検出力のトレードオフ
この時点で、あるプログラムはどれくらいの統計的検出力を望むか、どれくらい大きな効力のサイズを捜すか尋ねてきます。その後、そのプログラムはどんな標本サイズが必要かを伝えます。このアプローチの問題点は、どれくらいの検出力を望むか、あるいは、どれほど大きな効力のサイズを捜しているかを、多くの場合伝えることができないということです。研究者は、統計的有意性の非常に厳密な定義と共に、非常に微細な結果を検知する非常に高い検出力の研究設計を望みます。しかし、そうすることは研究者が提供できる以上の、多くのテーマを要求されます。研究者に必要なことは、可能性を吟味し、トレードオフを理解することです。
StatMateは、統計的に重要なものとして検知可能な、標本サイズ、検出力、効果的サイズ間の、トレードオフを示すテーブルを提供します。
多くの情報を提供するテーブル・ テーブル中の各行は、選択可能な標本サイズを表わします。その数字は、各グループ中の標本サイズを参照します。
・ 各列は異なる検出力を表わします。研究の検出力がこの質問に対する答えです。真の差分と平均値の間が、一覧表の値と等しいなら、特定の標本サイズの実験は、0.05未満のP値をもたらす機会となります、この例題のアルファの選択は、結果として「統計的に重要である」と考えられます。ステップ2において、"Edit Powers and Ns..."をクリックすることにより、検出力のリスト変更が可能です。
なぜRNA-RNAハイブリッドがもっと強いか?
・ この例題は対応のないtテスト用であるので、テーブルの各値は、2つのグループの平均値の差分です。ステップ2で実行したSDと同じユニットで表現されます。この例題において、このデータは1つの血小板当たりの受容器の数として表現されます。
Step3-2:アプローチの選択
このテーブルを調べて、検知することができる標本サイズ、検出力および差分の、満足できる組合せを見つける必要があります。次に、A、B、Cの3つのアプローチを概説します。
アプローチ A.
このアプローチでは、かなり決定的な研究を計画し、多くの時間と財政的支援をも望みましょう。
どの検出力を使用すべきか…ここで5%の従来型の有意水準を選びました。 2つのグループ間の平均値受容器番号に差分が本当にない場合、偶然にも2つのグループ間のそのような大きな差分を得るだろうという、5%の確率がまだあることを意味します、結局その差分は統計的に重要であると呼ぶことができます。また、真の差分不足の、5%の確率を欲しいと思います。したがって、100%-5%か95%に等しい検出力をセットします。
どれだけのサイズの差分を捜しますか?まだ高血圧症を持った人々を研究していない一方、1つの血小板当たりの受容器の平均数が.約250であることが他の研究で分かったことを知っています。どれくらい大きな差分に関心を持ちますか。10%の差分を見つけたいと言いましょう、したがって、差分は1個のセル当たり25の受容器の平均の間になります。25の近くで値を見つけるために95%の検出力カラムを下って見てください。 この値は、N=150とN=200の間のおよそ半分です。したがって、各グループ中の約175のテーマを必要とします。これは多いテーマです。アプローチBは、より少数のテーマを正当化するアプローチを示します。
アプローチ B.
どのような理論をmoddellingされますか?
このアプローチでは、より小さな標本サイズを望み、喜んでそのために妥協しましょう。どの検出力を使用すべきですか。 80%の検出力を使用することはかなり慣習的なことです。これは、一覧表のサイズの差分が本当にあるとすれば、その研究を実行するときに、「統計的に重要な」結果(P<0.05)を得られるいう、80%の確率があることを意味します、そのサイズの真の差分不足という20%の確率を残しています。どれだけのサイズ差分を捜しますか。まだ高血圧症を持った人々を研究していない一方、1つの血小板当たりの受容器の平均数が.約250であることが他の研究で分かったことを知っています。どれくらい大きな差分に関心を持ちますか。アプローチAでは、10%の差分を捜しました。代わりに20%の差分を捜しましょう、したがって、1個のセル当たり50の受容器の平均間の差分となります。50の近くで値を見つけるために80%の検出力カラムを下って見てください。こ の値はN=25と N=30の間のおよそ半分です、したがって、各グループ中の約28のテーマを必要とします。それは、まだ多いように見えます。さらにもっと少ない数で立証することができないでしょうか。
アプローチC.
我々の限られた予定量(または限界)は、各グループ中の11のテーマで研究をしなければならないことです。どれだけの情報を得られますか。そのような価値のある研究を行っていますか。小さな研究では、適量の検出力で間に合わせなければならないことを知っています。しかし、右端のカラムは50%の検出力のみです。それは、たとえ真実の結果を仮定したとしても、「統計的に重要な」結果を得る見込みは50%のみであることを意味します。その場合、実験を行うポイントは何でしょう。私たちはより多くの検出力を望みますが、大きな標本サイズなしで巨大な量の検出力を持つことができないことを知っています。したがって、ここで80%の検出力を採用します。それはかなり慣習的なことです。これは、一覧表のサイズの違いが実際にあ る場合、実際の違いを逃す20%の確率を残して、研究を実行する時、私たちが「統計的に重要な」結果(P<0.05)を得るという80%の可能性があることを意味します。
80%の検出力カラムを下って見れば、N=11列では、86.4の差分を検知できることを知ります。alpha2-アドレナリン受容体の平均値の番号が約250であることを既に知っています。したがって、各グループ中の12の標本サイズは、受容器番号の35%(86.4/250)の変化を検知する80%の検出力を持っています。この標本サイズ分析は、我々が既に選んだ標本サイズを与えられて、何の学習を望めるかを見つけ出す助けとなりました。今や、実験を行う価値さえあるかどうかを決定することができます。他の人々はよく違った決定をしました。しかし、いくらかは、はるかに小さな差分が生物学上重要かもしれなく、そして、我々は単に35%のとても大きな変化と、たった80%だけの検出力さえ検知することができれば、全く実験を行う価値さえない、と結論を下す� ��しょう。
3つのアプローチは正しいでしょうか?
どの検出力を望むか、どれくらい大規模な結果を検知したいかを正確に明示すれば、StatMateはどれだけのテーマを必要とするかを正確に伝えることができます。一般に、どの検出力を望むか(あるいは喜んで受理する)、または、どれくらい大規模な結果を検知したいかに関し、確かではありません。したがって、ほとんどどんな標本サイズも証明することができます。それは、どれくらい大規模な結果を見つけたいか、どれくらい検出力を見つけたいか、偶然に重要な差分(アルファ)を見つけるのにどれくらい自発的か、に依存します。まさに、正解は1つもありません。それは、なぜ差分を捜しているか、そして実験を行うコスト、ハッスル、リスクに依存します。
Nと検出力の関係
Nと検出力の関係を示すグラフをStatMateでは作成できませんが、GraphPad Prism version 4.01 (Windows) あるいは4.0b (Mac) またはそれ以降のバージョンを持っていれば、グラフボタンをクリックするだけでPrismで簡易グラフを作成することができます。各カーブは異なる検出力です、各グループ(X)用に選択できる標本サイズと、「重要な」(Y)として検知する差分の関係を示します。
左から右に行くにつれ、カーブは下方に下がります。これは理にかなっています- -より多くのテーマ(もっと多くのデータを集める)を使用すれば、より小さな差分を正確に検出することができます。各カーブは差分の検出力です。より高い検出力を選べば、カーブは右にシフトします。これもまた理にかなっています--より多くの検出力(真の差分を逃す機会を、より少なくする)を望めば、より多くのテーマを必要とします。
Step 4: SatMate報告書の考察
アプローチBで選択された標本サイズを選びます。StatMateのステップ3において、各数値はリンクしています。80%検出力カラムとN=25 row(52.68)のリンクをクリックすると、StatMateは完全な報告書を示します。
右図は、報告書の4セクションの内最初の2つを表示しています。選択の繰り返しと詳細な解釈です。その報告書は、トレードオフ(既に見ていますが)の全テーブルと、一致しない標本サイズで研究設計するのが理解できる時のディスカッションを示します。
pdfファイルで、この例題の全報告書が見られます。ボタン(Windowsのみ)のクリックや、コピー、ペーストによりWordに全報告書を送ることができます。
0 コメント:
コメントを投稿