検査の反応性;Effect SizeとStandardized Response Mean(SRM)の話
どうも、お久しぶりです。
今年はアクセプトの確率50%です(分母が小さいです)。すみません。
Effect Sizeの話(Effect Size;効果量)
これよく聞くはなしですよね?論文に馴染みのない方は初耳かもしれません!
統計用語集にはこのような記載がありました。
ちなみに、理学療法士協会のHPにはこんな記載が....↓
難しい??ですよね。
臨床場面におけるアウトカム指標というのは、信頼性・妥当性・反応性が高いものでなければならないと言われております。
Responsiveness and validity in health status measurement: a clarification.
信頼性が高い評価というのは、1回目の2回目の測定が同じ傾向にあるというものです。これには、ICCとかκ係数などがあります。妥当性は、その計測された数値が意図したものを測定できているかというものですよね。これには、ROC曲線や回帰分析、相関によって評価されます。
反応性には、内部反応性と外部反応性があります。今回は、内部反応性についてです。
t検定
これも反応性の一つのようです。ただ、これは、2つの測定値に変化がないという仮説に基づく検定ですよね。t値が1.96より大きい場合は、いわゆる有意差ありということになって、反応したという解釈となります。ただこれは、サンプルサイズなどに依存するので、反応性を評価するための指標としては微妙ですよね。
Effect Size;効果量
Cohenさんによって最初に提案されたのが、効果量のようですね。Cohenさんらの有名な書籍はこちら↓(よく論文で引用されている書籍です。)
←ハードカバー
この効果量の計算方法は、初期と最終アウトカムスコアの平均差を初期の標準偏差で割ったものです。これは反応性の指標として推奨されているようですね。そして、Effect Sizeですが、Cohenさんによって小0.2-中0.5-大0.8という感じでに分かりやすいように分類?されています。つまり、
0.2は、ベースラインの標準偏差の20%の変化
0.5は、ベースラインの標準偏差の50%の変化
0.8は、ベースラインの標準偏差の80%の変化
ということになります。
Standardized Response Mean(SRM);標準化反応平均
これも良く使用されている指標ですよね。少し前の研究ですが、Strokeという有名なジャーナルでも脳卒中後の運動機能の反応性についてSRMを使用していました。
論文:https://www.ahajournals.org/doi/10.1161/STROKEAHA.108.530584
他にも、慢性脳卒中患者のバランスや歩行のアウトカムの反応性としても使用されています。論文:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6136166/
このSRMの計算方法は、”スコアの平均変化を変化したスコアの標準偏差で割る”という計算です。普通の割り算なので特に統計ソフトも必要ありませんね。SRMについても、Cohenの基準をもとに小-大に分類?されているようです。
その他には、MCID(外部反応性)などの指標も反応性の一部のようです。(また今度まとめてみたいde
すね-。)
つまり、言い換えれば、観察された測定値の変化は、患者の状態における重要な変化を反映していない可能性があるということです。ということであれば、信頼性と妥当性の概念は2つに完全に分類できるものではないですよね。そして、完全な信頼性と妥当性というものないようです。
https://pubmed.ncbi.nlm.nih.gov/7550178/
ややこしくなってきました。反応性や信頼性は思ったより奥が深いようです。
やはり、内的反応性だけでは不完全なので、反応性の研究を行うときは外的反応性も同時に検証すべきですね。