B.測定法の評価
1.診断マーカーとしての有用性から見た検討と評価
「D」疾患の診断を例にとりますと、「D」と「正常者あるいは他の疾患」を考えて
図1 アッセイの有用性
感度:「D」の患者の何パーセントが陽性に検出されるか? (陽性の定義も重要)
陽性とは、定性的な検出反応なら、検出される反応があったこと。
定量的な測定なら、カットオフ値(Cut-off Value)以上の測定値(通常正常者の平均値+
2SD(場合によっては3SD)を高値の、平均値-2SD(場合によっては3SD)を低値の
カットオフ値とすることが多い)
SD:標準偏差値 (平均値±2SDには全体の95%が含まれるからである)
特異性:陽性者の何パーセントが「D」の患者であるか?
○ここで述べられている感度と特異性は測定法の性能の項で述べられている感度・特異性とは異なる定義であるので注意してください。
感度、特異性が共に高い→有用性が高い
2.正しくかつ精密に測定できるかどうかという性能を検討、評価する
正しく精密な測定とは上記の有用性とは関係なく、測定しようとする物質だけを、試料中の重さあるいは濃度として高い信頼性で決定できるかどうかという性能のことです。
性能の評価法(Validity test)
1)測定感度(Sensitivity)・・・どれくらいまで微量の物質が測れるか?
感度が高いということ・・・微量の物質が測れること
感度が高いと有利なこと:少量の試料で済むこと(小さな実験動物で血液採取が少量しか出来ない、何回も採血して時間的経過を追いたい、などに有利)
試料を希釈して測定が出来ること(測定に影響する成分を希釈できる、適当な希釈をして標準曲線の良好な部分で測定値が読める、などに有利)
感度はどう決めるか?
標準品ゼロの場合の反応値から2SD離れているような反応値を与える標準品量を測定感度と考えます。
免疫学的測定法の感度は何に依存するか?
○抗体の測定対象物質に対する親和性:絶対的要因。
親和性の強いほど感度は高くなります。
親和性は結合定数または解離定数で表わされます。
Ka(結合定数)=
1012~13 M-1 程度
Kd(解離定数)= 1/Ka
10-12~-13 M 程度
両者の単位に注意。間違いが多い。
その他は
○抗体の使用量
○標識物質の使用量
○標識の仕方
などですが、測定法の原理によって具体的に決まります。
例えば、競合的結合原理によるアッセイの場合には、抗体の使用量、標識物質の使用量が共に少ないほうが高い感度が得られますし、標識は結合反応を損なわない範囲内で充分に標識してあるほうが感度は上がります。
これに対して、非競合的結合(サンドイッチ結合)の場合には、測定対象物質を捉えるためにウェルに固相化する抗体は多いほうが良いし、標識抗体も多いほうが良い。
2)測定値は信頼出来るか?
測定精度(Precision)・・・測定値のバラツキは小さいか?
測定精度とは、同一の試料を何本かの試験管または何個かのウェルに分けて1回のアッセイで測定した時、それぞれの測定値がどの程度バラツクかで示されます。統計学的には、変動係数(CV:Coefficient of variation)、すなわち
CV=SD/MEAN x 100 (%)
平均値に対する標準偏差のパーセンテージとして表現されます。
10%以下、出来れば5%以下が望ましいです。
一般的にイムノアッセイでは、測定値が大きくなるとバラツキの絶対値も大きくなります。言いかえれば絶対誤差は測定値と共に大きくなります。このような場合、相対誤差で表現するとほぼ一定の値が得られます。そのために、横軸には標準品の濃度の対数、縦軸には反応値をとる必要があります(片対数グラフとなる)。ただし、このように表現した検量線が直線ではない場合、相対誤差は検量線上の位置によって変ってきます。イムノアッセイの方法によっては、両対数グラフを使用することもあり、またLog-Logit(ロジット)紙を使うこともあります。
ひとつの試料での測定値のバラツキの原因は、個々の試験管での試薬量と反応の不均一さに由来します。もっとも大きな原因はピペットの選択と使用法にあります。また、沈殿を上清と分離する際に沈殿の一部が吸い出され、あるいは流出するとか、ウェルの洗浄にバラツキがあるなどです。測定を行う際、実験操作に充分注意し、安全な操作法を実行することで測定精度はかなり改善されます。
再現性(Reproducibility)・・・いつ測っても同じ試料を測ると同じ値が出るか?
再現性とは、同一の試料を何回かのアッセイで測定した時、それぞれの測定値がどの程度バラツクかで示されます。統計学的には測定精度と同様、変動係数を計算して表現します。再現性は、アッセイ操作の不均一性、抗体や標識物質、標準品等の試薬の変性、試薬量の不均一、ピペットの不均一(例えば同じピペットを使わなかった)、室内や冷蔵庫温度の違い、等に起因するので、単回のアッセイよりも要因が多く、従って変動も大きくなります。 平均値の15%以下、出来れば10%以下が望ましいです。
測定対象物質の量が正確に測定値として得られるか?
特異性(Specificity)・・・測定対象物質だけを測れるか?
測定対象物質に構造の類似した物質は、時として抗体に認識され、測定値に入り込んでしまうことがあります。特異性は使用する抗体に依存します。従って、抗体の特異性の吟味を充分に行うべきです。基本的には抗体の特異性の検討はそれが用いられるアッセイ系に従って行なわれるべきですが、一般的な特異性の検討は次の2種類の方法で行なわれます。
a.競合的反応による特異性の検討
ラジオイムノアッセイ等の競合的結合原理による測定法(Competitive assay)で用いられる検討法です。すなわち一定量の標識した抗原に一定量の抗体を加え、その系に非標識の抗原あるいは類似物質を、濃度を変えて加え、抗体と結合した標識抗原の量の減少をグラフにするものです。
非標識抗原を加えたものは、いわば測定の標準曲線にあたります。類似物質によって仮に曲線が得られたとすれば、交差反応有りと判定し、両曲線を比較して、もしも両者が平行ならば、水平距離は見かけの親和性の比になっているので、その水平距離から交差率を計算することが出来ます。類似物質によって抗体に対する標識抗原の結合が減少しない場合は交差性なしと判定します。一方、類似物質添加によって標識抗原の結合が減少するが、減少曲線(阻害曲線、inhibition curve)が標準曲線と平行しない場合には、交差はするが部分的であると判定します。部分的とは、抗原と構造類似物質との間には共通の抗原決定基があるが、共通でない決定基もあるということです。
このような競合的反応による特異性の検討は、ラジオイムノアッセイのような競合的測定法では一応通用します。しかし、測定原理の異なる測定法や免疫組織化学的、ウェスタンブロットなどには必ずしも通用しません。なぜなら、構造類似物質の中に不純物として抗原が存在している可能性も多いのです。ラジオイムノアッセイでは不純物があってもそれは純粋な抗原との交差率として処理され、もともと不純物の含量は少ないはずですし、真の交差性がなければ測定結果には影響しません。一方、非競合的測定法では、不純物であるかないかは大きな問題です。測定系に特異性の検討対象の物質を加えて、どの程度の測定値が得られるかを検討するのは非競合的測定法でも通常行われます。この場合も不純物としての存在を知ることは出来ません。
b.非競合的反応による特異性の検討
標識した抗原、あるいは標識した構造類似物質を一定量とり、それに濃度を変えた抗体を加えます。そして抗体と結合した標識物質の量を調べます。
標識抗原の場合抗体濃度を上げて行くと結合量が増大し、ついには100%近くなります。これに対して、標識類似物質では、交差しない場合には抗体濃度をいくら増加させても結合は増大しない。交差性がある場合には抗体濃度が充分に高ければ結合量は大きく増大します。部分的な交差でも同様です。この区別はつきません。不純物として抗原が含まれている場合には、抗体の濃度をいくら上げても結合は不純物の含量以上には増大しません。(Wakabayashi, K., and Tanaka, S. Acta Histochem. Cytochem. 21, 221-229, 1988)
正確度(確度)(Accuracy)・・・絶対値は確かか?
正しい絶対値が得られるためには、前提条件として標準物質と試料中の測定対象物質の構造(この場合には抗体との結合場所)が完全に一致していることが必要です。測定対象物質に化学構造上多様性があり、生理的条件によってそれらのポピュレーションが変化することがあると正確度は余り期待できません。
また、試料中の何らかの成分が抗原抗体反応に影響を与え、親和性や反応速度に変化をもたらすような場合には問題を生じます。
一般的に正確度を検討するには、次のような方法が用いられます。
a.希釈試験・・・特に血液成分の影響の有無
血清(血漿)を測定用緩衝液で倍々希釈して測定し、横軸に希釈度の逆数をとり、縦軸に測定値をとった時(希釈曲線)、原点を通る直線となること。
直線にならない場合:まず血液成分の影響を疑い、測定対象物質を含まない血清(フリー血清)で希釈をして、希釈曲線を描いてみます。それでも直線にならないときには、検量線を作るための系にフリー血清を加えてみます。
希釈曲線を描く代わりに検量線に重ねてみて並行性を確かめる方法もあります。(並行性の検討)
[測定値x希釈度]がどの希釈度でも同じになっていなければなりません。
というのが希釈試験の要求している条件です。
b.回収試験
測定試料にある量の標準品を加えて測定し、測定値から原試料の測定値を差し引いた時、加えた標準品の量が回収されるか否かを検討します。
誤差(バラツキ)の範囲内で100%回収されていることが必要です。
c.他のアッセイ系との相関性試験
すでに確立されている測定法が他にあるとき、同一試料をその測定系と検討中の測定系で測り、横軸に確立されている測定系の測定値、縦軸に検討中の測定系での測定値をとって二つの測定系の相関図を作り検討します。この時、相関係数が出来る限り1に近いこと。回帰直線の勾配がバラツキの範囲内で1に近いこと。Y切片がゼロに近いこと。(両測定系の測定精度が良ければ相関係数は1に近くなる筈です。バラツキの範囲内でということは、統計学的有意差が出ないことです)
4)Quality control(精度管理)
いつも良好な測定が出来ているか? つまり測定系と測定者を含めた測定室の安定性、信頼性
ルーチンに行なわれるような測定の場合には、上記のようなアッセイ・ヴァリデーションに加えて精度管理が要求されます。
○検量線の安定性(再現性)
○精度(バラツキ)の安定性
○管理血清を用いた毎回の測定値の再現性の検討
* 管理血清: 精度管理を目的として測定対象物質を低、高の2種(あるいは低、中、高の3種)を含んだ血清を多量に用意して(標準品を加えても、動物の生理的条件を変えて作ってもよい)小分け保存しておき、測定ごとに一組を測定します。
○試料測定値の安定性(通常全試料の測定値の平均値はそう変わらないので)
管理図(X-R管理図)を作ることで過去の試料を基に現在の測定を反省し、測定結果を採用するかどうかを判定します。