石井部隊とランダム化比較試験
生命倫理学における人種問題にかんするエッセー
本年(2005)6月の日本医史学会・大会の抄録が送られてきた。東大(当時)の津谷喜一郎氏が「世界初の人を用いたランダム化比較試験は七三 一部隊に よるか?」という演題を掲げている。1939年の『防疫研究報告』に掲げられた文献の出典のなかにFisher流統計学の文献があることを根拠に、また当 時の日本の統計学の応用研究の動向や水準という傍証(=研究をめぐる社会状況)から、津谷は人体実験の世界初のランダム化比較試験としてこの試験が行われ たことを示唆している。人体実験(=人間を治療対象にする行為実践はすべて人体実験になりうる資格をもつものであることを喝破したのは中川米造(Yonezo NAKAGAWA, 1926-1997)だが) におけるランダム化には必ず「倫理」問題が伴い、1946年のストレ プトマイシン試験(オースティン・B・ヒルらによる)でも議論があったと津谷はいう。
ここまでの議論はOKである。ところが、最後に彼は、ハルビンでの試験は被験者を非人間化したので、実験動物と同様、この問題をクリアしたと 主張する。だが、この議論はどこかおかしい。
人体実験のランダム化において倫理の問題が生じる理由は、試験が終わった時点で結果に不平等が生じるからである。なぜなら、ある被験者は実験 により治療の恩恵(ないしは被害)を受け、別の被験者はなんの影響も受けないからだ。
ハルビンの場合は人体実験そのものにおいてこの問題をその枠組み自体において考える必要がなかった(=だから言うまでもなく人道に対する犯罪 として歴史的に認定されているのだ)。ということは、ランダム化と倫理に関するジレンマは、石井部隊においては最初からなかったと考えるのが理屈で、非人 間化したからランダム化が可能になったという津谷の説明は論理的ではない(=つまり屁理屈である)。
おまけに関東軍から政治犯や捕虜などが被験者として給備されたわけ[1]であるから、そのような被験者(『防疫研究報告』では「丁種学生七〇 名」[上田弥太郎供述書では45名]となっている)の人為的選択がランダムなものではないことは731部隊の実験者も理解しているはずである。だからこ そ、このような被験者の集団においてもなお実験の公平性を確保するために「比較」試験を実施しようとする科学的理性が働いたのである。
津谷の議論は731部隊もランダム化比較試験も、その動機の背景に被験者の非人間化の過程があり、これらが共に「同じゴールを目指していた」 と結論づける。しかしながら、これは人体実験の倫理と、ランダム化試験という関連性のないものを「非人間性」でつなげる非合理な議論である。
むしろこう考えるべきなのだ。ランダム化試験を人体 を被験者におこなう時に、倫理上のジレンマが生じるのであって、それをネグレクトしようとするから、その実験の枠組みは「非人道的」になる。それらのこと を回避するために、人体実験の倫理学が〈必要に駆られて〉事後的に登場してきたのである。生命倫理学の教科書に必ず登場するニュールンベル グ・コードがその原型で、生命倫理学上のテーゼのほとんどは、架空の思考実験ではなく、議論に先行する非人道的な事例を反証例(ネガティブ・インスタン ス)として引き合いに出す解釈理論にほかならない。七三一やタスキーギ事件などの非人道的犯罪は、倫理を構築する方向に実験をデザインする発想が(実験者 の人種主義的偏見により、あるいは実験環境の社会構造により)絶無であり、その芽が完全に社会条件として摘まれていたからである[2]。
従って問題の根源は、実験者たちが被験者を「非人間 化」したことにあるのではなく、同じ人間どうしの間にある階層化された序列をもうけるという人種主義が背景にあることになる。非人間化する のは、目前にしている〈同じ人間〉を否認する認知的行動ーーマルタと呼んだり番号などの非人格的記号で呼ぶーーにおいてみられるが、実験動物として非人間 化することではない。
なぜなら得られた臨床データはラットや〈満州の猿〉 という言い換えをしているにも関わらず、〈同じ人間〉のデータとして取り扱っているのである。なぜなら〈細菌戦争〉の目標はあくまでも〈敵 として人間〉に有効に機能するものではならないからである。人体資源としての有効活用事例には必ず、人間の生命活動における普遍性や一般性がまず大前提と して保証され、その上で絶対的区別をつけた人間集団のカテゴリー分類がある。前者を優先して後者をただひたすらノイズとして消去するためには、多大な労力 と手続きが必要で、歴史的にみて近代医学者たちはこの問題をどのように臨床実験の現場でクリアーしようと努力してきたかがわかる。
ということは非人道的人体実験において何が行われているかというと、〈同じ人間〉のデータを取るために、〈実験者とは異なったカテゴリーの人 間〉で代用するという操作が行われているということだ。非人道的 人体実験における被験者となった〈異なったカテゴリーの人間〉とは、〈異なった人種〉に他ならない。それは精神病患者、ユダヤ人、中国人、共産主義者、匪 賊、死刑囚、黒人、貧困者などから、構成されていた。このようなカテゴリーの人間は、〈同じ人間〉でありながら、〈被験者たる資格をもつ人 間〉として分類されたからに他ならない。このアンビバレントな認識論的困難を隠蔽するのが〈非人間化〉という認識論的手続きに他ならない。
つまり生命倫理学は人間性の定義や臨床現場における行動の指針だけでなく、これまで真正面から真剣に取り扱われてこなかった問題、すなわちこ の人間の質による峻別(人種主義はそのひとつの例)に対する問題に取り組むべきなのだ。
冒頭であげた津谷の問題提起はユニークで刮目すべきものだが、議論の展開が医学界で流通しているレディメイドの概念(=非人道的な実験は対象 を〈非人間化〉するから可能になったのだというトートロジー)を流用するだけに終始している。しかしながら、それでもなお彼の議論は医学(薬学)業界では 「まともなほう」だという。つまり、それだけこの業界においては学生・研究者の論理構想力の基礎体力すなわち知力(=端的に日本の生物医学者と話すと、論 理的に考えて他人[とりわけ他分野の研究者]とガチで議論できる「科学者」が想像以上に少ないということだ。)がないということだ。是非、これを躓きの石 として、〈負の遺産〉の宝庫 である現代医療の研究者はもっと良質の問題提起をしてほしいものである。
註
[1]中国黒龍江省档案館・中国黒龍江省人民対外友好協会・日本ABC企画委員会編『「七三 一部隊」罪行鉄証:関東憲兵隊「特移扱」文書』中国:黒龍人民出版社、2001年
[2]倫理問題を絶無にする環境において発生した事件を、事後的に倫理問題として理解しよう する枠組みは、どう考えても、真実の探求をおこなっているのではなく、印象主義的な解釈談義の域を超えられない。倫理問題が絶無な環境を創造しようとした 石井部隊がそれでもなお実現できなかったことは、実験者に携わった当事者自身の自殺や自己批判していることでも明らかである。
余滴
リンク
リンク(生命倫理関係)
■731部隊組織編成図(http: //2113jp.web.fc2.com/731/index.htm)より
●ランダム化比較試験(→「ランダム化比較試験」)
ランダム化 比較試験(ランダムかひかくしけん、RCT:randomized controlled trial)とは、評価のバイアス(偏り)を避け、客観的に治療効果を評価することを目的とした研究試験の方法である[2]。根拠に基づく医療(EBM: evidence-based medicine)において、このランダム化比較試験を複数集め解析したメタアナリシスに次ぐ、根拠の質の高い研究手法である[2]。主に医療分野で用い られているが、経済学においても取り入れられている[注釈 1][3]。無作為化比較試験 とも呼ばれている[4]。改善度に関する主観的評価を避けるための尺度であるエンドポイントを用いる、効果の差を計測するための治療していない偽薬などを 施した群を用意する、二重盲検法によって研究者がどちらが治療群かわからないようにし、治療群と対照群をランダムに割り当てるといった手法をとる[2]。
初のランダム化比較試験(RCT)は、イギリスにおいて、結核薬のストレプトマイシンが効く かどうかを調査するために、医学研究審議会(MRC:Medical Research Council)を代表してオースティン・ブラッドフォード・ヒル(英語版)らによって行われた[5]。結果は1948年に、英国医師会雑誌(BMJ: British Medical Journal)に掲載された[6]。差を知りたい介入以外の介入が等しくなければ、因果関係が正しく分からないという[7]、統計学者のロナルド・ フィッシャーによる統計理論が適用された[5]。 米国では、1962年に連邦食品・医薬品・化粧品法において薬剤の有効性の概念を設け、適切で十分に制御された2回の適切な対照を置いた臨床試験によって 有効性が示されれば、薬は承認されることとなった[8]。1990年代以降に普及した根拠に基づく医療における考え方では、RCTは、RCTを複数集め解 析したメタアナリシスに次ぐ、根拠の質の高い研究手法である[2]。
ランダム化比較試験は、主観的あるいは恣意的な評価のバイアス(偏り)を避けるために、以下 の点が揃っている[2]。 エンドポイント:改善度に関する尺度。改善度に関する主観的評価を避ける。 比較対照:治療を施した群と、偽薬あるいは比較のための治療を施した対照群。治療介入の効果を算出するため。対照群がない場合、何が要因なのかはっきりし ない。 ランダム化:母集団からのランダムな抽出や、治療群と対照群のランダムな割り当てを行う。効果が出そうな対照を選ぶことを避ける。 盲検化:研究者と被験者に、治療群と対照群がどちらであるかを分からないようにする。計測に主観が入らないようにする。 RCTによる効果検証・効果測定が一般に行われる以前では、いくつかの不合理な治療・投薬が存在していた。広く知られているのは、心筋梗塞の治療後に、予 防的にリドカイン(不整脈を防ぐ効果がある)の投薬が行われていた事例である。しかし、心筋梗塞後のリドカイン投薬群、非投薬群の追跡調査の結果、リドカ イン投与群でむしろ死亡率増加が認められたため、以後ははリドカインのルーチン投与は推奨されていない[9]。
社会科学におけるRCTでは、政策的課題に解を与えるための研究が行われ、2000年代以降 に増加している。学校の教育施策が学習に及ぼす影響、農業における新技術の影響、運転免許行政の不正、消費者金融市場のモラルハザードの影響、経済学理論 の検証などに使われている[10]。2019年には、バナジーとデュフロらのRCTを用いた研究がノーベル経済学賞を受賞したことで話題を呼んだ。
さらに詳しい説明は「ランダム化比較試験」
文献
Copyleft, CC, Mitzub'ixi Quq Chi'j, 1996-2099