これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。
小学校の頃、授業中に、たとえば算数の計算問題を解くことがあった。各々の生徒の理解の程度には差があるので、当然、スラスラと解ける生徒もいえば、よくわからずに止まってしまう生徒もいた。そこで教諭は、早くできた者に対し、そうでない者に教えさせる、ということを行った。物事を他人に教えるというのは、自分自身の勉強にもなる行為であるから、この「教えさせる」ということ自体は良い教育方法であったと思う。しかし教える側も小学生であるから、必ずしもうまく教えられるわけではない。そこで教諭は、教える側の生徒に対し「答えを教えるのではなく、やり方を教えなさい」と指導していた。
小学校における初等教育としては、それで良かったのかもしれぬが、大学や大学院における高等教育、あるいは医師に対する臨床教育としては「やり方を教える」教育は不適切である。しかし、学生や研修医などに向けたアンチョコ本には「○○のやり方」とか「△△の考え方」とかいうものが多い。これらの本を参考にして、やり方を覚えれば、臨床はとりあえず回せるのだろう。「考え方」というのも同様で、本当に医学的に自分の頭で考えるという意味ではなく、フローチャートにあてはめて判断する、というような意味に過ぎない。この「やり方を教える」という教育が行われた結果、たとえば、次のようなことが起こる。
臨床試験の結果を報告する論文には、定型的な構成がある。患者を二群にわけてランダム化比較対照試験やコホート研究を行う場合、性別や年齢、人種などの要素について、二群間で比較し、たとえば t 検定を行って p 値を計算した表が書かれることが多い。大抵、有意差は生じないので、それ以上は議論されない。しかし統計学の立場からすれば、有意差がある場合には「重大な交絡因子となっている恐れがある」と考えられるが、有意差がない場合には、判断が難しい。有意差なし、というのは、差があるのかないのかわかない、という意味に過ぎず、「両群に重大な偏りがない」ということを意味しないからである。従って、本来であれば、性別や年齢などの偏りの許容範囲を予め設定し、両群の差が、その許容範囲に収まっているかどうかを検定しなければならない。ところが、そういう解析を行っている論文は極めて稀であるか、あるいは存在しない。なぜ、彼らは、統計学的に意味のない p 値を書くだけで満足しているのか。おそらく、彼らは統計学を理解していないから、自分の主張を裏付けるためにいかなる解析が必要なのか判断できず、先例に倣って、同じような「解析」をすれば良いと考えているのだろう。
また、当初設定した判定基準では有意な差が出なかった場合に、解析条件を変えて、どのような場合に有意差が生じるかを検討することがある。その試行錯誤の結果、ある条件の下では有意差が生じる、という結果が得られることがある。むろん、試行錯誤を繰り返せば、単なる偶然の偏りによって「望ましい」結果が生じることもあるのだから、それが本当に意味のある結果なのかどうかは疑わしい。というより、これは不適切な多重検定の結果に過ぎず、本当に統計学的に有意な差ではない。しかし無知な研究者連中は、それが自分の期待した結果と一致しているならば、意味のあるものと判断して発表するのである。そして業界誌 (あるいは業界紙) や、一般のマスコミは、そういう無意味な結果を、あたかも医学的に重大な発見であるかのように報道するのである。
世の中には、こうした不正で無意味な「解析」を行った論文が多い。おそらく、査読者も統計の素人であることが多いから、こうした論文が公然と、有名な論文誌に掲載されるのであろう。そして、統計の素人である研究者連中は、こういう解析でも掲載されるのだから、それで良いのだ、と判断する。それが正しい医学研究のあり方だと、勘違いする。彼らの目的は雑誌に自分の論文が掲載されることであって、学術の探究ではないのである。結果として、不正な解析を行った論文が、安定して生産され続ける。
そして、そういう不正な解析であったとしても、多くの論文を有名な論文誌に掲載させた者が、優れた研究者として評価される。