これはhttp://mitochondrion.jp/に掲載している「医学日記」を 検索用に 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われます。 通して読むには、トップページからオリジナルページにアクセスしてください。


2024/06/09 医用画像の機械学習において一般画像を用いた転移学習を用いることについて

6 月 4 日の記事に対する補足である。機械学習の分野において、まず「一般的な」データについて学習させたモデルを用意しておき、それに対して「特殊な」データについて追加学習させる、という手法を「転移学習」と呼んでいる。先日の記事についていえば、ImageNet を学習させたモデルに対し、単純 X 線画像を追加で学習させることでモデルのパラメーターを微調整 (fine tuning) する、という転移学習モデルを、はじめから単純 X 線画像だけ学習させたモデルと比較したわけである。理屈からいって、そんなのは後者の方が優れているに決まっているではないか、と、前回、私は書いた。

私は深層学習の分野を触り始めて日が浅いので、この問題を世間ではどう理解しているのかを知らずに、単に理論面からの考察として前回の記事を書いた。そこで今回は、これについて、他の人はどう書いているのかを調べてみた。

2018 年に電気通信大の庄野教授が画像電子学会誌 47(4), 479-484 (2018)に書いた記事では、医用画像に対して転移学習が有効であろう、との見解が示されている。 庄野は、その根拠として Suzuki らの論文(情報処理学会論文誌 数理モデル化と応用 11(3), 74-83 (2018)) を引用している。ただし、庄野自身がこの論文の共著者であることに注意を要する。この Suzuki 論文では、転移学習を fine tuning と feature transfer に分類している。ここでいう fine tuning とは、深層学習モデルの前半部分 (いわゆる feature extraction part と呼ばれる部分であるが、この命名は、深層学習の理論的背景をよく理解していない者による誤った名称であると私は考えている。この点については、部分的に 4 月 29 日の記事 で触れたが、いずれ、どこかで詳しく書きたい。) については追加学習させず、後半部分 (いわゆる classification part) についてのみ学習させるものである。先日紹介したラーマンの方法で比較対象とされた「従来法」も、この fine tuning の方法である。これに対し feature transfer では、feature extraction part も含めた全体を追加学習する、という手法である。先日の記事でいえば、先行報告である Krogue, Kitamura, Cheng らの論文は、この feature transfer にあたる。ラーマンは、fine tuning を「従来法」と呼びつつ、その根拠として feature transfer の論文を引用したのだから、不適切である。

Fine tuning の場合、まるで異なる画像で学習した feature extraction part を残すのだから、転移学習によって画像の分類性能が向上するとは考えにくく、むしろ性能が低下する恐れがある。これに対し feature transfer の場合、学習が速やかに収束するだけでなく、不適切な局所解に陥いることを避けやすいと考えられるから、全体としての分類性能が上がることを期待できる。ただし、学習の過程で適切な最適化が行われるならば、転移学習の有無で最終的な結果は変わらないはずである、という点には注意が必要である。とはいえ、少なくとも、feature transfer により転移学習することで分類性能が低下するとは考えにくい。

この問題について、デタラメな言説が飛びかっていることに業を煮やしたのか、キチンと実験して 2019 年に報告したのが Raghu らである(M. Raghu et al., Proc. 33rd Conf. NurIPS 2019 (2019).)。これは、ImageNet などを事前学習に用いる転移学習では、医用画像の分類性能はほとんど向上しない、という当然の結果を示すものであった。

Raghu らの報告に対する世間の反応にも一応、言及しておこう。2020 年に国立がん研究センター研究所の小林は、この Raghu らの報告について「興味深いことに, ImageNet を用いた転移学習モデルは, ランダムな初期値を与えられたスクラッチからの学習と,最終精度において変わらなかった.」と述べている(人工知能 35(4), 509-515 (2020).)。この「興味深いことに」というのは、少なくとも日本の深層学習界隈では共通の認識であったようで、インターネット上の記事をみても、この Raghu らの報告について「衝撃的」というような表現で紹介しているものが多数みられる。

この Raghu らが報告した「転移学習で医用画像の分類精度は向上しない」という事実は、深層学習が具体的に何をやっているのか、ある程度数学的な部分まで含めて理解しているなら、当然のことと感じられるであろう。それに対し「興味深い」「衝撃的」などと反応する者が多かったのは、どういうことなのか。理論的な理解なしに「よくわからないが、こうすれば、できる」という程度の浅い理解で深層学習を扱っている者が少なくないのではないか。


Home
Copyright (c) Francesco