AI(人工知能)のエスノグラフィー
How should we do ethnography on
Artificial Intelligence ?
人工知能(Artificial Intelligence)を研究対象にするエスノグラフィーはどのように書かれるべきか?あるいは、あるいは AIを対象に人類学者はフィー ルドワークが可能か?
エスノグラフィーは、別名「民族誌」とよばれている ように、エトニーあるいは民族(ないしは民族集団)についての記述のことである。人工知能(AI)は、はたして、個人的な人格なのか?それとも、インター ネットにさまざまな人工知能(AI)がいるように、その存在は集合的社会的なものなのか?——その場合はAIはエトニーとなるので、エスノグラフィーは理 論的には一応「可能」となる。
しかし、ウィキペディアの"Artificial intelligence"の定義は、以下のようになり、それは、人格にも集合的なエトニー(エトノス)にも該当させることが難しい「実体」ではある。
"[A]rtificial intelligence (AI), sometimes called machine intelligence, is intelligence demonstrated by machines, in contrast to the natural intelligence displayed by humans. Colloquially, the term "artificial intelligence" is often used to describe machines (or computers) that mimic "cognitive" functions that humans associate with the human mind, such as "learning" and "problem solving""-Artificial intelligence .
しかしその後半の説明にあるように、このマシーン は、人間的特徴である""cognitive" functions that humans associate with the human mind, such as "learning" and "problem solving""を模倣するために、個人あるいはエトニーとしても「理解(=解釈)」可能である。
ただし、エスノグラファー(民族誌家)が、サイバースペース(電脳空間)の中 で、そこに調査対象がおり、言語による媒介を通して、対象を把握すれば、それはフィールドワークが可能になるように思われる(cf. cyborgs@cyberspace, 1999)。
民
族(ethnos)を描くのがエスノグラファーなら、技術のことを描くのは、Techno-grapher(テクノグラファー)、サイバースペースのこと
について書くのは Cybernographer / Cybergrapher(サイバノグラファー/サイバーグラファー)ということになる。
●データサイエンティスト(data science)とAI研究者の対話の言説分析について
資料のサマリー「2012年6月,Googleが発 表した論文(通称キャットペーパー)で深層学習に注目が集まり,人工知能(AI)の有用性が再度脚光を浴びた。医学分野でも深層学習を利用した病理診断や 内視鏡診断,創薬への応用が進み,画像解析,ゲノム解析の2大領域では医師の能力を凌駕する研究も現れ始めた。しかし,これら2大領域以外では深層学習を 利用できるほどのビッグデータを集積しづらいのが現状だ。近年,こうした領域以外でAIを活用する新手法として注目されるのが,ディープフェノタイプに基 づくデータ駆動型研究(以下,ディープフェノタイプ研究)である。システムバイオロジーの考えをもとに,バイオマーカーや生活環境などのあらゆるデータを 統合的にAIで解析し,疾患の発生・進行予測に活用する」出典:浅井義之と川上 英良「データサイエンティストが描くAI研究の未来像」『医学界新聞』第3345号 2019年11月4日 http://www.igaku-shoin.co.jp/paperDetail.do?id=PA03345_01
浅井義之(山口大学大学院医学系研究科シ ステムバイオインフォマティクス講座教授[当時]) | 川上英良(千葉大学大学院医学研究院人工 知能医学教授) | コメンタリ | |
1 |
ここ数年のAIブームにより,「こんな
データがあるけど何かできますか」と,医療データを私の研究室に持ち込んで来られる医師が増えました。これはある意味AIブームのいい副作用だととらえています。解析の手法としてAIが選
択肢に入っている証拠で,ブームがなければ従来通りの統計解析に終始していたでしょう。 |
この両者の学者(浅井先生と川上先生)
は、AIのことを他者とは考えていないおめでたい先生方である(→「他者としての人工知能」) |
|
2 |
そうですね。同じ研究領域で先を越されてしまった場合,それを超えるような知見が出ない限りは,解析データ
はこれまで死蔵されてきました。しかし,AI研究が盛んな今,新たな知見を生み出す可能性のあるデータを死蔵させるのは大きな損失です。 |
・データサイエンスの新展開傾向 |
|
3 |
一方で,臨床医が死蔵データのAI応用を
考えた際,現場での活用法がイメージできているのかは重要な課題で
す。現状は,AI研究の主流である深層学習(deep learning)を用
いた画像解析やゲノム解析の領域であれば,研究に生かしやすい有用なデータが医師から持ち込まれるのですが,それ以外の研究分野に関しては,冒頭の依頼の
ように「AIで何ができるか」の具体的なイメージがないまま医師が相談に来られることはまだまだ多いです。 |
・深層学習(deep learning) | |
4 |
同感です。けれどもその貴重なデータをど う生かすかがわれわれデータサイエンティストの使命でもあります。そこで近年,医用画像,ゲノム情報以外のデータに対応しようと頭角を現してきたのが,変 動するバイオマーカーに対してAIを活用し,予防医療への応用をめざすディープフェノタイプ研究です。 | ・From Deep
Genotype to Deep Phenotype - SomaLogic, February 23, 2016. ・Deep phenotyping for precision medicine. |
|
5 |
医用画像やゲノム情報は,ある一時点をと
らえたデータのため,腫瘍の有無や良悪性の判定などは比較的行いやすく,深層学習に最も向いたタスク設定です。一方で,ディープフェノタイプ研究が標的と
するバイオマーカーは,時系列によって大きく変動するため,深層学習の活用に向きません。当センターでもシステム医学の観点からこの研究に取り組んでいま
すが,最近,川上先生は血液検査データをもとにAIを応用した興味深い研究成果を出されましたね。 |
||
6 |
はい。2010~17年の間に,慈恵医大
産婦人科で治療された334人の悪性卵巣腫瘍患者と101人の良性卵巣腫瘍患者の診断時年齢および術前血液検査32項目のデータに基づいて,術前に腫瘍の
良悪性の判定や進行期,組織型などの特性予測に取り組みました(Clin Cancer Res. 2019[PMID:30979733])。 |
-
Application of Artificial Intelligence for Preoperative Diagnostic and
Prognostic Prediction in Epithelial Ovarian Cancer Based on Blood
Biomarkers. |
|
7 |
なぜ卵巣腫瘍患者に注目したのでしょう。 |
||
8 |
卵巣がんの治療は外科手術が第一選択と
なっていますが,化学療法への反応性も比較的良いため,術後に化学療法を行うことがほとんどです。一方で,進行期や組織型によって化学療法への反応性は大
きく異なります。最近は有効な抗がん薬も登場してきたので,何とか術前に特性を予測して治療戦略を立てられないかと思い,機械学習を導入しました。 |
||
9 |
なるほど。研究の詳細を教えてください。 |
||
10 |
図1(オリジナルサ
イト)に示すように機械学習の中にもさまざまな種類があります。今回はその一つであるランダムフォレスト(Random forest)
を利用しました。研究開始に先立ち,まずは術前血液検査データをもとに,良悪性の判定を予測したところ,AUC=0.968(註)と高精度に予測すること
ができました。こ
こまでは割と一般的な教師あり学習です。しかし,同様の手法を進行期予測に適用すると,AUC=0.760までしか上がらず,組織型の予測においても,組
織型によって大きな予測差が出てしまいました。 【註】:Area Under the Curveの略。2つのクラスターを分類する際の評価指標である。0~1までの値を取り,一般的に0.8以上が高精度と考え られている。 |
||
11 |
進行期と組織型がうまく判定できなかった
のは,単にアルゴリズムやデータの質の問題だったのでしょうか。 |
||
12 |
最初はそう考えていました。ですが,組織
型分類は別として,本来,進行期の分類は,薬剤の効果や5年生存率など個人の予後につながる因子を踏まえて分けているにすぎず,分類が絶対的ではないはず
です。そのため,既存の分類や数値自体を疑い,予測できない理由を検証しました。 |
||
13 |
どのように研究アプローチをしたのです
か。 |
||
14 |
ランダムフォレスト(図2:
ランダムフォレストのイメージ)に基づく教師なし学習を実行し,分布を見てみました。すると,良性卵巣腫瘍は左側,進行卵巣がんは右側にきれいに分かれま
した(図3:
ランダムフォレストに基づく教師なし学習を用いた卵巣腫瘍の進行期別の分布)。左図のような条件に基づいて振り分ける決定木を,右図のようにランダムに数
千~数万組み合わせ,各決定木の予測結果の多数決もしくは平均を取ることで結果を得る手法。 |
||
15 |
早期卵巣がんの分布では,良性卵巣腫瘍に
近いタイプ(クラスタ1)と進行卵巣がんに近いタイプ(クラスタ2)に分かれていますね。 |
||
16 |
おっしゃる通りです。この結果は,早期卵
巣がんと診断された患者の中で再発や死亡の転帰をたどる患者は進行卵巣がんのタイプに近く,逆に良性卵巣腫瘍に近いタイプの患者は,再発も死亡もほとんど
しないことを示しています。すなわち,早期がんとくくられるがんに多様性があるために,既存の分類の基準を教師データとして区別しようとするAIでは,高
精度に予測できるはずがなかったのです。 |
・教師あり学習(Supervised
learning) |
|
17 |
この教師なし学習(Unsupervised
Learning)の使い方は興味深いです。通常,医学分野で用いられる機械学習の多くは教師あり学習ですが,その限界は教師データが医師の診断
になることです。つまり,医師を超える発想は生まれません。教師なし学習が人間では想定し得ない可能性に気付かせてくれることもあるのですね。 |
・教師なし学習(Unsupervised Learning) | |
18 |
当然ながらAIが導き出した結果が臨床的
にあまり意義のない結論になる可能性はあるものの,その結果を臨床側にフィードバックし,「何か見落としはないか」「気になったことはないか」と聞くこと
で,さらなる気付きにつながることもあります。医学部の中にAIセンターができたことでこうした臨床へのフィードバックがしやすくなりました。 |
||
19 |
AIを活用するためには数百~数万の症例
を集めたビッグデータが必要と考える人は多いと思います。最近では学会主導でデータを集積して,深層学習を用いた診断支援システムの開発を活性化しようと
する動きも出てきました。川上先生はこの流れをどう見ていますか。 |
||
20 |
画像解析(Image analysis)
など,すでに研究手法が確立された分野に関しては,公共事業のように学会規模でデータを収集して最高精度を達成しなければならないと考えています。ただ
し,目標設定のないままデータを集積しても使えないデータを大量に集めるだけです。「何を測り,何を解明するか」という目標設定が重要になります。/一方
で,難病で症例数が少なかったり,画一的なデータがそもそも集まらなかったりする領域では,深層学習を活用できるほどのビッグデータを集められません。こ
の領域に対してAIが何ができるかを考えるのは,これからの課題であり,ディープフェノタイプ研究の出番でもあります。 |
||
21 |
何か策はあるのでしょうか。 |
||
22 |
現在,アトピー性皮膚炎の患者100人を
対象とした小規模研究を行っています。対象患者には1年間,毎月来院していただき,血液検査や皮膚の細菌叢の検査,身体診察など,あらゆるデータを蓄積し
ているところです。言わば,患者1人からビッグデータを生み出すようなものです。/今年度中にはデータの収集がひとまず終了するので,データをもとにAI
の演算能力を生かし,解析結果から疾患に影響するであろう項目に絞って,より患者数を増やした大規模研究へと発展させる予定です。 |
||
23 |
確かに,あらゆる検査項目を学習させるこ
とはコストや人的資源の問題を考えても現実的ではなく,何を学習させるべきかを判断する探索的な小規模研究は必要となるはずです。ビッグデータ(big data)を活用した大規模研究とこ
うした小規模研究のメリットをそれぞれ理解して,多方向からデータを集めなければなりませんね。 |
・ビッグデータ(big data) | |
24 |
ええ。はっきり言ってしまえば,世
界を牛耳るGAFA(Google,Amazon,Facebook,Apple)や,国を挙げてデータ収集に取り組む中国に,データ量では到底勝てませ
ん。ですので,まだまだ発展途上の分野である,少量のデータから特徴を抽出する手法の開発が,これからのAI研究の醍醐味です |
・人工知能研究開発の智政学
(Knowledge-politics)的可能性を示唆。 |
|
25 |
同感です。さらに言えば,一つの高性能な
研究モデルを作って満足するのではなく,そのモデルを新しいコホートに導入したり,他施設でも適用できるよう修正するなど,持続可能な形で新たな研究を作
り続けることが必須と考えます。 |
||
26 |
これまで述べてきたように,AIを医学に
応用する手法は日進月歩で考えられ,応用範囲は多岐にわたります。AI研究のそうした多様性も影響してか,最近は「医師がAIを勉強すべきなのか」との話
題を耳にします。/今年6月には,政府が主導する「AI
戦略 2019[pdf]」の教育改革の一つとして「数理・データサイエンス・AI教育」が目標に掲げられ,専攻にかかわらず全学部の大学生が
AI教育を受ける方針が発表されました。浅井先生は医学部の学生を対象に,すでにAI教育を開始しているようですね。 |
・国立大学は、政府の主導戦略には追随す
べし! |
|
27 |
はい。現在は「医用統計学・医用AI学」
と題した講義をしています。この講義では従来の統計学に加えてベイズ統計学や,統計学の延長線上にある機械学習の内容も取り入れ,演習では統計言語「R」
も活用しています。また,新設した「システムバイオインフォマティクス学」の講義では,AIとシステムバイオロジー,バイオインフォマティクスの入門を講
義しています。 |
||
28 |
学生は講義に対してどのような反応を見せ
ているのでしょう。 |
||
29 |
AI解析を難しすぎると思う層と,もっと
時間を割いて勉強したいと思う層に大きく分かれています。ただ,どちらの層も将来的に必要な分野ととらえているようで,おおむね興味を持ってもらえている
印象です。 |
||
30 |
AIに関心を寄せる学生に特徴はありますか? |
・AIに興味をもつ学生のプロファイル解
析は必須 |
|
31 |
傾向の一つとして,社会人や他学部を経験した学士編入の方が多い気がします。 |
・社会の多様性に気づいている学生のほう
がAIに関心をもつ(仮説) |
|
32 |
私が主宰する研究室でも同様に,他分野の
経歴を持つ方が多いです。例を挙げると,素粒子物理学を専攻し,脳科学を研究した後で研究室に来た研究員,大学で純粋数学を専攻し,医学部に再入学後,当
研究室に来た学生など,枚挙にいとまがありません。AI研究を多角的に進めるために
もこうした多様なバックグラウンドを持つ人材は貴重です。 |
・社会の多様性に気づいている学生のほう がAIに関心をもつ(仮説の追認) | |
33 |
あとは,もともと数学が好きだった学生も
含まれると思います。医学生の中には,本当は数学が好きであるにもかかわらず,入試
で好成績が取れてしまったがために医学部に進学してしまい,医学に興味を持てずにいる学生は一定数存在します。これまでは他の医学生と共に
医学を修める中で,幸か不幸か数学への興味が薄まり,多くの人が立派な医師となってきたはずです。医学部にAI講座ができることによって,こうした学生の受け皿になれたとも感じ
ています。 |
・数学好きの医学生の数学能力を潰してい
るのは、医学部教授や研究体制ということになる(厳しい現実) |
|
34 |
そうですね。今までは従来の医師の枠に当
てはめられ,その中では能力があまり高くないとの評価が下された方もいました。最近
は「授業で数学を使う機会がなかった」と言って,数学を使った研究をしたいと話す医学生も出てくるようになりましたね。ただし,こうした学
生はあくまで少数派です。医学生全員にAI教育をする意義はどこにあると考えますか。 |
・数学好きの医学生の数学能力を潰してい るのは、医学部教授や研究体制ということになる(厳しい現実の再確認) | |
35 |
AIとは何者なのかを知る機会の提供だと
思います。恐らく約10年後には身の回りにAIを活用した診療機器があふれ,AIに依拠した診断をする医師も現れるでしょう。そうした世の中で医師となる
前に,AIの仕組みを学んでおいてもらいたい。少なくとも仕組みさえ理解していれば,不具合があったときやAIを用いた臨床研究をしたいときなどに勘所が
持てるようになるはずです。決して,未来の医師全員に診療機器を自分の手で開発・改
良してほしいわけではありません。 |
・すべての臨床医がAIに適応的になる必
要はない。 |
|
36 |
それに,医師自身が解析する必要もないは
ずですよね。重要なのはデータの扱い方を見極められるようになること。データサイエ
ンティストに「こう頼めば,こうなる」とイメージできれば研究の視野が広がり,医学分野のAI研究は一変するはずです。 |
・臨床医とデーターサイエンティストの連 携が重要。ということは、臨床医とデーターサイエンティストの「連携領域」の創設は必須でしょう。 | |
37 |
医師とデータサイエンティストの今後のさ
らなる連携によってAI研究が推進され,医療が変わっていく未来が楽しみで
すね。 |
・ここから「医療は変わらねばならない」
というテーゼを引き出すことは可能か? |
|
あさ い・よしゆき→1998年阪大基礎工学部卒。2003年同大大学院基礎工学研究科修了。博士(工学)。イタリアのトリノ大,スイスのローザンヌ大にて 医学・生理学分野における数理情報工学の研究に従事し,05年に帰国後,産総研(AIST)人間福祉医工学研究部門研究員となる。 その後,システムバイオロジー研究の ため,阪大臨床医工学融合研究教育センター特任准教授,沖縄科技大学院大オー プンバイオロジーユニットグループリーダーを経て,16年に山口大大学院環境 保健医学講座(当時)教授就任。18年より新たに発足した同大AIシステム医学医療研究教育センター長を兼務。 | かわか み・えいりょう→2007年東大医学部卒。大学入学当初よりAI研究に関心を持ち,臨床研修を行わずに同大大学院医学系研究科博士課程へ進学。博士 (医学)。科学技術振興機構ERATO河岡感染宿主応答ネットワークプロジェクトの博士研究員を経て,13年に理研統合生命医科学研究センター(IMS)特別研究員 となる。17年には理研医科学イノベーションハブ推進プログラム健 康医療データAI予測推論開発ユニットリーダーに就任。19年1月より理研とのクロスア ポイントメントとして現職を兼務。同年4月に千葉大医学研究院附属 治療学人工知能(AI)研究センターのセンター長就任。 | 出典:浅井義之と川上 英良「データサイエンティストが描くAI研究の未来像」『医学界新聞』第3345号 2019年11月4日 http://www.igaku-shoin.co.jp/paperDetail.do?id=PA03345_01 |
***
プレシジョン・メディシンの重要な要素の
1つは、重篤な病気の患者を迅速かつ確実に見つけることである。その実現には機械学習が役立つ可能性があるが、適切なデータの機密性を効果的に保持するシ
ステムを実現するのは難しい。今回J
Schultzeたちは、エッジコンピューティングと、ブロックチェーンに基づくピアツーピアのネットワーク化と管理を組み合わせた分散型AIである群れ
学習(Swarm
Learning)を用いて、この問題に取り組むことができると示している。彼らは、この分散型機械学習を用いて、1万6400個の血液トランスクリプ
トームと9万5000枚の胸部X線画像に基づき、白血病、新型コロナウイルス感染症(COVID-19)、結核などを分類する、疾患分類法を開発した。こ
の分類法は、機密保持規制を守りながらも、個々の医療施設で開発された方法より優れていた。著者たちは、群れ学習の分散型の性質とブロックチェーン技術を
組み合わせることで、機密性を損なうことなく大規模なデータセットを利用できるようになると述べている。「Cover
Story:群れ学習:分散型AIネットワークが生成するプレシジョン・メディシン向けの機密性の高い疾患分類法」Nature, doi:
10.1038/s41586-021-03583-3 |
Swarm Learning for
decentralized and confidential clinical machine learning -
群知能(ぐんちのう、むれちのう、Swarm Intelligence,
SI)は、分権化し自己組織化されたシステムの集合的ふるまいの研究に基づいた人工知能技術である。「群知能」という用語は、1989年 Gerardo Beni (1946- )
および Wang が提唱したもので、セルラーロボットシステムに関して使ったのが最初である |
Electrowetting,
Electrowetting is the modification of the wetting properties of a
surface (which is typically hydrophobic) with an applied electric field. |
エ
レクトロウェッティング(英:
Electrowetting)とは、(典型的には疎水性の)表面に電場を印加することにより、濡れ性を変化させることである。水銀やその他の液体がさま
ざまな荷電表面上でエレクトロウェッティングの振る舞いを示すことはより古くから観測されていたが、これを初めて1875年に説明したのはガブリエル・
リップマンである。1936年、アレクサンダー・フルムキン(Alexander Frumkin,
1895-1976)は表面電荷を用いて水滴の形状を変化させた。エレクトロウェッティングという用語が初めて導入されたのは1981年のことで、G.
Beni および S. Hackwood
が新型ディスプレイ設計の特許において用いられる効果を説明するために用いられた[1]。化学的・生物学的な液体をマイクロ流体回路中の「液体トランジス
タ」により操作することは1980年に J. Brown
により調査され、1984年から1988年にかけてアメリカ国立科学財団から絶縁疎水性誘電体層
(EWOD)、非混和性流体、直流および高周波電源、微小な鋸歯型電極アレイと ITO
電極を用いてナノ液滴を直線形、円形、および指示された経路にそってデジタル的に移動させ、流体を圧送・混合させ、貯留し、液体の流れを電気的もしくは光
学的に制御する技術に NSF Grants 8760730 & 8822197[2]
により資金が拠出された。のちに、アメリカ国立衛生研究所の J. Silver との共同研究により、EWOD
ベースの単一流体もしくは非混和性流体の移動、分離、保持およびデジタル PCR
サブサンプルの封止手法が公開された[3]。エレクトロウェッティング効果は「固体-電解液間に印加される電圧による固体-電解液接触角の変化」と定義さ
れる。エレクトロウェッティング現象は、電場が印加された結果として生じる力を考えることにより説明することができる[9][10]。電解液滴の端付近の
フリンジ電場は液滴を電極に押し付ける力を生じさせ、巨視的な接触角を小さくし、接触面積を広げる傾向がある。また、熱力学的見地から説明することもでき
る。表面張力はある面積の表面を生じさせるために必要なヘルムホルツの自由エネルギーとして定義されるが、問題の系におけるヘルムホルツの自由エネルギー
は化学的成分と電気力学的成分で書き下すことができる。化学的成分は電場が無い場合の通常の固体-電解液界面の表面張力に等しいが、電気力学的成分は導体
と電解液間に形成されるキャパシタに蓄えられるエネルギーに等しく、この成分は印加する電場によって変動する。 |
What is Data Science? - UC Berkeley
"Data science continues
to evolve as one of the most promising and in-demand career paths for
skilled professionals. Today, successful
data professionals understand that they must advance past the
traditional skills of analyzing large amounts of data, data mining, and
programming skills. In order to uncover useful intelligence for
their organizations, data scientists must master the full spectrum of
the data science life cycle and possess a level of flexibility and
understanding to maximize returns at each phase of the process."
リンク(医学とデーターサイエンス)
リンク
文献
その他の情報