〜■■平成29年度総会・講演■■
「AI(人工知能)と生活・医療」 〜データ分析・IoT・機械学習ーー という”キーワード”からAIを解き明かす 講師 ーー 須藤 修(第25期 昭和49年卒)ーー
まず始めに、講演のサブタイトルに出てくる用語を押さえておきます。AI(人工知能)という言葉は、「Artificial Intelligence」を略したものですが、研究機関や研究者によっても定義は違います。けれども「AIネットワーク社会推進会議」の議長を務めた須藤氏は、《学習することにより、自らの出力やプログラムを変化させる機能をもつAIを組み込んだコンピュータ・システムである》と『報告書2017』(総務省)で定義しています。人工知能は自分でプログラムを書き換えていくし、人間がタッチしないで、進化していきます。 たとえば、グーグルのAIソフト「アルファ碁(AlphaGo)」(ディープマインド社のものを買収)が韓国のイ・セドル九段に圧勝したケースでは、人間が気づかなかった”一手”が勝負を分け、圧勝しています。2回も将棋七冠を達成した羽生善治竜王も「AIの指し手によって、人間の将棋も進歩する、人間の指す将棋の戦術が少し変わってきた」と、AIに重大な関心を持っています。 アルファ碁の場合、碁を打っている盤面の画像データからディープラーニング(深層学習)を使って、自分で高次の特徴量(機械学習では、データを分けるための特徴を、こう呼んでいます)を抽出し、それに強化学習を加えた「深層強化学習」を行った成果があらわれています。まず、人間が打った棋譜から300万の盤面を抽出し、パターン分析をさせた。そして盤面の情報を俯瞰させながら、勝敗を「報酬」に見立てて鍛えていっています。 次に自分との対局を繰り返し、人間の棋譜の数百倍にものぼるデータを作り出すことで、勝利につながる着手を自ら学習し、勝率を高めていったのです。「このあたりは弱そうだ」「ここは守るよりも攻めるときだ」といったような人間が直感で判断してきた場面を、アルファ碁は数学的に決断できるようになったのです。ただ対局の時に使った電力料金は32億円もかかっており、ほんとうはこんなモノ、使い物にならないと、須藤氏は嘆息する。 AIが最も得意とするのは、大量の情報処理です。ただ、AIの可能性が広がった背景には、ディープラーニングに代表されるAI技術(機械学習)や、コンピュータの計算能力の進歩に加え、AIが学習するための大量のデータが、IoT(モノのインターネット)で取得できるようになったからです。IoTとは(Internet of Things)の略で、あらゆるモノがインターネットにつながることを意味しています。 AIはIoTによって、進化を速めたと言われますが、その流れは以下の通り。 ■■IoT[モノ……あらゆるモノがインターネットにつながる]→→ビッグデータ[データ収集……大量・多種類・リアルタイムでデータを収集]→→ AIが【データ分析】を行い、分析結果で価値を創造する(たとえば経済活動なら、売上高の拡大やコスト削減を通じ、利益を増やし、企業価値を増加させる)■■というような流れになります。この「分析結果で価値を創造」という意味は、工業分野ではドイツで進める「インダストリー4.0(スマートカーやスマートグリッド=エネルギーなど)」、金融分野では「フィンテック(AIを使ったこれまでにない金融サービス)」として応用されています。 最近話題になっている「スーパーインテリジェンス」は、人間の叡智や能力を超えた超絶AIのことを指します。ただこれは、人類にとって脅威になると、ビル・ゲイツやイーロン・マスク、スティーブン・ホーキングなどが警告しています。 さて、前置きが長くなりましたが、須藤氏の講演から、氏のアイディアで行われた2つの事例をまとめて紹介します。 1つ目は、[情報を薬にするというもの]。情報も使い方によっては薬にすることはできるよねーーというコンセプト。須藤氏のアイディアは、九州大学病院の医療データのうち、糖尿病患者からのデータを使い、生活習慣病への保健指導ができるというもの。通院している患者の24時間データを採って、医療過誤を防ごうという狙いもある。歩く、走る、立つなどの基本動作を判別し(3軸加速度センサー)、フーリエ変換で”特徴量”をとっていき、デシジョンツリー(決定木)という数学のアルゴリズムを組み合わせます。アルゴリズムとは、「問題を解くカギとなる手順」で、AIはアルゴリズムを通じて、質問への回答や問題への解をを見つける手順をコンピュータへ伝達します。実験データから機械学習した結果、67.39%〜93.72%の正答率が示され、これは2010年当時、世界トップの正答率でした。この正答率とは、実際に何をやっているかという判別のこと。このとき世界で2番目の正答率はMIT(マサチューセッツ工科大学)、3番目がUCバークレー、4番目がアップルでした。 このデータ分析により、おおよその行動からおおよその消費カロリーを推測することができた。しかし現時点では、健康管理データとしては活用できるが、医学的に信頼できるデータとはいえなかったという。歩き方も人によって違うので、歩いているという学習をしながら、だんだん賢くしていくのです。これがマシンラーニング(機械学習)という、コンピュータの、”人工知能の核”になります。 次は、千葉市からの要請で、[データ解析によって予防医療をやり、病人を減らして、千葉市の財政負担を軽減しよう]というコンセプト。千葉市の人口96万人のうち、26万人が国民医療保険なので、医療請求書=レセプト200万件分をデータとして使い、分析しようというもの。2014年7月から、千葉市と東京大学(須藤研究室)のビッグデータに関する共同研究が始められた。 加えて、「高齢者の増加と多様なパターン」(東京大学高齢社会総合研究機構、秋山弘子教授による)のビッグデータ、男性3000人、女性3000人による高齢者の虚弱化のデータも参照している。 千葉大学と東京大学の共同研究でまとめたものが、「合併症のネットワーク図」です。120の疾病を、須藤研究室でRという分析ソフトを使い、ネットワーク分析したもの。その結果、数々の疾病のうち、高血圧症がネットワークの中心にあります。つまり高血圧は万病のもとであり、高血圧が継続すれば、腎臓、肝臓、心臓、血管、脳など、全部がやられていきます。また、45歳を超えてのジョギングは負担が大きく、体に悪い。女性は膝に負担をかけるから骨粗鬆症になりやすい。男性は汗を一杯かくので血栓ができやすい。血栓が心臓に入れば心筋梗塞、頭に行けば脳溢血になります。だから、45歳を超えれば水をもって歩いていただく。早歩きとゆっくり歩きを交互にやることが重要なのです。 現在、須藤氏が取り組んでいるのは「ディープラーニングを使った多言語音声翻訳」です。これには「ボイストラ(VoiceTra)」というアプリケーションソフトを使っており、このアプリは無料でダウンロードできます。32カ国語の言語の自動翻訳、音声翻訳をやっているとのこと。この目標は、「史上初めて、言語で苦労しないオリンピックを実現すること」。この開発を行っているのは「グローバルコミュニケーション開発推進協議会」で、須藤氏はその協議会の会長を務めている。東京と大阪にサーバがあり、、現在のところ15%ぐらい間違えるとのこと。そのうち、超並列コンピュータで処理するサーバなら、グーグルと十分戦えるはずだという。東京オリンピックでは医療、ショッピング、観光、鉄道、タクシーなんかで使われることになるでしょう。 (文責・長谷川隆義=S40年卒) 須藤修(すどうおさむ)プロフィール 東京大学大学院情報学環教授。東京大学情報教育センター長。総務省AIネットワーク社会推進協議会議長。グローバルコミュニケーション開発推進協議会会長。 ブラウザ左上に 戻る
|