研究

マシンラーニング

概略

コンピュータに何かを計算させるときには、どのような手順で処理を行うかを示した手順書(プログラム)を書いて実行します。この時、数式などを用いて定義できる問題を解くときは、どのような処理を行えば良いかが明確であり、プログラムが書きやすいことが多いです。しかし、例えば人が話している音声から話している内容を文字に起こしたり、写真に写っているものが何かを答えたりという処理を行う際には、人間にとって簡単だったとしても、これを解くプログラムを書くという作業は非常に困難です。なぜなら、コンピュータが扱うデータは音声波形の情報や赤青緑の色情報の羅列であるため、このようなデータから話している内容を出力したり、何の画像なのかを判断する処理を数学的に記述することはほとんど無理だからです。
そこで注目を集めるのが、機械学習です。機械学習では、たくさんの既知のデータからパターンを抽出し、未知のデータに対してもその抽出したパターンにもとづいて正しい判断ができるように知識の獲得を行います。機械学習には様々な手法がありますが、脳の神経細胞の信号伝達と似た仕組みを使った深層学習という手法が高い精度で画像認識ができるようになった1のを始めとして、近年では他の分野でも機械学習が十分に信頼できる精度を出せる範囲が急速に広がっています。

ICReDDでの取り組み

ICReDDでは、化学反応の実験により得られたデータや計算化学により得られた膨大なデータから、真に有用な新化学反応を発見することを目指しています。そのために、未知の反応物の組み合わせに対する反応性予測や生成物の物性予測を目指した機械学習の手法の開発を行っています2
また、化学反応の創成のために繰り返し行わなければいけない計算化学や化学実験にかかる時間や経済的なコストを抑えるため、機械学習による効率的なスケジューリングに応用可能なアルゴリズムの開発にも取り組んでいます3

引用文献
  1. ImageNet Large Scale Visual Recognition Challenge http://image-net.org/challenges/LSVRC/
  2. Alexandre Varnek and Igor Baskin, “Machine Learning Methods for Property Prediction in Chemoinformatics: Quo Vadis?”, Journal of chemical information and modeling, 2012.
  3. K. Tabata, A. Nakamura, J. Honda and T. Komatsuzaki, “A Bad Arm Existence Checking Problem”, Machine Learning, accepted for publication.