吉岡 真治

thumbnail image
吉岡 真治
主任研究者
北海道大学
関連ウェブサイト
連絡先

yoshioka atmark ist.hokudai.ac.jp

YOSHIOKA, Masaharu グループ
主任研究者
  • thumbnail image
    吉岡 真治

研究紹介

研究テーマ

論文からの情報・知識抽出とその活用

キーワード

知識マネージメント、オントロジー、情報検索、自然言語処理、設計学

研究概要

これまで世界中の科学者が発表した膨大な量の科学論文の中にある化学反応についての記述から化学反応ネットワークグラフに関連する知識を抽出し、化学反応の分析に利用することを目指しています。
この一連の作業を行うツールを開発し、化学者に提供することが、データサイエンティストと化学者の協力体制を構築する出発点となります。化学者はこのツールをとおして世界中の化学関連の研究から有用な情報を得ることができるようになりますし、データサイエンティストにとっては研究設計のプロセスや様々な分野の専門家のニーズを理解する第一歩となるからです。

文章から必要な情報を抽出する代表的なツールは自然言語処理ですが、コンピューターにテキスト中のどの部分がどのような概念を表しているのかを理解させるためには、アノテーションとよばれる注釈タグ付けプロセスが必要です。この作業を専門家に頼むのは、大きな負担となります。しかし、、ICReDDでは、先ほどのツールなどを活用したデータサイエンティストと化学者の連携を強化することにより、お互いにメリットのある体制を構築して協力しながら研究を進めることができると思っています。また、最近開発されたニューラルネットをベースとしたツールでは、増え続ける膨大な量の文献データを処理することで、大量のアノテーションの作業が必要なくなるかもしれません。これらのツールを用いて、化学反応に関する特徴的な情報を文献から自動的に抽出することが私の目標です。

研究者の思い

一般設計学で著名な吉川弘之教授が私の博士課程の指導教員でした。吉川教授は常々、研究により発見されるものは人類の利益になるものであるべきだとおっしゃっていました。「現代の邪悪なるもの」という言葉を使い始めたのは吉川教授です。現代の邪悪なるものとは、例えば安価で省力化されたプラスチック製のストローが環境汚染の原因物質となっているなど、他所でより大きな問題を引き起こしている設計解(製品)のことを指します。私は設計過程そのものを理解し、その理解をより広い世界に広げていくことで、このような現代の邪悪なるものが生みだす困難を克服していきたいと思っています。

MANABIYAコースの研修内容はこちらです。MANABIYA全般について詳しく知りたい方は、こちらをクリックしてください

代表的な研究成果

  • Construction of an In-House Paper/Figure Database System Using Portable Document Format Files
    Masaharu Yoshioka, and Shinjiro Hara, In Information Search, Integration, and Personalization: 10th International Workshop, ISIP 2018, Dimitris Kotzinos, Dominique Laurent, Nicolas Spyratos, Yuzuru Tanaka, and Rin-ichiro Taniguchi (eds), Springer-Verlag GmbH, CCIS 1040, 2019, 142-156
  • Extraction of Chemical and Drug Named Entities by Ensemble Learning Using Chemical NER Tools Based on Different Extraction Guidelines
    Thaer M. Dieb and Masaharu Yoshioka, Transactions on Machine Learning and Data Mining, 2015, Vol. 8, No. 2, 61-76
  • Framework for Automatic Information Extraction from Research Papers on Nanocrystal Devices
    Thaer M. Dieb, Masaharu Yoshioka, Shinjiroh Hara, and Marcus C. Newton, Beilstein Journal of Nanotechnology, 2015, Vol. 6, 1872-1882
    DOI: 10.3762/bjnano.6.190
  • On a Combination of Probabilistic and Boolean IR Models for WWW Document Retrieval
    Masaharu Yoshioka and Makoto Haraguchi, ACM Transactions on Asian Language Information Processing (TALIP), 2005, Vol. 4, No. 3, 340-356
    DOI: 10.1145/1111667.1111674
  • Physical Concept Ontology for the Knowledge Intensive Engineering Framework
    Masaharu Yoshioka, Yasushi Umeda, Hideaki Takeda, Yoshiki Shimomura, Yutaka Nomaguchi, Tetsuo Tomiyama, Advanced Engineering Informatics, 2004, Vol. 18, No. 2, 95-113
    DOI: 10.1016/j.aei.2004.09.004