基調講演
長山 格 先生(琉球大学工学部 准教授)
講演題目: 「学習データの呪い」を解く学習スキーム・代替学習(Alternative Learning)の試み
安価で高速なメモリ、ストレージ、GPU等の発展に支えられた21世紀の機械学習システムや深層学習システムは、大量のデータとハードウェアリソースをふんだんに用いて、いわゆるリッチな億万長者的学習を実行することが当たり前となった。そして、学習アルゴリズムのみならず、学習に用いられるデータセットの品質・内容によっても、学習結果や学習精度の善し悪しが大きく影響されることが明らかになってきた。すなわち、機械学習・深層学習の利活用では「データセット」が重要な要素となる。
ところが、学習用データセットの収集・整備はなかなか大変な作業である。特に、画像認識系のタスクで必須の膨大なデータ群に対して正確なアノテーションや整備を行う作業では、(1)人手、(2)時間、(3)お金の3つが掛かる。これを我々の研究室では「学習データの呪い」と呼んでいる。この問題に対して、本研究室では代替学習(Alternative Learning)というアプローチを試みている。本講演では代替学習(Alternative Learning)のスキームと、これを応用したいくつかの研究について紹介する。