CLOSE

【遠隔配信のみ】第132回 視覚と言葉を通じたロボットとの共同作業を目指して

開催日2021年2月17日(水)10:00~17:00
開催地

遠隔配信で実施いたします
(講演後に見逃し配信予定)

会場
アクセス

配信システム:zoomウェビナー使用予定。
資料配布:クラウドサーバのBOX(https://app.box.com)よりダウンロード。
参加方法詳細はお申込み・お支払い後の返信メールにてご案内いたします

定員遠隔配信200名(定員になり次第締め切ります)
参加費
(税込)

参加費・システム手数料共に税込み価格です.
※ お支払の際,別途システム手数料「220円」を頂戴致します.

【WEB遠隔参加のみ】
※3密対策により複数人視聴のオプションはございません。 視聴される方各々お申し込みください。 当学会及び協賛学会の正会員(個人)/4,000円,会員外(一般)/8,000円
当学会及び協賛学会の学生会員(個人)/3,000円,会員外(学生)/5,000円
当学会賛助会員 招待券ご利用/無料,優待券ご利用/3,000円,左記サービス券なし/8,000円
特別優待券使用の場合:学生(RSJ会員非会員問わず)/無料,学生以外/3,000円

※コロナ禍により、本セミナーは2020年度の賛助会員招待券,優待券(有効期限:2020/12/31)をご利用いただけます。ご利用の場合、お手数ですがお申込み後に原本を学会事務局宛にご郵送ください。

主催一般社団法人 日本ロボット学会
協賛計測自動制御学会,産業技術連携推進会議 医療福祉技術分科会,システム制御情報学会,情報処理学会,人工知能学会,精密工学会,電気学会,電子情報通信学会,土木学会,日本感性工学会,日本機械学会,日本シミュレーション学会,日本神経回路学会,日本設計工学会,日本時計学会,日本人間工学会,日本バーチャルリアリティ学会,日本ロボット工業会,農業食料工学会,バイオメカニズム学会
セミナーレポートセミナーレポート

口上

 最近の深層学習の発展は、コンピュータビジョン分野や音声信号処理分野、自然言語処理分野などにおいて画像認識、音声認識、機械翻訳や対話といった既存の課題に対するブレークスルーとなりました。しかし、深層学習によるもうひとつの重要な恩恵として、諸課題のために各分野で独自に発展してきた技術体系が深層学習という共通技術を取り込んだことで、異分野間での相互参入障壁が低下したことも特筆するべき変化です。結果として、画像や動画と自然言語を行き来するビジョン&ランゲージと呼ばれる分野も確立し、ロボットとの対話的な処理に視覚データを活用する研究など、人同士であるかのように人とロボットが共同作業できる未来に近づく取り組みが広がっています。本セミナーでは、こうした多様な分野で研究を進める講師の皆様から、最近の動向についてご紹介いただきます。

オーガナイザー:牛久 祥孝(OSX / Ridge-i)

 

講演内容:

10:00-10:10 <開会挨拶・講師紹介>


10:10-11:30 1話 深層学習における判断根拠の視覚的説明と活用

中部大学 山下 隆義

 深層学習は画像認識分野において高い性能を達成し、認識する際の判断根拠の説明性について注目が集まっている。そして、判断根拠を視覚的説明として可視化する研究が進んでいる。視覚的説明は、人が深層学習の判断根拠を理解しやすいような形で可視化できるだけでなく、認識精度を向上させたり、人の知見を深層学習に導入したりできる。本講演では、Attention Branch Networkによる判断根拠の視覚的説明について紹介し、人の知見を取り入れる仕組みや強化学習への応用も合わせて紹介する。


11:30-12:30<休憩(昼食)>


12:30-13:50 2話 音声認識の基礎と音声合成

東京大学 高道 慎之介

 音声は、喉・口を動かして生成される観点で物理的であり、言語・感情の伝達手段という観点で情報的である。故に音声分野において、信号処理と機械学習が古くから共存してきた。深層学習の発展は、分野間での相互参入障壁を低下させるのみならず、音声分野における物理・情報を享受した新たな枠組みを提供し続けている。本講演では、音声の認識と合成を例にとり、最近の研究動向、異分野とのつながり、これから解くべき問題について触れる。


13:50-14:00 <休憩>


14:00-15:20 3話 自然言語処理とビジョン&ランゲージへの派生

NTT 西田 京介

 BERTに代表される、巨大なニューラルネットワークを大量のテキストで自己教師あり学習した汎用言語モデルの登場により、一部のベンチマークセットではAIが人間を凌駕するなど自然言語処理にパラダイムシフトが起きた。このアプローチは画像と言語の融合領域にも導入され、画像に対する質問応答などのタスクで大きな成果を挙げている。本講演では、自然言語処理およびビジョン&ランゲージについて最近の研究動向と今後の展望について触れる。


15:20-15:30 <休憩>


15:30-16:50 4話  対話における画像・音声・言語情報の利用

理化学研究所 吉野 幸一郎

 自然言語と画像情報を用いたVisual Question Answeringなどのビジョン&ランゲージから派生して、画像情報・視覚情報などをより広いコンテキストとして対話に用いようとする研究が行われるようになっている。この際、画像・音声・言語情報をどう効率的に利用するかが重要となる。また、実空間におけるロボット対話などでは観測される画像の情報を用いることが必要不可欠である。こうした対話研究におけるマルチモーダル情報の利用について概観し、具体的な研究をいくつか詳説する。


16:50-17:00 <閉会挨拶>


 

 

セミナー参加に関する注意事項

  1. 会場,講師,日時等は都合により変更になる可能性がございますのでご了承下さい.最新の情報は学会ロボット工学セミナーHPに掲載されます.
  2. 台風等警報発令時のセミナー開催中止判断については「災害時における中止判断」のページをご確認ください.
  3. 当日,参加者の理解を深めるためテキストを配布致します.2020年度より電子データで配布となり,会場参加/遠隔参加ともにメールにて事前に配信を行います.また,テキストの後日販売は行いません.
  4. 参加者のセミナー会場内での撮影・録音行為は禁止させて頂きます。なお、撮影・録音を含む取材をご希望の場合は必ず事前に学会事務局までお問い合わせください。