イベント情報

学術情報メディアセンター > イベント情報 > 学術情報メディアセンターセミナー「人の行動を理解するVision & Language技術」

学術情報メディアセンターセミナー「人の行動を理解するVision & Language技術」

Post date:2023/09/20

京都大学学術情報メディアセンターでは、各分野でご活躍の講師を招き、それぞれの研究開発活動の内容や現在抱えている課題についてご紹介いただき、参加者を含めて広く議論を行う機会として、月例セミナーを開催しています。

10月17日の本セミナーでは、産業技術総合研究所人工知能研究センターの八木 拓真 氏に講演いただきます。学内外を問わず多数の方のご参加をお待ちしています。

日時 2023/10/17(火)15時00分〜16時30分
会場

ハイブリッド開催(会場およびオンライン)
 【会場】京都大学 学術情報メディアセンター南館 2階 202マルチメディア講義室
     吉田南構内マップ[93番]
 【オンライン】Zoomを使用します。

定員
参加費用 無料
参加申込み ■現地参加ご希望の方:不要(会場にて受付いたします)
■オンライン参加ご希望の方:以下のフォームから事前にお申し込みください。
 https://kyoto-u-edu.zoom.us/meeting/register/tZEtdO2prDsvHdYzN1i0HjBD-7LpE_i6O7bA
主催

京都大学 学術情報メディアセンター

お問い合わせ

京都大学 学術情報メディアセンター 亀甲 博貴
TEL:075-753-7487
メール:kameko.hirotaka.6n * kyoto-u.ac.jp (*を@に変えてください)

プログラム

※すべて会場にて講演いたします。

◆15時00分~15時45分
講演者:八木 拓真(産業技術総合研究所 人工知能研究センター 研究員)
講演題目:一人称視点映像解析に基づく詳細人物行動認識
講演概要:映像からの人物行動認識は、人の行動を定量化できる点で産業上有用なトピックの1つである。これまで主に監視カメラなどの遠距離から撮影した人物行動の認識が取り組まれてきたが、これらの映像が扱う行動は人の豊かな日常行動のごく一部に過ぎない。人の身体に軽量のウェアラブルカメラを装着して撮影される一人称視点映像を様々な装着者や状況を対象に記録することで取り扱う人物行動のバリエーションを広げると共に、手を用いた道具操作といったより詳細な単位での人物行動認識が可能となる。詳細人物行動認識の実現にあたっては、映像データを集めるだけでなく、人の行動と周辺環境の構造を適切な粒度で定義し記述することが重要となる。本講演では、世界最大規模の一人称視点映像データセットである Ego4D およびバイオ実験行動映像データセットである FineBio を題材として、より高度な人物行動理解のための取り組みを紹介する。

◆15時45分~16時30分
講演者:亀甲 博貴(京都大学学術情報メディアセンター 助教)
講演題目:動画とテキストからの手順の理解
講演概要:作業手順の再現性を担保しつつ他者に伝えるために、作業内容を動画やテキストなどで記録する行いは重要である。動画は具体的な動作を示すことができ、テキストはそれぞれの手順の意味を完結に記述することができる。動画やテキスト、あるいはその対応を正しく理解することで、記述された作業を正確に再現したり、記録された作業の正確性を評価したりすることができる。本講演では、主に調理と生化学実験の2ドメインにおける研究室での取り組みを紹介する。

備考

※授乳室を設置しています。ご利用の場合は事務室(電話番号075-753-7400)にお申し付けください。

|
ページトップへ
Copyright © Academic Center for Computing and Media Studies, Kyoto University, All Rights Reserved.