革新知能統合研究センター ロボットラーニングチーム
チームディレクター 長 隆之(Ph.D.)
研究概要
 実世界で自律的に機能するロボットシステムの実現には、与えられたタスクを効率よく学習するための枠組みや、多様な環境に迅速に適応するための枠組みが不可欠です。私たちのチームでは、強化学習や模倣学習などのアプローチを通じて、ロボットが動作を効率よく学習し、自律的に機能するためのアルゴリズムの開発および実ロボットシステムの開発に取り組んでいます
研究主分野
- 情報学
 
研究関連分野
- 工学
 - 総合人文社会
 - 総合理工
 - 数物系科学
 - 知能ロボティクス
 - 知能情報学
 - ロボティクスおよび知能機械システム
 
キーワード
- ロボット学習
 - 強化学習
 - 模倣学習
 - 動作計画
 
主要論文
「*」は、理研外のみでの成果です。
- 1.
T. Osa and T. Harada
"Discovering Multiple Solutions from a Single Task in Offline Reinforcement Learning"
Proceedings of the International Conference on Machine Learning (ICML), 2024. - 2.
J. Ackermann, T. Osa, and M. Sugiyama
"Offline Reinforcement Learning from Datasets with Structured Non-Stationarity"
Proceedings of the Reinforcement Learning Conference (RLC), 2024. - 3.
M. Omura, T. Osa, Y. Mukuta, T. Harada
"Stabilizing Extreme Q-learning by Maclaurin Expansion"
Proceedings of the Reinforcement Learning Conference (RLC), 2024. - 4.
*T. Osa and T. Harada
"Robustifying a Policy in Multi-Agent RL with Diverse Cooperative Behavior and Adversarial Style Sampling for Assistive Tasks"
Proceedings of the IEEE International Conferences on Robotics and Automation (ICRA), 2024. - 5.
N. Morihira, P. Deo, M. Bhadu, A. Hayashi, T. Hasegawa, S. Otsubo, T. Osa
"Touch-Based Manipulation with Multi-Fingered Robot using Off-policy RL and Temporal Contrastive Learning"
Proceedings of the IEEE International Conferences on Robotics and Automation (ICRA), 2024. - 6.
T. Osa
"Motion Planning by Learning the Solution Manifold in Trajectory Optimization"
The International Journal of Robotics Research, Vol. 41, No. 3, pp. 291-311, 2022. - 7.
T. Osa
"Multimodal Trajectory Optimization for Motion Planning"
The International Journal of Robotics Research, Vol. 39 No. 8, pp. 983–-1001, 2020. - 8.
*T. Osa, V. Tangkaratt, M. Sugiyama.
"Hierarchical Reinforcement Learning via Advantage-Weighted Information Maximization"
Proceedings of the International Conference on Learning Representations (ICLR), 2019. - 9.
*T. Osa, J. Pajarinen, G. Neumann, J. A. Bagnell, P Abbeel, and J. Peters.
"An Algorithmic Perspective on Imitation Learning"
Trends and Foundations in Robotics, Vol. 7: No. 1-2, pp 1-179, 2018. - 10.
*T. Osa, N. Sugita, and M. Mitsuishi.
"Online Trajectory Planning in Dynamic Environments for Surgical Task Automation"
Proceedings of Robotics: Science and Systems (R:SS), 2014. 
関連リンク
メンバーリスト
主宰者
- 長 隆之
 - チームディレクター
 
メンバー
- 池本 周平
 - 客員研究員
 - 加藤 泰大
 - 客員研究員
 - 太田 一毅
 - 研究パートタイマーⅠ
 - 張 仁彦
 - 研究パートタイマーⅠ
 - 橋本 智洋
 - 研究パートタイマーⅠ
 - 阿部 陽樹
 - 研究パートタイマーⅡ
 - 原 健宏
 - 研究パートタイマーⅡ
 
採用情報
| 募集職種 | 応募締切 | 
|---|---|
| 研究員または特別研究員募集(W24316) | ポストが決まり次第 | 
お問い合わせ先
〒103-0027 東京都中央区日本橋1-4-1 日本橋一丁目三井ビルディング 15階
   Email: takayuki.osa@riken.jp
