自分の研究に関して
sngtjack 本研究は、ロボットなどの人工エージェントが人間らしい柔軟かつ効率的な行動を学ぶための「人間性学習」の実現を目指しています。人間は今の人工知能にはない高度な知的能力を持っており、人工知能は同様のことをするためにマシンスペックをかなり必要とします。特に、人間は世の中の不確実性に対して、「なんとなく」理解できる能力を持っていますが、これはエージェントには不可能な知的能力です。ここでは、人間の様々な性質を真似る学習をすることで、不確実な現象を完全にモデル化・理解するのではなく、限られた情報から柔軟に対処可能な知的行動の獲得を目指しています。
具体的には、ロボティクスを基本とし、実世界での知能システム応用を見据えた強化学習やマルチエージェントシステムを主軸として以下の研究に取り組んでいます。
マルチエージェント強化学習と理論の融合
概要
一般的に強化学習は理論的証明が難しいとされています。その理由は、多腕バンデット問題のようにシングルステップの問題であれば違いますが、基本的に強化学習は複数の行動を組み合わせて初めて目的を達成するマルチステップの問題だからです。結果として、最終的なエージェントの行動の収束に関しては保証されるものの学習過程の最適性は保証されません。皆さんも迷路を解く時に最終的に通った経路が正しいかどうかはわかりますが、正しい経路をどうやって導くのが最適かはわかりませんよね?強化学習の最適性はそれと同じ問題を抱えています。まして複数のエージェントが個々に動作するマルチエージェントシステムでは、行動の収束でさえも基本的に保証されておらず、最適かどうかも保証されていません。ここでは、マルチエージェント強化学習の理論的保証を目指して部分的にでもその収束や最適性を保証し、または既存の理論との融合による新たな展開を考えて研究しています。
ここでは、人間による合意形成やオークション理論をうまく組み合わせることで、マルチエージェント強化学習の構造の理論的な理解を促進し、基礎となる理論やメカニズムを創出します。
関連する業績
- 上野 史, 髙玉 圭樹. 目的制限に基づく通信なしマルチエージェント協調行動学習とその効果の証明, 電気学会論文誌C, 140巻, 1号, 2020, pp. 75-84. ダウンロードはこちら
- Fumito Uwano, Naoki Tatebe, Yusuke Tajima, Masaya Nakata, Tim Kovacs, and Keiki Takadama. “Multi-Agent Cooperation Based on Reinforcement Learning with Internal Reward in Maze Problem,” SICE Journal of Control, Measurement, and System Integration (SICE JCMSI), vol. 11, no. 4, 2018, pp. 321-330. ダウンロードはこちら
進化的機械学習による認識のエイリアシングを持つロボットの最適戦略学習と知識生成
概要
皆さんは見間違いをしたことがありますか?実はロボットも見間違いをします。そしてそれは我々よりもかなり深刻な問題を引き起こします。学術的には知覚エイリアシング(Perceptual Aliasing)といい、学習中に発生すれば今まで学習した結果が適切かどうかが担保されなくなり、ロボットが意図したこととは全く異なる挙動を始めます。ここでは、進化的機械学習であるLearning Classifier System (LCS)を利用して知覚エイリアシングが発生する環境の下での最適戦略の学習を実現します。具体的には、学習した内容をif-thenルールの形式(もし…ならば…するという形式)で一般的な知識として保持することで知覚エイリアシングによる認識の違いによる影響を軽減し、また過去の情報を活用したマップを構築することで環境を俯瞰して知覚エイリアシングを検知し解決します。
(Queensland University of TechnologyのProf. Will N. Browneとの国際共同研究)
関連する業績
- Fumito Uwano and Will N. Browne, “Enhancing XCS with Dual-Stream Identification for Perceptual Aliasing in Multi-Step Decision Making,” Proceedings of Genetic and Evolutionary Computation Conference 2025 (GECCO 2025), July, 2025. (to appear)
- Fumito Uwano and Will N. Browne, “Cognitive Learning System for Sequential Aliasing Patterns of States in Multistep Decision Making,” Proceedings of the Companion Genetic and Evolutionary Computation Conference 2024 (GECCO 2024), Melbourne, Australia, July, 2024, pp. 315–318.
- Fumito Uwano and Will N. Browne. “Hierarchical Frames-of-References in Learning Classifier Systems,” in Proceedings of Genetic and Evolutionary Computation Conference Companion 2023 (GECCO2023), Lisbon, Portugal, Jul. 2023, pp. 335-338. ダウンロードはこちら
マルチロボットシステムにおける強化学習
概要
マルチエージェント強化学習は、通常同期的に動作するなどの理想的な環境を前提として機能します。つまり全てのエージェントが同時に動くつもりでここのエージェントは学習するなど、通常では起こらない動作を想定してします。しかし、複数ロボットにおいてはその理想的な環境を保証できないことは多々あります。ここでは、複数ロボットを協調的に動作するような強化学習を実現するために、実ロボットで発生する制約を含めたリアルなモデルでの強化学習を実現します。具体的には、ロボット間の通信モデルの構築やそれを利用した強化学習の提案などを想定しています。特に、近年ではロボットはただ動くだけではなく、インターネットを利用してセキュリティやサービスの提供など様々なタスクをこなすことができるようになっていますが、強化学習でその全てを制御することは現状不可能です。そのため、複数の高性能ロボットの協調動作の獲得もここではターゲットにしています。
(岡山大学林准教授および埼玉大学原田准教授との共同研究)
関連する業績
- Fumito Uwano, “Learning Agents for Robotics: Trends and Next Challenges,” Journal of Robotics and Mechatronics, vol. 36, no. 3, 2024, pp. 508–516.
- Fumito Uwano and Keiki Takadama. “Reward Value-Based Goal Selection for Agents’ Cooperative Route Learning Without Communication in Reward and Goal Dynamism,” SN Computer Science, vol 1, no. 3, 2020, 18 pages. ダウンロードはこちら
強化学習を用いた自然言語文の意味的理解
概要
近年、ロボットに限らずAIの役割が飛躍的に大きくなってきています。皆さんもChatGPTを利用されたことがあるかと思いますが、大規模言語モデル(LLM)は私たちの知的活動を大きく助けてくれる存在になりつつあります。ではそれはロボットにとってはどうなのでしょうか?ロボットの知能を司る強化学習は、言語処理技術を駆使しても中々人間のように含意を理解することは難しいです。また、発言の信頼性に欠ける点も我々は気をつけられますが、ロボットには中々難しい作業です。ここでは、LLMの能力を最大限引き出せる強化学習「LLM駆動型強化学習」を探究し、より高次の意思決定を可能とする強化学習技術を確立しようとしています。特に我々が当たり前にできている「行間をよむ」などの自然言語文の意味的理解を促進する強化学習を新たに構築することを目指しています。
関連する業績
- Fumito Uwano, Ryota Kubo, and Manabu Ohta, “Natural Language-Based Reinforcement Learning for Acquiring Commonsense Knowledge from Partial Scenarios” Agents and Artificial Intelligence, ICAART 2024, Rocha, A. P., Steels, L., van den Herik, J. (Eds.), Lecture Notes in Computer Science, vol. 15592, Springer, Cham, 2025, pp. 256–274. ダウンロードはこちら
- Ryota Kubo, Fumito Uwano, and Manabu Ohta. “Reward Design for Deep Reinforcement Learning Towards Imparting Commonsense Knowledge in Text-based Scenario,” in Proceedings of the 16th International Conference on Agents and Artificial Intelligence (ICAART 2024), Roma, Italy, Feb. 2024, pp. 1213-1220. ダウンロードはこちら
小型惑星探査機のピンポイント着陸へ向けた自己位置推定
概要
私は学生時代に、所属研究室が参画していたSLIMプロジェクトに研究協力者として参加し、主に月面着陸機の自己位置推定プログラムの精度向上へ貢献していました。2018年からは研究室内のリーダーとして進捗の取りまとめ作業を担っていました。具体的には、クレータを利用したリアルタイムな自己位置推定で、月面着陸機が月周回軌道に入った際に月面の写真を撮影し、そこに映るクレータのパターンを月面地図のクレータパターンとマッチングして、自身が地図上のどこにいるのかを特定する技術です。特に、我々は3クレータからなる三角形の形状からパターンマッチングを実現しておりました。現在はプロジェクトとしてのSLIMは終了しましたが、研究として今までの知見を論文にまとめるとともに、AIを駆使した未来の航法を探ってみたいと思います。
関連する業績
- Keiki Takadama, Fumito Uwano, Yuka Waragai, Iko Nakari, Hiroyuki Kamata, Takayuki Ishida, Seisuke Fukuda, Shujiro Sawai, Shinichiro Sakai. “Artificial Intelligence for Spacecraft Location Estimation based on Craters,” in Artificial Intelligence for Space Applications, Madi, M., and Sokolova, O., (Eds.), CRC Press: Taylor & Francis, 2023, ch. 5, pp. 160−189.ダウンロードはこちら
- 石井晴之, 村田暁紀, 上野史, 辰巳嵩豊, 梅内祐太, 髙玉圭樹, 原田智広, 鎌田弘之, 石田貴行, 福田盛介, 澤井秀次郎, 坂井真一郎, 相似な三角形に基づくクレータマッチングによるSLIM探査機の自己位置推定とその精度向上. 航空宇宙技術, 17巻, 2018, pp. 69–78.ダウンロードはこちら