Researchers Database

Kazuaki Yamada

    Department of Mechanical Engineering Associate Professor
    Research Institute of Industrial Technology Researcher
    Course of Advanced Mechatronics Systems Associate Professor
Last Updated :2024/04/23

Researcher Information

URL

Research funding number

  • 80345149

J-Global ID

Research Interests

  • Reinforcement Learning   Swarm Intelligence   マルチエージェントシステム   自律的機能形成   ニューラルネットワーク   学習アルゴリズム   データマイニング   自律的機能分化   創発   インタラクションデザイン   ナレッジインタラクションデザイン   共創   時系列データ分析   インタラクションヒストリ   知識共有コミュニティ   

Research Areas

  • Informatics / Web and service informatics
  • Informatics / Intelligent informatics
  • Social infrastructure (civil Engineering, architecture, disaster prevention) / Safety engineering
  • Social infrastructure (civil Engineering, architecture, disaster prevention) / Social systems engineering

Academic & Professional Experience

  • 2015/04 - Today  Toyo UniversityDepartment of Mechanical EngineeringAssociate Professor
  • 2009/04 - 2015/03  Toyo UniversityDepartment of Mechanical EngineeringAssistant Professor
  • 2008/04  Toyo University
  • 2005/11  東京大学大学院情報学環特任講師
  • 2002/04  The University of TokyoResearch Center for Advanced Science and Technology

Association Memberships

  • 日本機械学会   システム制御情報学会   計測自動制御学会   THE ROBOTICS SOCIETY OF JAPAN   INFORMATION PROCESSING SOCIETY OF JAPAN   THE JAPANESE SOCIETY FOR ARTIFICIAL INTELLIGENCE   

Published Papers

Books etc

  • 技術情報協会 (1章2節 人工知能の得意・不得意と効率化への適用)技術情報協会 2019/12 9784861047718 514p
  • 新世紀の工学シリーズ〈4〉 創発とマルチエージェントシステム
    山田 和明; 東京大学人工物工学研究センター教授; 上田 完次 培風館 2007/09 
    マルチエージェントシステムを実現するための手法として学習アルゴリズム(ニューラルネットワークおよび強化学習)について解説している.

Conference Activities & Talks

  • Yusuke Arai; Sho Yokota; Kazuaki Yamada; Akihiro Matsumoto; Hiroshi Hashimoto; Daisuke Chugo
    IECON 2018 - 44th Annual Conference of the IEEE Industrial Electronics Society, Washington, DC, USA, October 21-23, 2018  2018  IEEE
  • Yusuke Arai; Sho Yokota; Kazuaki Yamada; Akihiro Matsumoto; Daisuke Chugo; Hiroshi Hashimoto
    Internatinal Symposium on System Integration (SII2017)  2017
  • Value estimation method of products / services using wisdom of crowd  [Not invited]
    Kazuaki Yamada
    CIRP International Computation in Manufacturing Engineering (ICME 2016)  2016/07  Oral presentation
  • A Study of Learning Process for Learning Predictive Control System - Application to Ball Catch Problem -  [Not invited]
    Toru Aizawa; Kazuaki Yamada
    2016 JSME Conference on Robotics and Mechatronics (ROBOMECH2016)  2016/06  Poster presentation
  • アンサンブル平均を用いた粒子フィルタ - アンサンブルの統合方法に関する検討 -  [Not invited]
    山田 和明
    日本機械学会 情報・知能・精密機器部門講演会(IIP2016), G-1-4  2016/03  Oral presentation
  • Particle Filter using Ensemble Average - Relationship Between The Number of Particle Sets and Estimation Accuracy -  [Not invited]
    Kazuaki Yamada
    SICE 7th Symposium on Decentralized Autonomous Systems  2016/01  Oral presentation
  • 評判情報サイトにおける集合知を用いた製品/サービスの価値推定 - 粒子フィルタを用いたユーザ評価からの価値推定手法の開発  [Not invited]
    高橋 梓; 山田 和明
    第7回 ARG Webインテリジェンスとインタラクション(WI2), pp.43-48  2015/11  Oral presentation
  • 移動ロボットのためのベクトル表現を用いた環境情報の抽象化  [Not invited]
    新開 健; 山田 和明
    計測自動制御学会 システム・情報部門学術講演会2015(SSI2015), pp.1139-1142  2015/11  Poster presentation
  • ロバスト推定を用いた粒子フィルタの提案  [Not invited]
    山田 和明
    計測自動制御 システム・情報部門学術講演会2015, pp.1131-1134  2015/11  Poster presentation
  • RNNとRLを用いた学習予測制御 - 捕球問題への適用 -  [Not invited]
    山田 和明
    計測自動制御学会 システム・情報部門学術講演会2015(SSI2015), pp.1125-1130  2015/11  Poster presentation
  • Specialization in Swarm Robotics Using a Response Threshold Model  [Not invited]
    Kazuaki Yamada
    The First International Symposium on Swarm Behavior and Bio-Inspired Robotics (Swarm 2015), pp.316-321  2015/10  Oral presentation
  • Estimation of Product / Service Evaluations on Information Reputation Sites - An Approach based on Particle Filter and Smoothing -  [Not invited]
    Azusa Takahashi; Kazuaki Yamada; Kumiyo Nakakoji; Yasuhiro Yamamoto
    The 29th Annual Conference of the Japanese Society for Artificial Intelligence, 2015  2015/06  Oral presentation
  • Particle Filter using An Ensemble Learning  [Not invited]
    Kazuaki Yamada
    The 29th Annual Conference of the Japanese Society for Artificial Intelligence, 2015  2015/05  Oral presentation
  • An Interaction Pattern Library for Reputation Information Sites  [Not invited]
    Shota Kodama; Azusa Takahashi; Kazuaki Yamada; Kumiyo Nakakoji; Yasuhiro Yamamoto
    The 29th Annual Conference of the Japanese Society for Artificial Intelligence, 2015  2015/05  Oral presentation
  • A Specialization Approach Using A Response Threshold Model for Multi-Robot Systems  [Not invited]
    K. Yamada; Y. Yamazaki
    日本機械学会 ロボティクス・メカトロニクス講演会2015, CD-ROM 2A1-K07  2015/05  Poster presentation
  • A Long Term Prediction System Using Recurrent RBF Networks - The improvement of Learning Performance by Parameter Adjustment -  [Not invited]
    T. Aizawa; K. Yamada; T. Goto
    日本機械学会 ロボティクス・メカトロニクス講演会2015, CD-ROM 2A1-M08  2015/05  Poster presentation
  • A Particle Filter Approach for Reputation Information Systems - Performance Evaluations by A Multi-Agent Simulation -  [Not invited]
    Kazuaki Yamada
    2014 IEEE/SICE International Symposium on System Integration  2014/12  Oral presentation  Chuo University  IEEE/SICE
  • A Long Term Prediction System Using Recurrent RBF Networks - Improvement of Learning Speed Using BPTT -  [Not invited]
    Kazuaki Yamada
    The 24th Fuzzy, Artificial Intelligence, Neural Networks and Computational Intelligence  2014/09  Oral presentation  Kitami Institute of Technology  日本機械学会 ロボティクス・メカトロニクス部門
  • Estimating Product / Service Value On Reputation Information Sites -Application of Particle Filter-  [Not invited]
    Kazuaki Yamada
    The 24th Fuzzy, Artificial Intelligence, Neural Networks and Computational Intelligence  2014/09  Oral presentation  Kitami Institute of Technology  日本機械学会 ロボティクス・メカトロニクス部門
  • Content Value Estimations using Reputation Information  [Not invited]
    高橋 梓; 山田 和明; 松元 明弘
    The Robotics and Mechatronics Conference 2015  2014/05  Poster presentation
  • A Long Term Prediction System using Recurrent RBF Networks  [Not invited]
    後藤 拓馬; 山田 和明; 松元 明弘
    The Robotics and Mechatronics Conference 2015  2014/05  Poster presentation
  • Long-Term State Prediction of A Controlled Object using RRBFN  [Not invited]
    後藤 拓馬; 山田 和明; 松元 明弘
    The Confference of Information, Intelligence and Precision Equipment 2014  2014/03  Oral presentation
  • A Predictive Control System using RRBFN and Fuzzy Rule  [Not invited]
    Kazuaki Yamada
    The 26th Decentralized Autonomous Systems Symposium  2014/01  Oral presentation
  • Rule Propagation Approaches Between Agents for Multi-Agent Reinforcement Learning  [Not invited]
    渡辺 智美; 豊島 一樹; 山田 和明; 松元 弘明
    SSI2013  2013/11  Poster presentation
  • 相補ゲームのためのマルチエージェント強化学習 - 状態遷移図を用いた競合回避行動獲得プロセスの分析 -  [Not invited]
    渡辺 智美; 山田 和明; 松元 明弘
    第31回日本ロボット学会学術講演会, RSJ2013AC2C2-05  2013/09  Oral presentation
  • Acquisition of Conflict Avoidance Behaviors in Multi-Agent Systems - An Approach by Replication of Policies -  [Not invited]
    渡辺 智美; 山田 和明; 松元 明弘
    Robomech2013  2013/05  Poster presentation 
    Multi-agent systems (MAS) can construct flexible and robust system in dynamic environment. However, conflicts occur among agents because they share time and space with others. To resolve these conflic
  • Prediction Control System using RNN and Fuzzy Rules - An Adaptation to The Fly Ball Catch Problem -  [Not invited]
    山田 和明
    Robomech2013  2013/05  Poster presentation 
    This paper proposes a new predictive-control method by using recurrent neural networks (RNN) and fuzzy rules. We apply the proposed method to a fly ball catch problem. A robot can predict the trajector
  • Acquisition of Conflict Avoidance Behaviors by Agents Having Different Preference  [Not invited]
    山田 和明; 渡辺 智美
    SYS48  2013/03  Oral presentation
  • Building Maps based on Landmarks for Autonomous Robots  [Not invited]
    山田 和明; 高松 雄; 松元 明弘
    SI2012  2012/12  Poster presentation
  • Reliability-based Reinforcement Learning Approaches for Multi-Agent Systems -Relationship between Agents’ Identification and Learning Performance-  [Not invited]
    渡辺 智美; 高野 慧; 山田 和明; 松元 明弘
    SI2012  2012/12  Oral presentation
  • redictive Control Systems using RNN and Fuzzy  [Not invited]
    小林 美穂; 山田 和明; 松元 明弘
    SI2012  2012/12  Oral presentation
  • Neural Network Reinforcement Learning - Extension to Multi-agent Environment -  [Not invited]
    村石 光隆; 山田 和明; 松元 明弘
    SI2012  2012/12  Oral presentation
  • Reinforcement Learning Approaches for Dispersion Games  [Not invited]
    Kazuaki Yamada
    IEEE/SICE International Symposium on System Integration (SII2012)  2012/12  Oral presentation  Centennial Hall, Kyushu University, Fukuoka, Japan  IEEE/SICE
  • Mechanism Design for Knowledge Share Community  [Not invited]
    矢本 光一; 山田 和明
    Web Intelligence and Interaction  2012/12  Oral presentation
  • 異種センサ統合のためのニューラルネットワーク型強化学習 - 多リンクロボットアームによるリーチング問題への適用 -  [Not invited]
    村石 光隆; 山田 和明; 松元 明弘
    日本ロボット学会学術講演会2012, CD-ROM 3N2-1  2012/09  Oral presentation
  • マルチエージェントシステムのための信頼度を用いた強化学習 - エージェントの知覚能力と競合回避行動の獲得確率の関係 -  [Not invited]
    高野 慧; 山田 和明; 松元 明弘
    日本ロボット学会学術講演会2012, CD-ROM 3N2-4  2012/09  Oral presentation
  • RNNを用いた予測制御機構の提案 -三次元空間におけるボールの捕球問題への適応-  [Not invited]
    小林 美穂; 山田 和明; 松元 明弘
    日本ロボット学会学術講演会2012, CD-ROM 3N2-6  2012/09  Oral presentation
  • Reliability-Based Reinforcement Learning for Multi-Agent Systems  [Not invited]
    高野 慧; 山田 和明
    Robomec2012  2012/05  Poster presentation 
    本研究では,Q学習の割引率を信頼度を用いて自律的に調整し,エージェントの選好を分化させ競合回避行動の獲得を目指す.本稿では,提案手法として狭路問題に適用し,その学習過程の分析を通して有効性を検証した.
  • Predictive Control Systems using Recurrent Neural Networks  [Not invited]
    小林 美穂; 山田 和明
    Robomech2012  2012/05  Poster presentation 
    本研究では物理モデルを用いず,リカレントニューラルネットワークを用いてボールの軌道を学習し,ファジィ制御によりボールを捕球する予測制御システムを提案した.
  • Neural Network Reinforcement Learning for Different-Species Sensor Integration  [Not invited]
    村石 光隆; 山田 和明
    Robomec2012  2012/05  Poster presentation 
    本稿では,異種センサを含む多次元入力空間を扱える強化学習としてニューラルネットワークとタイリング手法の一つであるCMACを用いた手法を提案し,ロボットアームのリーティング問題に適用し,その有効性を検証した.
  • Reliability-based Q-learning Approaches for Multi-Agent Systems  [Not invited]
    高野 慧; 山田 和明
    SYS46  2012/03  Oral presentation 
    本研究では,マルチエージェントシステムにおいて発生する競合状態を回避するために, Q学習の割引率を信頼度を用いて自律的に調整し,エージェントの選好を分化させること で競合回避行動の獲得を目指す.本稿では,提案手法を狭路問題に適用し,その学習過程 の分析を通して有効性を検証した.
  • An Action Value Function Approximation using Neural Networks and CMAC for Q-learning  [Not invited]
    村石 光隆; 山田 和明
    SYS46  2012/03  Oral presentation 
    本研究では,強化学習法の一つであるQ学習を連続な状態・行動空間に拡張するため,ニ ューラルネットワークとCMACを用いた行動価値関数の近似方法を提案する.本研究の有 効性を検証するために,自律ロボットによるナビゲーション問題に適用する.
  • 信頼度を用いた強化学習によるマルチエージェントシステムの競合回避行動の獲得  [Not invited]
    山田 和明; 高野 慧; 渡辺 智美; 松元 明弘
    第12回 計測自動制御学会 システムインテグレーション部門講演会  2011/12  Oral presentation 
    本研究では,マルチエージェントシステムにおける競合回避行動を獲得するための新しい強化学習アプローチを提案する.提案手法は,従来のQ学習に,エージェントの行動の選好を分化させる方法を導入することで,マルチエージェントシステムに発生する競合状態を解消する.本研究では,提案手法を狭い通路を多数のエージェントがすれ違う狭路問題に適用し,その有効性を検証する.
  • Reinforcement Learning Approaches for Acquiring Conflict Avoidance Behaviors in Multi-Agent Systems  [Not invited]
    Kazuaki Yamada; Satoru Takano; Satomi Watanabe
    2011 IEEE/SICE International Symposium on System Integration  2011/12  Oral presentation 
    This paper proposes new reinforcement learning approaches for acquiring conflict avoidance behavior in multi-agent systems.
  • 知識共有コミュニティの持続的発展のための共創インタラクションモデル  [Not invited]
    山田 和明; 中小路 久美代東; 山本 恭裕; 矢本 光一
    情報社会学会 第4回知識共有コミュニティワークショップ  2011/12  Oral presentation
  • 多次元入出力空間における強化学習 - 多リンクロボットアームによる障害物回避行動の獲得 -  [Not invited]
    村石 光隆; 山田 和明; 松元 明弘
    計測自動制御学会 システム・情報部門学術講演会 2011(SSI2011). pp.358-363  2011/11  Oral presentation 
    従来の強化学習は,状態における行動の期待値をルックアップテーブルにより記述していた.そのため,強化学習を多次元入出力空間に拡張する研究が行われている.本稿では,自律ロボットの入出力空間をニューラルネットワークとCMACを用いて記述することで,多次空間において学習可能な強化学習を提案する.提案手法を多リンクロボットアームの障害物回避行動の獲得問題に適用し,その有効性を検証する.
  • ニューラルネットワーク強化学習のためのネットワークパラメータ設定方法  [Not invited]
    山田 和明
    第21回インテリジェント・システム・シンポジウム(FAN22011)  2011/09  Oral presentation 
    本研究では,ニューラルネットワーク強化学習における結合荷重の初期値および中間ノード数の設定方法を提案する.そして,自律移動ロボットのナビゲーション問題を通して従来手法との性能比較を通して提案手法の有用性を検証する.
  • 連続な状態行動空間における強化学習 - シグモイド型ネットワークとCMACを用いた行動価値関数の記述方法 -  [Not invited]
    山田 和明
    日本機械学会 ロボティクス・メカトロニクス講演会2011  2011/05  Oral presentation 
    本稿では,行動価値関数をシグモイド型ネットワークとCMACにより記述した連続な状態行動空間において学習可能な強化学習を提案した.そして自律ロボットによる経路探索問題を通して提案手法の有効性を検証した.
  • 知識共有サイトの制度により生じるユーザ間インタラクションのモデル化と実装  [Not invited]
    山田 和明
    第17回社会情報システム学シンポジウム  2011/01  Oral presentation
  • Reinforcement Learning using Sigmoid Networks and Griddy-Gibbs Sampler for Mobile Robots  [Not invited]
    Kazuaki Yamada
    Joint 5th International Conference on Soft Computing and Intelligent Systems and 10th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2010), pp.716-721  2010/12  Oral presentation
  • Setting Methods of Network Parameters for Reinforcement Learning Equipped with Artificial Neural Networks  [Not invited]
    Kazuaki Yamada
    The 14th Asia Pacific Symposium on Intelligent and Evolutionary Systems, 2010(IES2010)  2010/11  Oral presentation
  • 知識共有サイトの持続的発展のためのインタラクションモデル  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    合同エージェントワークショップ&シンポジウム2010(JAWS2010)  2010/10  Oral presentation
  • エージェント群における自律的な選好形成による競合回避  [Not invited]
    山田 和明
    第20回インテリジェント・システム・シンポジウム (FAN2010)  2010/09  Oral presentation 
    マルチエージェントシステム(MAS)では,複数のエージェントが資源を共有したり,個々のエージェントで目的が異なる場合がある.そのためMASでは,競合状態が発生し,システム全体のパフォーマンスが低下することがある.本研究では,MASにおいて,個々のエージェントが相互作用を通して自律的に評価関数を学習することで,競合状態を回避できることを,通路におけるすれ違い問題に適用して検証する.
  • 連続な状態行動空間において学習可能なQ-learningの提案  [Not invited]
    山田 和明
    日本機械学会 ロボティクス・メカトロニクス講演会2010  2010/06  Poster presentation 
    This paper proposes a new reinforcement learning that can learn mappings from the continue state space to the continue action space. The proposed method can estimates an expectation value of actions o
  • 知識共有サイトにおける共創プロセス分析のための学習エージェントアプローチ  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    第24回人工知能学会全国大会  2010/06  Oral presentation 
    知識共有サイトでは,ユーザの共創活動を持続・発展させるために様々な制度を導入している.本稿では,各サイトの制度がユーザや集団に与える影響をモデル化し学習エージェントにより知識共創プロセスを分析する.
  • マルチエージェントシステムにおけるエージェントの限定合理性と環境の複雑さの関係に関する一考察  [Not invited]
    山田 和明
    計測自動制御学会 システム・情報部門 学術講演会 2009  2009/11
  • オンラインコミュニティユーザの行動決定に関わるマルチエージェントシミュレーションモデル  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    合同エージェントワークショップ&シンポジウム2009 (JAWS2009)  2009/10  Oral presentation
  • マルチエージェントシミュレーションを用いた持続的知識コミュニティのためのインタラクションデザイン  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    人工知能学会全国大会  2009/06  Oral presentation
  • 知識コミュニティ分析のための学習エージェントアプローチ  [Not invited]
    山田 和明
    第53回システム制御情報学会 研究講演発表会  2009/05  Oral presentation
  • オンラインコミュニティにおける知識共創のモデル  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    人工知能学会 知識流通ネットワーク研究会 第4回研究会  2009/03  Oral presentation 
    オンラインコミュニティを持続発展させるためには,適切な制度設計が重要になる.本研究では,既存のコミュニティを調査し,コミュニティに対するユーザの貢献の種類と仕方および知識共創プロセスのモデル化を行った.
  • オンラインコミュニティにおけるインセンティブメカニズムのモデル化  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    合同エージェントワークショップ&シンポジウム2008 (JAWS2008)  2008/10  Oral presentation 
    オンラインコミュニティを持続的に発展させるためには,適切な制度設計が重要である.本研究では,コミュニティに参加するユーザのインセンティブのモデル化し,MASにより提案モデルの妥当性を検討した.
  • オンラインコミュニティにおける制度設計のためのマルチエージェントシステムの構築  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    第18回インテリジェント・システム・シンポジウム (FAN2008)  2008/10  Oral presentation 
    動画共有コミュニティ等のオンラインコミュニティを持続的に発展させるためには適切な制度設計が必要である.本研究はマルチエージェントシミュレーション(MAS)による制度設計の支援方法に関する研究である.
  • オンラインコミュニティにおける制度設計に関する一考察  [Not invited]
    山田 和明; 中小路 久美代; 山本 恭裕
    第11回Webインテリジェンスとインタラクション研究会  2008/03 
    マルチエージェントシミュレーションを用いたオンラインコミュニティにおける制度設計に関する研究
  • YAMADA Kazuaki
    Technical report of IEICE. KBSE  2007/01 
    This paper proposes the visualization method of histories of online community activities, which was recorded for long time period in order to understand how the relationships among online community members alter with time. In order to create the new internet services and support to organize open source software development communities, it is important to understand how the community members take advantage of the internet, what interests members have had and how members construct the relationship among them and other members. The goal of our research is to model the transition processes of m...
  • JO Kazuhiro; YAMADA Kazuaki; NAKAKOJI Kumiyo
    情報処理学会研究報告. HI, ヒューマンインタフェース研究会報告  2005/11 
    We have conducted several experiments using auditory representations of the Tower of Hanoi problem to explore how sound attributes affect the understanding, rememberance, and comparisons of auditory expressions in problem solving. This paper reports some of our recent findings from the experiments, and discusses auditory interaction design guidelines.
  • 山田 和明; 中小路 久美代; 上田 完次
    人工知能学会全国大会論文集  2005  人工知能学会
  • Yamada K; Ohkura K; Ueda K
    ロボティクス・メカトロニクス講演会講演概要集  2004/06
  • Shirai Yoshinari; Nakakoji Kumiyo; Yamada Kazuaki
    情報処理学会研究報告. HI, ヒューマンインタフェース研究会報告  2004/02 
    The goal of our research is to develop an interaction design framework for the use of interaction histories of objects. Ubiquitous computing enables each of a variety of objects (including humans) to keep track of its/his/her interactions with other objects over a very long period of time. Little research has been done in support of how to design representations and operations to use such interaction histories of a large number of heterogeneous objects. This paper focuses on summarization and browsing techniques for interaction histories. We present a taxonomy for interaction history browsi...
  • Morita Masayasu; Yamada Kazuaki
    情報処理学会研究報告. HI, ヒューマンインタフェース研究会報告  2003/05 
    The latest breakthrough in the cellular phone technology had opened the door to new learning possibility in Japan. Today, about 73 million mobile phones are subscribed and about 3/4 of those mobile phones are capable of browsing mobile internet in Japan. The paper explains a design process of mobile-based learning (MBL) system called 'Pocket Eijiro' and its assessment results.
  • Yamada K; Ohkura K; Ueda K
    ロボティクス・メカトロニクス講演会講演概要集  2003  Poster presentation 
    強化学習の課題の一つに連続な状態空間の自律的構成方法がある。これまで構成された状態空間の評価はタスク達成の正否でしか判断されていなかった。本稿では, 情報量基準AICによる状態空間の評価方法を提案する。
  • KOJIMA Fumihiro; YAMADA Kazuaki; OHKURA Kazuhiro; UEDA Kanji
    自律分散システム・シンポジウム資料 = SICE Symposium on Decentralized Autonomous Systems  2002/01
  • Yamada K; Ohkura K; Ueda K
    ロボティクス・メカトロニクス講演会講演概要集  2002 
    マルチエージェント環境において, エージェント間に発生するダイナミクスに対応した行動戦略を発見する手法として強化学習が注目を集めている。本研究では状態空間の自律的分割機構を持つ強化学習を自律エージェントの意思決定機構として用い, 2台のアームロボットによる協調荷上げ問題に適応する。そして, 他エージェントとの相互作用によって状態空間の分割に違いが生じ, その結果, 各エージェント間に役割分担が発生すること観測する。
  • 山田 和明; 大倉 和博; 上田 完次
    精密工学会大会学術講演会講演論文集  2001/09
  • 児島 史周; 山田 和明; 大倉 和博; 上田 完次
    精密工学会大会学術講演会講演論文集  2001/09
  • Yamada K; Ookura K; Ueda K
    ロボティクス・メカトロニクス講演会講演概要集  2001/06
  • 山田 和明; Svinin Mikhail; 上田 完次
    ロボティクス・メカトロニクス講演会講演概要集  2000 
    これまで強化学習では, 設計者が予めタスクにあわせて状態空間の分割を行っていた。しかし, 強化学習では状態空間の分割の粗さが学習結果に大きな影響を与えるため, 慎重な状態空間の設計が必要である。そこで本稿では, 教師なしクラスタリング手法を用いてロボットが環境との相互作用を通して自律的に状態空間を構成する方法を提案する。そして, 簡単なシミュレーション実験を通して学習過程の解析を行い, その有効性を検証する。
  • 山田 和明; SVININ Mikhail; 上田 完次
    精密工学会大会学術講演会講演論文集  1999/03
  • 山田 和明; 黒山 和宏; SVININ Mikhail; 上田 完次
    精密工学会大会学術講演会講演論文集  1998/03

MISC

Awards & Honors

  • 2014/09 The 24th Fuzzy, Artificial Intelligence, Neural Networks and Computational Intelligence Best Paper Award
     Estimating Product / Service Value On Reputation Information Sites 
    受賞者: Kazuaki Yamada
  • 第13回 計測自動制御学会 システムインテグレーション部門講演会(SI2012)においてSI2012優秀講演賞を受賞
     
    受賞者: 山田 和明
  • 第12回 計測自動制御学会 システムインテグレーション部門講演会(SI2011)においてSI2011優秀講演賞を受賞
     
    受賞者: 山田 和明
  • ファナックFAロボット財団の「平成16年度論文賞」 受賞
     
    受賞者: 山田 和明

Research Grants & Projects

  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2018/04 -2021/03 
    Author : Yamada Kazuaki
     
    Everyone could supply products and services on Web by growth of EC sites. Therefore, there are the mixture of good and bad ones in Web sites. It is difficult for consumers to estimate a fair evaluation of wide variety of products and services. Recently, reputation information sites where users can contribute and share an evaluation of products and services are focus on. However, reviewers cannot always evaluate products and services precisely because their evaluations fluctuate in the situation. Thus, in this study, we proposed a novel estimation method to estimate the fair evaluation of products and services by using particle filter with self-organization state space model from many reviewer evaluations. We showed the proposed method can estimate more precise than simple average method even if a few reviewer evaluations, through simulation experimentations.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2014 -2015 
    Author : 上田 完次; 延岡 健太郎; 竹中 毅; 西野 成昭; 山田 和明; 鬼頭 朋見; 緒方 大樹
     
    本研究は、価値創成ネットワーク理論の構築と体系化を研究課題全体の目的とし、(1)価値創成ネットワークのシステムモデル構築、(2)価値創成ネットワークの数理モデル構築、(3)価値創成ネットワークシミュレーション、(4)経済実験による価値創成分析、(5)実ビジネスの事例調査、(6)実データ分析とクラス分類、(7)取りまとめと体系化、の7項目をサブテーマとして設定している。このうち、本年度は前年度に行った(1)の成果をもとに、(2)の数理モデル構築と、(5)の事例調査を中心に進めた。各項目の成果については以下の通りである。 (2)価値創成ネットワークの数理モデル構築 ゲーム理論の応用分野であるメカニズムデザインの枠組みを利用して、価値創成モデル(Ueda et al. 2008)におけるクラスI~IIIの定式化を行った。特に、クラスIIでは、環境の不完全性からプレイヤの行動が変動するものとして、選好集合からメッセージ集合への写像に変動を持つものとして記述した。また、クラスIIIでは、目的情報も不完全であることから、選好集合と帰結集合自体が変わるという設定として定式化を行った。基本的な定式化の枠組み構築ができたと考えられる。 (5)実ビジネスの事例調査 まず、自動車産業におけるサプライチェーン構造全体を具体的な調査対象として設定し、部品の供給関係などを実データから調査し、そのネットワーク構造を明らかにした。 (2)については、さらにネットワーク構造への拡張を予定して研究を進めており、また(5)については、各事業主体の詳細な調査を計画していたが、平成27年11月10日に研究代表者の突然の急逝により、本研究課題は事業廃止となっため、研究の継続が困難な状況となった。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2013 -2015 
    Author : Yamada Kazuaki
     
    In knowledge sharing communities, a lots of users are able to co-create new knowledge by sharing, distributing and using information through web. Administrators of existing communities have designed to facilitate many user participation and contribution for communities, by combining incentives such as a ranking and interactions such as a user review.
    This study proposed a novel support method for the mechanism design by extracting, classifying and modeling both incentives and interactions in the existing communities. In addition, this study proposed a novel incentive mechanism that can simultaneously estimate both an appropriate value of a content and a user reliability by statistically processing results which many users have evaluated the content.
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2004 -2007 
    Author : NAKAKOJI Kumiyo; YAMAMOTO Yasuhiro; YAMADA Kazuaki; KOIKE Yasuharu; SATO Himko
     
    The goal of this research is to construct the human-centered media interaction environment that supports people to create and reconstruct knowledge when collect, analyze, and share a large amount of data, such as scientific data, marketing data, or video data. While existing simulation and visualization approaches have mainly focused on the presentation of such data, our approach is unique by focusing on people's incremental knowledge processes when interacting with the data. We have developed a framework for the human-centered media interaction environment that consists of three subsystems : a system for knowledge creation, one for manipulation, and one for representation. We have applied the framework in three domains : predicting chemical reaction, analyzing temporal numerical data, and analyzing video data. The results of this research projects include that we have developed a interaction model that uses a two-dimensional representation to help people express knowledge in linear, networked, and hierarchical structures, that we have developed an innovative tele-kinesthetic interaction model that uses EMG signals and a 3D physical object as a display, that we have explored visual and auditory media as a representation for creative knowledge work, that we have developed an open-source software library that is specifically dedicated to support molecular visualization and manipulation, that we have constructed an interaction history framework, which is a general framework to interact with temporal data, and that we have built a theoretical framework for active watching (i.e., a knowledge-intensive activity where an analyst interacts with video data) and built interaction primitives based on the framework.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2005 -2006 
    Author : 中小路 久美代; 山田 和明
     
    本研究は,知識コミュニティヘの「参加の軌跡」を提示することで各メンバの持つ知識や専門性の違いの把握を助け,そこから認識される「義務感」や「期待感」に基づいてメンバからの「貢献」を促進することにより,新たな協同の機会の発見や創出を促し,持続的な知識コミュニティを構築することを目指すものである. 本年度は,昨年度に構築した,義務感と期待感とがどのように培われコミュニティとの関わり方を決める際にどのようなソーシャルキャピタルとしての役割を果たすのかについてのモデルと,それに基づく可視化手法を,実際のコミュニティ活動の履歴から得られるデータに適用し,アプローチの検証をおこなった. 特に,ソフトウェア開発プロジェクトを知識コミュニティとみなし,持続的な知識コミュニティを可能とするような,作業履歴の多元的インタラクティブ可視化をおこなった.ソフトウェア開発プロジェクトを,アーティファクト,コミュニティメンバー,コミュニティ,という三つから成る知識の生態系とみなすことで,コミュニティメンバーに持続的参加を促すような作業履歴の要素を同定することができた.
  • 文部科学省:科学研究費補助金(若手研究(B))
    Date (from‐to) : 2003 -2005 
    Author : 山田 和明
     
    本研究では,Eラーニング環境を「学習者」と「編集者」の間でおこなわれる学習コンテンツを媒体としたコミュニケーションであるとみなし,双方にEラーニング環境の利用情報をフィードバックすることで,このコミュニケーションチャンネルを拡張し,両者を同時に支援するEラーニング環境の構築を目的としている.昨年度までの研究成果から,学習者の成績や興味などのユーザ特性は様々な要因により時間とともに変化し,また,その変化速度もユーザにより異なる.そのため,協調フィルタリングなどのクラスタリング手法によりテストスコアが類似した学習者を分類するだけでは,ユーザモデルおよびコミュニティモデルを抽出することは困難である.ユーザ特性や他のユーザとのインタラクションの時間的変化を捉えることが,ユーザモデルおよびコミュニティモデルを構成する上で重要であるという知見を得た.本研究では,ユーザ特性の時間的変化を可視化するためのケーススタディとしてWebアクセスログの解析を行い,ユーザが閲覧したWebページの時間的変化からユーザ興味の時間的遷移パターンを可視化する方法および可視化ツールを提案した,そして,実際にWeb視聴率データを用いて可視化を行い,ユーザ特性の時間的変化を抽出している.次に,ユーザ間のインタラクションの時間的変化を捉えるために,OSS(Open Source Software)開発コミュニティにおけるメーリングリストを解析し,ユーザ間のインタラクションの時間的変化を可視化する方法および可視化ツールを提案した.そして,ユーザ間のインタラクションの変化およびコミュニティへの参加と離脱の時間的変化の可視化することで,個々のユーザの特徴を観察することができた.以上の研究成果は2005年度の各種論文誌,資料集に掲載されている.
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2003 -2004 
    Author : UEDA Kanji; ODA Sobei H; BABA Yasunori; FUJII Nobutada; YAMADA Kazuaki
     
    This research project treats with incomplete information problems using the concept of co-creation. In the co-creation concept, the incomplete information problems that an individual agent cannot solve independently are solved by collective decision-making process that emerges resulting from interaction among agents. This study proposes a new methodology to realize co-creation derision-making using computational emergence, game theory and theory of industrial policy, and also the feasibilities of the proposal is verified by computer simulation, experiments with human subjects and fieldwork. Our final goal is establishment of a co-creative decision-making system. This research project obtained the following results : 1.Construction of co-creative decision-making system theory The basic concept and modeling method of co-creative decision-making system are specified. The research frame is defined and real world dilemma problems which this co-creative methodology targets on are discussed. 2.Co-creative decision-making between economic agents Modeling economic agents such as producers, consumers, dismantlers and wastes collectors in recycling system, the features and mechanism of social system are revealed by conducting experiments with human subjects. Furthermore, problems of social institution are considered. 3.Co-creative decision-making in artificial systems Human workers are modeled and introduced to manufacturing system using self-organization. It is demonstrated that efficient work allocation emerges resulting from interaction between human agents and manufacturing agents. The validity of co-creative decision making in artificial systems is shown. 4.Co-creative decision-melting in corporations. We focus on the Internet business such as e-learning and construct a decision-making model of Internet users. Using web access log, the applicability to actual Internet business is analyzed and shown its efficiency.