研究者総覧

村上 真 (ムラカミ マコト)

  • 総合情報学部総合情報学科 准教授
  • 工業技術研究所 研究員
  • 総合情報学研究科総合情報学専攻 准教授
  • 計算力学研究センター 研究員
Last Updated :2025/06/06

研究者情報

学位

  • 博士(情報科学)(早稲田大学)

ホームページURL

科研費研究者番号

  • 80329119

J-Global ID

研究キーワード

  • コンピュータビジョン   音声情報処理   パターン認識   ヒューマンコンピュータインタラクション   マルチモーダルインタフェース   拡張現実   ヒューマンエージェントインタラクション   ヒューマンインタフェース   Human Face Recognition   画像情報処理   

研究分野

  • 情報通信 / エンタテインメント、ゲーム情報学
  • 情報通信 / ヒューマンインタフェース、インタラクション
  • 情報通信 / 知能情報学

経歴

  • 2009年04月 - 現在  東洋大学総合情報学部准教授
  • 2007年04月 - 2009年03月  東洋大学工学部准教授
  • 2005年04月 - 2007年03月  東洋大学工学部助教授
  • 2002年04月 - 2005年03月  東洋大学工学部講師
  • 2000年04月 - 2002年03月  早稲田大学理工学部助手

所属学協会

  • ACM   IEEE   人工知能学会   情報処理学会   電子情報通信学会   

研究活動情報

論文

講演・口頭発表等

  • StyleGANと動作分類器を用いたクラス指定による人物動作生成
    山本和輝; 村上真
    情報処理学会研究報告(Web) 2024年
  • Xiaohan Feng; Makoto Murakami
    Artificial Intelligence, NLP , Data Science and Cloud Computing Technology 2023年08月 Academy & Industry Research Collaboration
     
    The Aim of this paper is to explore different ways of using AI to subvert stereotypes more efficiently and effectively. It will also enumerate the advantages and disadvantages of each approach, helping creators select the most appropriate method for their specific situations. AI opens up new possibilities, enabling anyone to effortlessly generate visually stunning images without the need for artistic skills. However, it also leads to the creation of more stereotypes when using large amounts of data. Consequently, stereotypes are becoming more prevalent and serious than ever before. Our belief is that we can use this situation in reverse, aiming to summarize stereotypes with AI and then subvert them through elemental exchange. In this study, we have attempted to develop a less time-consuming method to challenge character stereotypes while embracing the concept of "exchange." We selected two character archetypes, namely the "tyrant" and the "mad scientist," and summarized their stereotypes by generating AI images or asking ChatGPT questions. Additionally, we conducted a survey of real historical tyrants to gain insights into their behavior and characteristics. This step helped us comprehend the reasons behind stereotyping in artwork depicting tyrants. Based on this understanding, we made choices about which stereotypes to retain. The intention was to empower the audience to better evaluate the identity of the character. Finally, the two remaining character stereotypes were exchanged, and the design was completed. This paper documents the last and most time-consuming method. By examining a large number of sources and examining what stereotypical influences were used, we were able to achieve a greater effect of subverting stereotypes. The other method is much less time-consuming but somewhat more random. Whether one chooses by subjective experience or by the most frequent choices, there is no guarantee of the best outcome. In other words, it is the one that best guarantees that the audience will be able to quickly identify the original character and at the same time move the two characters the furthest away from the original stereotypical image of the original. In conclusion, if the designer has sufficient time, ai portrait + research or chatGPT + research can be chosen. If there is not enough time, the remaining methods can be chosen. The remaining methods take less time and the designer can try them all to get the desired result.
  • Xiaohan Feng; Makoto Murakami
    Natural Language Processing, Information Retrieval and AI 2023年02月 Academy and Industry Research Collaboration Center (AIRCC)
     
    The Witch is a typical stereotype-busting character because its description has changed many times in a long history. This paper is an attempt to understand the visual interpretations and character positioning of the Watch by many creators in different eras, AI is being used to help summarize current stereotypes in witch design, and to propose a way to subvert the Witch stereotype in current popular culture. This study aims to understand the visual interpretations of witches and character positioning by many creators in different eras, and to subvert the stereotype of witches in current popular culture. This study provides material for future research on character design stereotypes, and an attempt is proposed to use artificial intelligence to break the stereotypes in design and is being documented as an experiment in how to subvert current stereotypes from various periods in history. The method begins by using AI to compile stereotypical images of contemporary witches. Then, the two major components of the stereotype, "accessories" and "appearance," are analyzed from historical and social perspectives and attributed to the reasons for the formation and transformation of the Witch image. These past stereotypes are designed using the design approach of "extraction" "retention" and "conversion.", and finally the advantages and disadvantages of this approach are summarized from a practical perspective. Research has shown that it is feasible to use AI to summarize the design elements and use them as clues to trace history. This is especially true for characters such as the Witch, who have undergone many historical transitions. The more changes there are, the more elements can be gathered, and the advantage of this method increases. Stereotypes change over time, and even when the current stereotype has become history, this method is still effective for newly created stereotypes.
  • 特定の血中アミノ酸を誘導できる食事組成を算出するAIモデルの開発~食による生理状態のコントロールへの応用に向けて~
    山中大介; 西村武謙; 増田正人; 西宏起; 合田祐貴; 沖野良輔; 村上真; 宮本崇史; 伯野史彦; 高橋伸一郎; 伊藤公一
    日本分子生物学会年会プログラム・要旨集(Web) 2023年
  • StyleGANを使用した人物動作の生成
    山本和輝; 村上真
    情報処理学会研究報告(Web) 2023年
  • StyleGANによる人物動作生成モデルの構築
    山本和輝; 村上真
    電子情報通信学会大会講演論文集(CD-ROM) 2023年
  • Variational Recurrent Neural Network を用いた人物動作生成モデルの構築
    村上 真; 生澤 隆広
    情報処理学会コンピュータグラフィックスとビジュアル情報学研究会 2021年02月
  • Human Motion Generative Model using Wasserstein GAN
    Ayumi Shiobara; Makoto Murakami
    情報処理学会研究報告 2020年03月
  • 深層ニューラルネットワークを用いたシーンラベリングに適したクラスラベル付き訓練データの生成
    茂木 悠一朗; 村上 真
    電子情報通信学会技術報告 2019年07月
  • 塩原 歩; 村上 真
    電子情報通信学会技術報告 2019年07月 ACM
  • Generation of Training Data for Scene Labeling using Neural Network  [通常講演]
    Yuichiro Motegi; Takahiro Suzuki; Yuta Matsuda; Makoto Murakami
    13th World Congress on Computational Mechanics 2018年07月 
    Some researchers have proposed neural networks for scene labeling which assigns class label to each pixel of an image. The class accuracy for objects included enough in a training set such as sky or road is high, but the accuracy for objects included less in the training set tends to be low. To improve the average per-class accuracy, we need to increase variations of training images in each class, and reduce the difference in the number of training images/pixels in each class. But it takes time to annotate a lot of images at the pixel level manually to make training set. There are some researches to generate many pixel-level annotated images using computer graphics. We propose the method to generate large training set for scene labeling. In our system users register 3D models and the corresponding class labels. And the users input some constraints of the object positions such as "tables must be on the floor" or "cups must be on tables or desks". And the users input some hyper parameters for training neural network, such as the structure of the network, loss function, etc. The system put some objects in the virtual space based on the constraints, and generates a large set of images labeled at each pixel, to increase the variations of images in each class and to flatten the number of pixels in each class. The neural network is trained using the large set of generated labeled images. And the system repeats training and evaluating while increasing the variations of training images, and output the network parameters which minimize the generalization error measured with the average per-class accuracy. We captured some real images of indoor environment, and labeled each pixel of them using the neural network trained with our system. To evaluate our system we changed some settings of the system and compared the obtained results.
  • Object Shape Feature Extraction from Motion Parallax using Convolutional Neural Network  [通常講演]
    ChengJun Shao; Makoto Murakami
    13th World Congress on Computational Mechanics 2018年07月 口頭発表(一般) 
    We propose a neural network which can recognize objects from a sequence of RGB images captured with a single camera through two different convolutional neural networks. The learning process is divided into two steps: learning of CNN for spatial feature extraction and learning of CNN for spatiotemporal feature extraction. The spatial feature extraction CNN extracts spatial feature vectors with position invariance. And they are input to the following spatiotemporal feature extraction CNN, which convolutes them temporally to achieve depth information based on motion parallax. In the spatial feature extraction CNN, each frame of image sequence is convoluted with some spatial filters, the convoluted values are passed through an activation function, and some spatial features are extracted in the convolutional layer. The features are input to the local contrast normalization layer, and the following pooling layer for downsampling. With these three layers as a set, three sets of layers are concatenated to extract low, medium, and high level spatial features. Then, the high level features are converted to a one-dimensional vector, and weighted sums of elements of it are passed through an activation function in the fully connected layer. We may use dropout to reduce the degree of freedom of the network, and to prevent overfitting. In the spatiotemporal feature extraction CNN, a sequence of the low and medium spatial features extracted in the spatial feature extraction CNN with a frame length T is input to the convolutional layer. The sequence of the same spatial features is convoluted with some temporal filters, the convoluted values are passed through an activation function, and some temporal features including depth information from motion parallax can be extracted. The features are input to the local contrast normalization layer, the pooling layer, and the fully connected layer. And the high level spatial features extracted in the spatial feature extraction CNN are also input to the fully connected layer. And these different kinds of features are integrated in the output layer. To evaluate our proposed method we conducted an experiment using some objects with simple shapes, and extracted the shape information from motion parallax.
  • 畳み込みニューラルネットワークを用いた運動視差による物体形状特徴の抽出  [通常講演]
    邵成駿; 村上真
    電子情報通信学会技術研究報告,PRMU2017-177, pp.31-36 2018年03月 口頭発表(一般)
  • 情報収集を目的としたチャットボットシステムにおける対話活性化制御  [通常講演]
    茂木 悠一朗; 村上 真
    2018年電子情報通信学会総合大会,情報・システム講演論文集1,D-5-10 2018年03月 口頭発表(一般)
  • 腕の動きを特徴量とした切る及び混ぜる動作の認識  [通常講演]
    肱岡佑磨; 村上真; 木本伊彦
    2017年電子情報通信学会総合大会 2017年03月 口頭発表(一般)
  • 2011年03月 
    我々はユーザと能動的にコミュニケーションを取り,感想情報のような再利用する価値のある情報を言語情報として所得するシステムの実現を目指している.このようなシステムにおいては,システムがしつこく情報収集を続けてしまうと次回からの情報収集に支障をきたす恐れがあるため,ユーザが対話したくないことをシステムが判断する必要がある.そこで本研究では,音声情報を用いて対話終了を判断するためのモデル構築を行った.
  • 大塚 尚樹; 村上 真; 山際 基; 上原 稔
    情報科学技術フォーラム講演論文集 2010年08月
  • 端 千尋; 宮島 崇浩; 村上 真
    言語・音声理解と対話処理研究会 2010年02月
  • 山際 基; 上原 稔; 村上 真; 米山 正秀; ヤマギワ モトイ; ウエハラ ミノル; ムラカミ マコト; ヨネヤマ マサヒデ; Motoi Yamagiwa; Minoru Uehara; Makoto Murakami; Masahide Yoneyama
    工業技術 2009年
  • 田中 堅一; 上原 稔; 村上 真; 山際 基
    情報処理学会研究報告. マルチメディア通信と分散処理研究会報告 2008年11月 
    近年ハードウェア性能の向上により一般向けPCの持つ計算資源が非常に大きくなっている.しかしそれらの資源はすべて活用されているわけではなく、非常に多くの資源が遊休資源として利用されていないのが現状である。本研究では特にWindows PCを対象として、仮想マシンを利用したグリッドの制御についての研究を行っている。仮想マシンを用いてのグリッドの構築を、Windows PCによるグリッドで制御することでWindows PCのリソースを活用するのが目的である。これはWindowsのシェアが最も多く遊休資源量も非常に多いと予測されるからである。そして制御用のグリッドをMeta Gridとして開発した。本論文ではさらに、Webストレージを仮想マシングリッドから利用するために、外部からNBDを利用して接続する機能の追加を行った。ファイルシステムにマウントできるストレージを利用することで、ディスク資源を確保することが目的である。本論文ではコマンドラインベースのクライアントを使用して、対話的にWebストレージを仮想マシンのファイルシステムにマウントすることで、評価を行った。
  • 五味 真理子; 村上 真; 米山 正秀
    情報科学技術フォーラム一般講演論文集 2006年08月
  • 五味 真理子; 村上 真; 米山 正秀
    電子情報通信学会総合大会講演論文集 2006年03月
  • 丸山 紗智子; 林 智英; 村上 真; 米山 正秀
    電子情報通信学会総合大会講演論文集 2005年03月
  • 青木 幸四郎; 山際 基; 村上 真; 米山 正秀
    日本音響学会研究発表会講演論文集 2004年03月
  • 小野 幸真; 丸山 紗智子; 村上 真; 米山 正秀
    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 2003年11月
  • 小野 幸真; 丸山 紗智子; 村上 真; 米山 正秀
    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 2003年11月 
    これまで主に静止画における物体認識に用いられてきたLabeled Graph Matchingを動画像に適用することで,従来の動画像認識においては逐次的に処理していた過程を統合的に処理することが可能となった.しかし,その認識精度及び処理時間は特徴量制御パラメータに影響を受けるため,その制御法を考慮する必要がある.本研究では,提案手法を頭部領域抽出の問題に適用し,抽出精度を最適化するためのパラメータ制御法に関して分析を行った.
  • 小野 幸真; 丸山 紗智子; 村上 真; 米山 正秀
    電子情報通信学会技術研究報告. HIP, ヒューマン情報処理 2003年11月 
    これまで主に静止画における物体認識に用いられてきたLabeled Graph Matchingを動画像に適用することで,従来の動画像認識においては逐次的に処理していた過程を統合的に処理することが可能となった.しかし,その認識精度及び処理時間は特徴量制御パラメータに影響を受けるため,その制御法を考慮する必要がある.本研究では,提案手法を頭部領域抽出の問題に適用し,抽出精度を最適化するためのパラメータ制御法に関して分析を行った.
  • 青木 幸四郎; 山際 基; 村上 真; 米山 正秀
    電子情報通信学会ソサイエティ大会講演論文集 2003年09月
  • 田丸 雅純; 村上 真; 杉本 富利; 米山 正秀
    電子情報通信学会ソサイエティ大会講演論文集 2003年09月
  • 電子情報通信学会総合大会講演論文集 1999年03月
  • ポップフィールドニューラルネットワークを用いた表情に依存しない個人認識  [通常講演]
    電子情報通信学会総合大会講演論文集 1999年
  • 人工知能学会全国大会論文集 1998年

MISC

共同研究・競争的資金等の研究課題

  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2022年04月 -2025年03月 
    代表者 : 村上 真
  • 日本学術振興会:科学研究費助成事業 基盤研究(C)
    研究期間 : 2019年04月 -2022年03月 
    代表者 : 村上 真
     
    本研究では,人間が動作を思い浮かべる動作生成過程と人間が動作を認識する動作推論過程は複雑で非線形だと考え,この両過程を深層ニューラルネットワークによりモデル化した.具体的には,Generative Adversarial NetworksとVariational AutoEncodersと呼ばれる2種類の異なる手法を用いて両過程をモデル化し,モーションキャプチャシステムにより収録した動作データを用いて提案モデルを学習した.学習済の生成モデルを使用することで自然で多様な動作が生成可能であることを示した.
  • 日本学術振興会:科学研究費助成事業 基盤研究(C)
    研究期間 : 2008年 -2011年 
    代表者 : 湯舟 英一; 村上 真
     
    ネイティブと同様の自然な発話を行えるように、音声変化に対して評価を行い発話の矯正を行うシステムの開発を行った。研究期間内に、学習者の発話音声のうち「融合同化」と「連結」が与えられた教師音声に対してDPマッチングによる比較評価プログラムを作成した。このプログラムによる評価を英語熟達者による評価と比較した結果、高い妥当性が認められた。一方、フィードバック部門に関する研究として、視覚情報、聴覚情報、言語情報の3つのモダリティーを用いて効果を検証した。その結果、聴覚が最も分かりやすく、次いで、視覚に訴える方法という結果を得た。
  • 日本学術振興会:科学研究費助成事業 基盤研究(A)
    研究期間 : 2002年 -2004年 
    代表者 : 白井 克彦; 小林 哲則; 米山 正秀; 山崎 芳男; 大平 茂輝; 村上 真
     
    音声において感情情報がどのような形で表出するかを明らかにするために,演技の流れに応じて自然なもっともらしい感情表現がされている落語音声を使用して分析を行った.その結果,感情表現は発話の最後の部分に比較的現れやすいことが確認された.また,生理的な発声による感情表現に着目し,笑い声の分析を行った結果,ピッチ周波数及び音素タイミングが笑い声を表現する上で最も基礎的なパラメータであることが確認された.さらに,台本のみから感情音声を合成するには,台詞や文章といったテキスト情報から感情を推定する必要がある.そこで,入力された文章の感情の推定を,大局的感情分類と局所的感情分類の2つの方法で行った. 次に,言語を用いた指示により感情動作を生成・制御可能なディジタルアクタシステムの構築を目的とし,感情語-動作間の関係を木構造として表現した感情表出モデルの構築を行った.また,感情表出モデルから目的動作を生成・制御する感情表出部と,未知語が入力された場合等に新たに感情語を学習し感情表出モデルを更新する感情学習部から成るディジタルアクタシステムを実装した.さらに,実装システムを用いて評価実験を行った結果,適切な動作が表出可能であることが確認された. 最後に,映像や音声といった物理信号と,人間がそこから知覚する感情との対応関係を明らかにするために,映像と音声を組み合わせ,それぞれに感情表現を付与した場合,人間がそれをどのように知覚するかについて分析を行った.その結果,一般的に感情の度合いの変化は表情ではなく声色の変化で表現され,聞き手は,発話者の表情を見ることでどのような感情であるかは認識できるが,その感情の度合いに関しては,声色を重視して認識していることが確認された.
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2001年 -2003年 
    代表者 : 安吉 逸季; マクファーランド C.; 櫻井 敏子; 村上 真
     
    ブロードバンド時代に、PCによる高画質・音声を利用したマルチメディア英語学習が効果があり、PDA、携帯電話(多くの若者が所有している)も同じく近未来の英語学習に有効であると考えられる。 英語学習における便利さ、機能性、親密性という点でPC、PDA、携帯の比較研究を行なった。2001-2年の実験では、将来性がPDAにあると判断した。学生は異なる学習環境(PC PDA携帯各8名)で英語の講義を受講し、その後試験を受けた。PCには安定性があるが、PDAは携帯性と機能の点で将来の語学学習への可能性を示した。 本研究で、ウェブ上の複数の地点から教材開発を同時に行なった。ウェッブ上での製作コラボレーション実験を行なうために、まず三つの映画を教材として作成した。従来のコンテンツ制作方法は、一箇所にプログラマー、著者、編集者が集合して製作するが、本研究では、ウェッブ上の複数の異なるサイトから同時に教育ソフトを作成・編集する実験を行い、その結果、従来の方法でかかる移動時間が大幅に縮小でき、製作関係者が集合する必要がなくなった。 語彙数などのテキスト分析ソフトを作成し、教育ソフトのテキストが学生のレベルに対応しているか否かを判断した。テキスト分析には、英語文献データベースは不可欠となる。今回1,000冊分(700メガ相当)を英語テキストデータベースに追加した。高卒で習得する語彙数は約2,000語であるが、英語の新聞やそれに相当するものを読むには、最低4,000語が必要であるということが判明した。英語のレベルに応じた文献を検索できるデータベースでもある。 学生の英語力を評価するコンピュータベースの英語試験プログラム(CBT)のプロットタイプを作成するためにTOEFLをはじめとする試験問題の収集・分析を行った。文法・語法という角度から各学生の語学力を自動的に判断し、長短所を指摘するプログラム作成の研究をした。文法・語法の誤りを指摘するプログラムのためのデータベース構築である。
  • 日本学術振興会:科学研究費助成事業 特定領域研究(A)
    研究期間 : 2001年 -2001年 
    代表者 : 安吉 逸季; 村上 真; 櫻井 敏子; マクファーランド カーティス
     
    インターネット上での教育ソフト制作におけるコラボレーション 今後急速にブロードバンドが一般化すると考えられ、インターネット上で教育のソフト制作の共同制作をどのように行うか、この課題をNTTラーニング・早稲田大学国際情報通信センターの教授・研究員との共同で研究した.また、異なる3つの受講環境(PC, PDA, FOMA)で、制作した教材を受講した被験者からのデータを得、今後の研究用データとした. 研究課題 (1)コンテンツ制作における編集・修正・議論をウェッブ上にて行い、そこでテキスト・静止画・デザイン等の編集を試みた.ウェッブ上の複数地点から同一教材制作のコラボレーション実験を行い、移動・待ち時間・編集・打ち合わせ等の項目ごとに、従来型の開発制作方法との対比をした.制作に実際にかかる編集時間や打ち合わせよりも、移動・待ち時間の方が、断然大きいという結果をえた.今後の教育ソフト制作に一つの指針を与えてくれた. (2)コンテンツは、ウェッブ上で学習できるマルチメディア教材を制作した.テーマとしてはスコットランド地方で作られるスコッチ・ウィスキーを取り上げ、全3章で構成している.各章は4〜7ページのHTMLファイルと4分〜6分のビデオから成る(PartIスコットランドの首都エディンバラ,PartIIスコッチウィスキーの歴史,PartIIIウィスキー製造の工程).各ページは1ないし2パラグラフで構成している.教材を全て閲覧すると、約15分程度となる.ただし,受講端末により表示条件などが異なるため、それぞれコンテンツは異なる. (3)英語教材の評価方式とその実験、ウェッブ上での試験と評価方式の実験を行った.

その他のリンク

researchmap