発表論文 発表年一覧

全論文一覧 (2024年)

英語論文 (2024年)
  • Lin, Zirui, Hideharu Amano, Masayuki Takigahira, Naoya Terakado, Katsutoshi Itoyama, Haris Gulzar, Kazuhiro Nakadai, Advancing Applications of Robot Audition Systems: Efficient HARK Deployment with GPU and FPGA Implementations, Chips 2025, vol.4, no.1, pp.2 -, , 20241227, , , https://doi.org/10.3390/chips4010002
  • Sihan Tan, Katsutoshi Itoyama, Kazuhiro Nakadai, Advancing Human-Computer Interaction: End-to-End Sign Language Translation, Transactions of Human Interface Society, vol.26, no.4, pp.391 -398, Human Interface Society, 20241125, , ,
  • Nabeela Khan, Sihan Tan, Katsutoshi Itoyama, Kazuhiro Nakadai, Motion Inbetweening Based on Body Parts Integration for Sign Language Generation, Transactions of Human Interface Society, vol.26, no.4, pp.431 -442, Human Interface Society, 20241125, , , https://doi.org/10.11184/his.26.4_431
  • Sihan Tan, Nabeela Khan, Zhaoyi An, Yoshitaka Ando, Rei Kawakami, Kazuhiro Nakadai, A Review of Deep Learning-Based Approaches to Sign Language Processing, Advanced Robotics, vol.38, no.23, pp.1649 -1667, The Robotics Society of Japan, 20241223, , , https://doi.org/10.1080/01691864.2024.2442721
  • "Sudo, Y., Takigahira, M., Tsuru, H., Nakadai, K., & Nakajima, H.", Online adaptation of fourier series-based acoustic transfer function model and its application to sound source localization and separation, Advanced Robotics, vol.38, no., pp.1351 -1363, , 20240715, , , https://doi.org/10.1080/01691864.2024.2379384
  • "Nakadai, K., Barakova, E., & Kyung, K. U.", Special issue on robot and human interactive communication, Advanced Robotics, vol.38, no., pp.1349 -1350, , 20241028, , , https://doi.org/10.1080/01691864.2024.2410825
  • "Jiang Wang, Yuanzheng He, Daobilige Su, Katsutoshi Itoyama, Kazuhiro Nakadai, Junfeng Wu, Shoudong Huang, You-Fu Li, He Kong", SLAM-based Joint Calibration of Multiple Asynchronous Microphone Arrays and Sound Source Localization, IEEE Transactions on Robotics, vol., no., pp. -, , 20240227, , ,
国際会議 (2024年)
  • Zirui Lin, Katsutoshi Itoyama, Kazuhiro Nakadai, Hideharu Amano, FPGA-based Low Power Acceleration of HARK Sound Source Localization, 2024 IEEE Symposium in Low-Power and High-Speed Chips (COOL CHIPS), vol., no., pp.1 -6, IEEE, 20240417, Tokyo, Japan, ,
  • Tsubasa Yano, Benjamin Yen, Kazuhiro Nakadai, Drone audition: dataset and methods for ground surface material classification using drone noise in outdoor environment, 2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), vol., no., pp.1 -6, , 20241203, Macau, China, , doi: 10.1109/APSIPAASC63619.2025.10848914.
  • Tsubasa Yano, Benjamin Yen, Katsutoshi Itoyama, Kazuhiro Nakadai, Ground Surface Material Classification with Drone Noise, Quiet Drones 2024, vol., no., pp. -, , 20240908, University of Salford, United Kingdom, , https://doi.org/10.17866/rd.salford.27930870.v1
  • "Nihal Ragib Amin, Yen Benjamin, Katsutoshi Itoyama, Kazuhiro Nakadai", UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios, International Conference on Pattern Recognition, vol., no., pp.145 -162, Springer Nature Switzerland, 20241202, , 978-3-031-78341-8, https://doi.org/10.1007/978-3-031-78341-8_10
  • "Osaki Takahiro, Sudo Yui, Itoyama Katsutoshi, Nishida Kenji, Nakadai Kazuhiro", Improving Noise Robustness of Automatic Speech Recognition based on a Parallel Adapter Model with Near-Identity Initialization, "The 37th International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA/AIE 2024)", vol., no., pp. -, , 20240712, Chekhov, ,
  • Kazuhiro Nakadai, Robot Audition for Human Robot Interaction, Workshop on Embodied Voices (WEV) for RSS 2024, vol., no., pp. -, , 20240715, "Delft University of Technology, Netherlands", ,
  • "Runwu Shi, Katsutoshi Itoyama and Kazuhiro Nakadai", Bird Vocalization Embedding Extraction Using Self-Supervised Disentangled Representation Learning, "Vocal Interactivity in-and-between Humans, Animals and Robots, VIHAR 2024", vol., no., pp.17 -21, , 20240906, "Kos, Greece", , https://vihar-2024.vihar.org/assets/VIHAR_2024_proceedings.pdf
  • "Reiji Suzuki, Zachary Harlow, Kazuhiro Nakadai and Takaya Arita", Toward integrating evolutionary models and field experiments on avian vocalization using trait representations based on generative models, "Vocal Interactivity in-and-between Humans, Animals and Robots, VIHAR 2024", vol., no., pp.69 -73, , 20240906, "Kos, Greece", , https://vihar-2024.vihar.org/assets/VIHAR_2024_proceedings.pdf
  • "Haruto Yokota, Mert Bozkurtlar, Benjamin Yen, Katsutoshi Itoyama, Kenji Nishida, Kazuhiro Nakadai", A VIDEO VISION TRANSFORMER FOR SOUND SOURCE LOCALIZATION, 32nd European Signal Processing Conference (EUSIPCO 2024), vol., no., pp. -, , 20240826, , ,
  • "Asaka Shuhei, Itoyama, Katsutoshi, Nakadai, Kazuhiro", Improving Impressions of Response Delay in AI-Based Spoken Dialogue Systems, IEEE RO-MAN 2024, vol., no., pp. -, , 20240824, "Pasadena, CA, USA", , https://ras.papercept.net/conferences/conferences/ROMAN24/progra...
  • "Nihal Md Ragib Amin, Yen Benjamin, Itoyama Katsutoshi, Nakadai Kazuhiro", Enhancing Clarity for Sky-High Insights: Drone-Enhanced Aerial Object Detection with YOLOv5 and Super Resolution, ICRA 2024, vol., no., pp. -, , 20240516, "Yokohama, Japan", , https://ras.papercept.net/conferences/conferences/ICRA24/program...
  • "Zirui Lin, Kensuke Iizuka, Hideharu Amano, Benjamin Yen, Kazuhiro Nakadai", Energy-Efficient FPGA-Based Implementation of HARK for Sound Source Localization, Asia Pacific Conference on Robot IoT System Development and Platform (APRIS 2024), vol., no., pp.69 -70, , 20241105, Tokyo, Japan, ,
  • "Mert Bozkurtlar, Benjamin Yen, Katsutoshi Itoyama, Kazuhiro Nakadai", Real Time Sound Source Localization Using Von-Mises ResNet, 2024 IEEE/SICE International Symposium on System Integration (SII), vol., no., pp.466 -471, , 20240108, , , http://doi.org/10.1109/SII58957.2024.10417224
日本語論文 (2024年)
国内会議 (2024年)
  • Zirui Lin, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Katsutoshi Itoyama, Kazuhiro Nakadai, An Exploration of Resource-Efficient Adaptation of English Accents for Automatic Speech Recognition, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240904, 大阪工業大学梅田キャンパス, 日本, ,
  • "三好 智大, 山田 泰基, Yen Benjamin, 中臺 一博", 自他ドローン雑音を考慮した、複数ドローンによる音源追跡性能の向上, 第25回計測自動制御学会システムインテグレーション部門講演会(SI2024), vol., no., pp. -, , 20241219, アイーナ いわて県民情報交流センター, ,
  • "田口 鐵人, 石井 遼平, 大崎 崇博, 阿坂 脩平, Yen Benjamin, 糸山 克寿, 中臺 一博", 話者情報を利用した距離ベース時間周波数マスク推定による音声強調の向上, 第25回計測自動制御学会システムインテグレーション部門講演会(SI2024), vol., no., pp. -, , 20241219, アイーナ いわて県民情報交流センター, ,
  • "中臺 一博, 公文 誠, 佐々木 洋子, 干場 巧太郎, Yen Benjamin, 糸山 克寿, 瀧ヶ平 将行, 寺門 直哉, 林 子瑞, Gulzar Haris, Busto Monikka Roslianna, 江田 毅晴, 天野 英晴", HARK3.6 およびそのアクティブドローン聴覚への応用, 第25回計測自動制御学会システムインテグレーション部門講演会(SI2024), vol., no., pp. -, , 20241218, アイーナ いわて県民情報交流センター, ,
  • "野島 稔生, 大﨑 崇博, 矢野 翼, Benjamin Yen, 中臺 一博", ドローン搭載マイクを用いた環境音識別, 第25回計測自動制御学会システムインテグレーション部門講演会(SI2024), vol., no., pp. -, , 20241218, アイーナ いわて県民情報交流センター, ,
  • "矢野 翼, Yen Benjamin, 中臺 一博", 屋外環境下でのドローンのローターノイズによる地表材質推定に向けた手法の検討およびマイクロホンアレイ用風防の設計, 第66回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-066-13, no., pp.77 -84, , 20241220, 慶應義塾大学 日吉キャンパス, ,
  • "中臺 一博, 公文 誠, 佐々木 洋子, 干場 功太郎, Yen Benjamin", 複数ドローンとロボットの協調による群アクティブ聴覚システム, 第66回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-066-11, no., pp.61 -68, , 20241220, 慶應義塾大学 日吉キャンパス, ,
  • "西田 健次, 中臺 一博, 糸山 克寿", 小領域移動物体検出における背景フローの弁別手法, 第66回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-066-10, no., pp.55 -60, , 20241220, 慶應義塾大学 日吉キャンパス, ,
  • "藤田 侑樹, 糸山 克寿, 西田 健次, 中臺 一博", ガウス過程回帰を用いた音響伝達関数の環境変化適応, 第66回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-066-06, no., pp.32 -36, , 20241220, 慶應義塾大学 日吉キャンパス, ,
  • "阿坂 脩平, Yen Benjamin, 糸山 克寿, 中臺 一博", 話者情報の半教師あり学習を用いたオフライン話者ダイアライゼーション, 第66回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-066-04, no., pp.17 -23, , 20241220, 慶應義塾大学 日吉キャンパス, ,
  • "植村 渉, 干場 功太郎, 鈴木 麗璽, 中臺 一博, 光永 法明", AIチャレンジ研究会のすすめ, 第66回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-066-03, no., pp.16 -16, , 20241220, 慶應義塾大学 日吉キャンパス, ,
  • "大﨑 崇博, 周藤 唯, 中臺 一博", 音声強調と雑音特徴量を用いた音声認識の雑音耐性向上, 第66回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-066-01, no., pp.1 -7, , 20241220, 慶應義塾大学 日吉キャンパス, ,
  • "西田 健次, 糸山 克寿, 中臺 一博", 動画中の稀少イベントとしての小領域移動物体の検出手法, 第64回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-064-06, no., pp. -, , 20240327, , ,
  • "Hao Zhao, Reiji Suzuki, Ryosuke Kojima, Takaya Arita, Kazuhiro Nakadai", Utilizing Embedding Methods for Soundscape Analysis of Forest Animal Vocalization based on azimuth and elevation localization, 第64回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-064-05, no., pp. -, , 20240327, , ,
  • "Runwu Shi, Katsutoshi Itoyama, Kazuhiro Nakadai", Self-Supervised Learning for Bird Vocalization Embedding Extraction, 第64回人工知能学会AIチャレンジ研究会, vol.SIG-Challenge-064-04, no., pp. -, , 20240327, , ,
  • "木村 駿希, 中臺 一博, 仁科 繁明, 糸山 克寿", 能動推論に基づく1対1インタラクションモデルの検討, 情報処理学会第86回全国大会, vol.1R-04, no., pp. -, , 20240315, , ,
  • 中臺 一博, ロボット聴覚オープンソースソフトウェアPyHARKとその組込み向け実装の紹介, CREST成果発表ワークショップ, vol., no., pp. -, , 20240222, , ,
  • 中臺 一博, ロボット聴覚:ロボットの耳の機能構築とその多面的な新展開, IEEE東京支部2024年第8回東京支部講演会, vol., no., pp. -, , 20240924, , ,
  • 中村 紘喜1、土門 優介1、鈴木 祐太郎1、石塚 正仁1、内山 秀樹1、工藤 晃央1、矢野 幹也2、鈴木 麗璽3、中臺 一博4 (1. 株式会社ドーコン、2. 株式会社セ・プラン、3. 名古屋大学大学院情報学研究科、4. 東京工業大学工学院), 鳴声の音源定位によるシマフクロウの生息位置把握の試み, 応用生態工学会, vol., no., pp. -, , 20240918, , ,
  • 鈴木麗璽 1 、Zachary Harlow2、中臺一博 3、有 田隆也 1 (1名大、2UC Berkeley、3東工大), 生成 AI が鳥類生態に与える影響の理 解のための進化モデルとフィールド観 測の融合, 日本鳥学会2024, vol., no., pp. -, , 20240913, 東京大学農学部キャンパス, , https://osj2024.ornithology.jp/OSJ2024abstract.pdf
  • 松林志保(関学大)、中臺一博(東工大)、浦達也(野 鳥の会)、鈴木麗璽(名大), 音源定位技術を用いたオオジシギの観 測実例, 日本鳥学会2024, vol., no., pp. -, , 20240913, 東京大学農学部キャンパス, , https://osj2024.ornithology.jp/OSJ2024abstract.pdf
  • 土門優介・工藤晃央・鈴木祐太郎・石塚正仁・内山 秀樹・中村紘喜((株)ドーコン)、矢野幹也((株)セ・プ ラン)、鈴木麗璽(名大・院・情報)、中臺一博(東工大・ 工学院), 鳴声の音源定位による営巣地特定技術 の精度検証:オオタカを事例として, 日本鳥学会2024, vol., no., pp. -, , 20240913, 東京大学農学部キャンパス, , https://osj2024.ornithology.jp/OSJ2024abstract.pdf
  • "横田 遥大, Mert Bozkurtlar, Benjamin Yen, 糸山 克寿, 西田 健次, 中臺 一博", Video Vision Transformer に基づく音源定位の提案, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240906, "大阪工業大学梅田キャンパス, 日本", ,
  • "矢野 翼, Benjamin Yen, 糸山 克寿, 中臺 一博", 屋外環境下でのドローンのローターノイズによる地表材質推定手法の検討, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240905, "大阪工業大学梅田キャンパス, 日本", ,
  • "龍 彦可, 周藤 唯, シャキール ムハンマド, 糸山 克寿, 中臺 一博", A Multi-Form Language Speech Translation Model Based on ESPnet, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240904, "大阪工業大学梅田キャンパス, 日本", ,
  • "藤田 侑樹, 糸山 克寿, 西田 健次, 中臺 一博", ガウス過程回帰を用いた音響伝達関数の環境変化適応, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240904, "大阪工業大学梅田キャンパス, 日本", ,
  • "大﨑 崇博, 周藤 唯, 糸山 克寿, 中臺 一博", Biasing networkを用いた音声認識の雑音耐性向上, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240904, "大阪工業大学梅田キャンパス, 日本", ,
  • "安江 蒼人, Benjamin Yen, 糸山 克寿, 中臺 一博", LCMVベースのScan-and-Sum Beamformer による面領域内音源の抽出, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240904, "大阪工業大学梅田キャンパス, 日本", ,
  • "Benjamin Yen, Kazuhiro Nakadai", Development of an indoor multi-drone active sound source tracking system, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240905, "大阪工業大学梅田キャンパス, 日本", ,
  • "阿坂 脩平, 西田 健次, 糸山 克寿, 中臺 一博", 距離学習を用いた話者識別に基づく話者ダイアラゼーションの検討, 日本ロボット学会学術講演会, vol., no., pp. -, , 20240905, "大阪工業大学梅田キャンパス, 日本", ,

Back to Top