発表論文 発表年一覧

全論文一覧 (2025年)

英語論文 (2025年)
  • Zirui Lin, Haris Gulzar, Kazuhiro Nakadai, Hideharu Amano , Robot Audition. In: Amano, H. (eds) Computation Platforms for Multi-access Edge Computing, vol., no., pp.85 -118, Springer Singapore, 20250729, , , https://doi.org/10.1007/978-981-96-8935-4_5
国際会議 (2025年)
  • Zirui Lin, Masayuki Takigahira, Naoya Terakado, Katsutoshi Itoyama, Haris Gulzar, Monikka Roslianna Busto, Takeharu Eda, Kazuhiro Nakadai, Hideharu Amano, Sound Source Localization for Robot Audition Using Generalized Singular Value Decomposition-based Multiple Signal Classification: A GPU Implementation, IEEE Symposium in Low-Power and High-Speed Chips (COOL CHIPS), vol., no., pp.1 -6, IEEE, 20250416, Tokyo, Japan, ,
  • Zirui Lin, Haris Gulzar, Monnika Roslianna Busto, Akiko Masaki, Takeharu Eda, Kazuhiro Nakadai, Dialect Identification Using Resource-Efficient Fine-Tuning Approaches, Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2025), vol., no., pp.670 -675, Asia-Pacific Signal and Information Processing Association (APSIPA), 20251022, Singapore, Singapore, ,
  • Kazuhiro Nakadai, Kotaro Hoshiba, Benjamin Yen, Makoto Kumon, Yoko Sasaki, Swarm Active Audition with Robots and Drones: Real-World Performance Validation, 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2025), vol., no., pp.6107 -6112, IEEE, 20251019, Hangzhou, China, ,
  • Sihan Tan, Taro Miyazaki, Nabeela Khan, Kazuhiro Nakadai, Improvement in Sign Language Translation Using Text CTC Alignment, Proceedings of the 31st International Conference on Computational Linguistics (COLING 2025), vol., no., pp.3255 -3266, Association for Computational Linguistics, 20250119, Abu Dhabi, UAE, ,
  • "Khan, Nabeela, Bowen Wu, Sihan Tan, Carlos Toshinori Ishi, and Kazuhiro Nakadai", SignFlow: End-to-End Sign Language Generation for One-to-Many Modeling using Conditional Flow Matching, In Proceedings of the 27th International Conference on Multimodal Interaction, (ACM ICMI 2025), vol., no., pp.173 -180, , 20251013, Canberra, Australia, ,
  • "Ragib Amin Nihal, Benjamin Yen, Takeshi Ashizawa, Kazuhiro Nakadai", Cross-Attention with Confidence Weighting for Multi-Channel Audio Alignment, Proceedings of the 10th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2025), vol., no., pp.195 -199, , 20251030, Barcelona, Spain, , 10.5281/zenodo.17251589
  • "Ragib Amin Nihal, Benjamin Yen, Takeshi Ashizawa, Katsutoshi Itoyama, Kazuhiro Nakadai", From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution, 2025 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), vol., no., pp.1 -6, , 20251022, Singapore, ,
  • "Runwu Shi, Zirui Lin, Benjamin Yen, Jiang Wang, Ragib Amin Nihal, Kazuhiro Nakadai", Single-Channel Target Speech Extraction Utilizing Distance and Room Clues, The 33rd European Signal Processing Conference (EUSIPCO 2025), vol., no., pp. -, , 20250911, Palermo, Italy, ,
  • "Haruto Yokota, Benjamin Yen, Kazuhiro Nakadai", Multi-Speaker Localization Based on von Mises-Bernoulli ViViT, The 33rd European Signal Processing Conference (EUSIPCO 2025), vol., no., pp. -, , 20250909, Palermo, Italy, ,
  • "Sihan Tan, Taro Miyazaki, Kazuhiro Nakadai", Multilingual Gloss-free Sign Language Translation: Towards Building a Sign Language Foundation Model, The 63rd Annual Meeting of the Association for Computational Linguistics (ACL 2025), vol., no., pp.553 -561, , 20250826, Vienna, Austria, ,
  • "Tan Sihan, Khan Nabeela, Yen Benjamin, Ashizawa Takeshi, Nakadai Kazuhiro", Towards Effective Sign Language-Based Communication in Human-Robot Interaction: Challenges and Considerations, 34th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2025), vol., no., pp. -, , 20250826, Eindhoven, the Netherlands, ,
  • "Khan Nabeela, Tan Sihan, Nakadai Kazuhiro", Towards Online Sign Language Expression for Real-Time Human-Robot Interaction, 34th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2025), vol., no., pp. -, , 20250826, Eindhoven, the Netherlands, ,
  • "Nabeela Khan, Bowen Wu, Carlos Toshinori Ishi, Kazuhiro Nakadai", MultiGAU: Real Time Sign Language Generation Using Multimodal Gated Attention, The 38th International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems IEA/AIE 2025, vol.15706, no., pp.149 -160, Springer, Singapore, 20250701, , , https://doi.org/10.1007/978-981-96-8889-0_13
  • "Kazuhiro Nakadai", Deep Robot Audition, 1st Workshop on Acoustic Sensing and Representations for Robotics (RoboAcoustics) of IEEE/RAS ICRA 2025, vol., no., pp. -, , 20250519, , ,
  • "Kazuhiro Nakadai", Learning Robotic Systems: Next Theory, Algorithm, and Integration, SII 2025 Workshop, vol., no., pp. -, , 20250121, Munich, Germany, ,
  • "Ayachi Mohamed Amine, Yen Benjamin, Yokota Haruto, Nakadai Kazuhiro", Multi-Modal Robot Navigation with Sound Source Localisation and Collision Detection, 2025 IEEE/SICE International Symposium on System Integration (SII), vol., no., pp. -, , 20250122, Munich, Germany, ,
  • "Runwu Shi, Benjamin Yen, Kazuhiro Nakadai", Distance Based Single-Channel Target Speech Extraction, ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), vol., no., pp.1 -5, IEEE, 20250406, Hyderabad, India, , https://doi.org/10.1109/ICASSP49660.2025.10887680
日本語論文 (2025年)
  • "中臺一博, 糸山克寿", 進化するヒトと機械の音声コミュニケーション Vol.2 音声認識・合成・コミュニケーションの応用技術 第一章第一節 ロボット聴覚のためのオープンソースソフトウェアHARKとPyHARK, vol., no., pp.105 -116, NTS, 20250412, , 978-4860439361,
  • "中臺 一博, 糸山 克寿", ロボット聴覚の基礎 実環境での音源定位・分離技術, vol., no., pp. -, オーム社, 20250227, , 978-4-274-23252-7,
国内会議 (2025年)
  • 中臺 一博, 糸山 克寿, 瀧ヶ平 将行, 寺門 直哉, 住田 直亮, 阿坂 脩平, 芦澤 剛, 干場 功太郎, YEN Benjamin, 小島 諒介, 鈴木 麗璽, 公文 誠, 奥乃 博, HARK 4.0: PyHARKのプログラム可視化と音響伝達関数構築ツールの紹介, 第26回計測自動制御学会システムインテグレーション部門講演会 (SI2025), vol., no., pp. -, , 20251210, 広島国際会議場, ,
  • 藤川 竜樹, 球面調和関数を用いた音響伝達関数補間手法の検討, 人工知能学会 合同研究会2025 (SIGAIs 2025) 研究会横断ポスターセッション, vol., no., pp. -, 一般社団法人 人工知能学会, 20251203, 慶應義塾大学 日吉キャンパス, ,
  • 芦澤 剛, 幾何音響シミュレーションと機械学習を用いた2次元領域に対する波動伝搬予測手法の検討, 人工知能学会 合同研究会2025 (SIGAIs 2025) 研究会横断ポスターセッション, vol., no., pp. -, 一般社団法人 人工知能学会, 20251203, 慶應義塾大学 日吉キャンパス, ,
  • 三好 智大, TSV+GEVD法による空間白色化を用いた高雑音耐性音源定位, 人工知能学会 合同研究会2025 (SIGAIs 2025) 研究会横断ポスターセッション, vol., no., pp. -, 一般社団法人 人工知能学会, 20251202, 慶應義塾大学 日吉キャンパス, ,
  • 五十里 大佑, Video Vision Transformerを用いた手話認識の検討, 人工知能学会 合同研究会2025 (SIGAIs 2025) 研究会横断ポスターセッション, vol., no., pp. -, 一般社団法人 人工知能学会, 20251202, 慶應義塾大学 日吉キャンパス, ,
  • 糸山 克寿, 畑 和也, 住田 直亮, 中臺 一博, 話者情報を利用した距離ベース音声強調の改善, 第 68 回人工知能学会 AI チャレンジ研究会, vol.2025, no.Challenge-068-09, pp.49 -53, 一般社団法人 人工知能学会, 20251201, 慶應義塾大学 日吉キャンパス, ,
  • 芦澤 剛, Yen Benjamin, 中臺 一博, 幾何音響シミュレーションと機械学習を用いた2次元領域に対する波動伝搬予測手法の検討, 第 68 回人工知能学会 AI チャレンジ研究会, vol.2025, no.Challenge-068-08, pp.42 -48, 一般社団法人 人工知能学会, 20251202, 慶應義塾大学 日吉キャンパス, ,
  • 矢野 翼,Benjamin Yen,芦澤 剛,中臺 一博, ドローン自己雑音のビームフォーミング解析に基づく地表材質推定の検討, 第 68 回人工知能学会 AI チャレンジ研究会, vol.2025, no.Challenge-068-07, pp.36 -41, 一般社団法人 人工知能学会, 20251201, 慶應義塾大学 日吉キャンパス, ,
  • "阿坂 脩平,Muhammad Shakeel,前田 力,Benjamin Yen,芦澤 剛,住田 直亮,中臺 一博", OWSM v3.1 を活用した既知・未知混合条件における話者ダイアライゼーション, 第 68 回人工知能学会 AI チャレンジ研究会, vol.2025, no.Challenge-068-04, pp.20 -26, 一般社団法人 人工知能学会, 20251201, 慶應義塾大学 日吉キャンパス, ,
  • "Ragib Amin Nihal, Rui Wen, Kazuhiro Nakadai, Jun Sakuma", Pattern Enhanced Multi-Turn Jailbreaking: Exploiting Structural Vulnerabilities in LLM, コンピュータセキュリティシンポジウム2025 (CSS2025), vol., no., pp. -, , 20251030, Okayama, Japan, ,
  • "松林志保, 浦達也, 中臺一博, 長谷部真, 鈴木麗璽", 北海道北部におけるサンカノゴイの音声調査:生息実態と繁殖行動の予備的解析, 日本鳥学会 2025年度大会, vol., no., pp. -, , 20250914, 北海学園大学豊平キャンパス, ,
  • "木村 駿希, 仁科 繫明, 芦澤 剛, Yen Benjamin, 中臺 一博", 意図的な効用誤推定誘導に対応する能動推論を用いた自動交渉エージェントの検討, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250905, 東京科学大学大岡山キャンパス, 日本, ,
  • "五十里 大佑, 譚 斯涵, Yen Benjamin, 芦澤 剛, 中臺 一博", Video Vision Transformerを用いた手話認識の検討, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250903, 東京科学大学大岡山キャンパス, 日本, ,
  • "阿坂 脩平, Shakeel Muhammad, Benjamin Yen, 芦澤 剛, 中臺 一博", 既知話者・未知話者混在下での話者ダイアライゼーション, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250903, 東京科学大学大岡山キャンパス, 日本, ,
  • "矢野 翼, Yen Benjamin, 芦澤 剛, 中臺 一博", ドローン自己雑音からの地表材質推定手法の検討, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250903, 東京科学大学大岡山キャンパス, 日本, ,
  • "野島 稔生, Yen Benjamin, 芦澤 剛, 中臺 一博", ドローン搭載マイクロホンを用いたノイズに頑健な環境音識別, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250903, 東京科学大学大岡山キャンパス, 日本, ,
  • "三好 智大, Yen Benjamin, 芦澤 剛, 中臺 一博", PAFIM+:空間白色化を導入した高雑音耐性型マルチドローン音源追跡アルゴリズム, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250903, 東京科学大学大岡山キャンパス, 日本, ,
  • "芦澤 剛, Yen Benjamin, 中臺 一博", 広域音場を対象とした幾何音響シミュレーションに基づく波動伝搬予測のためのpix2pixモデルの検討, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250903, 東京科学大学大岡山キャンパス, 日本, ,
  • "Nabeela Khan, Bowen Wu, Benjamin Yen, Takeshi Ashizawa, Carlos Toshinori Ishi, Kazuhiro Nakadai", End-to-End Sign Language Generation via Conditional Flow Matching, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250904, 東京科学大学大岡山キャンパス, 日本, ,
  • "Ragib Amin Nihal, Benjamin Yen, Takeshi Ashizawa, Kazuhiro Nakadai", Knowledge-Augmented Vision Language Models for Underwater Bioacoustic Spectrogram Analysis, 第43回日本ロボット学会学術講演会(RSJ2025), vol., no., pp. -, , 20250904, 東京科学大学大岡山キャンパス, 日本, ,
  • "中臺 一博", ロボット聴覚技術の基礎と音源定位、音源分離、音声認識の最新応用技術および実装のポイント, vol., no., pp. -, , 20250321, 日本テクノセンター, ,

Back to Top