野鳥の歌声解析は、動物行動学、生物音響学、ロボット聴覚、機械学習など様々な側面から、重要な問題として取組まれています。動物行動学的な側面では,人が耳を澄まして野鳥の種類,方向,時刻のメモを取り,これを基に集中力と時間を要する人手の解析が行われています。
このような解析方法は,人手であるがゆえに統制された解析結果を得ることが難しく,後から再度聴取して確かめることもできないという課題があります.近年,海外では野鳥の歌声を収集するプロジェクトが発足し,機械学習を適用した野鳥の種類識別研究が行われていますが,いずれもシングルマイク収録であるため,行動解析で重要な野鳥の位置検出までは考慮されていません。
ロボット聴覚、およびロボット聴覚と機械学習の融合によって、この問題への取り組みを行っています。複数のマイクロホンアレイを用いて、広範囲にわたって屋外でも音源の三次元位置を推定することによって野鳥の位置検出を行うことができる技術、教師データが少なくても学習ができる深層学習の手法を新たに提案することにより,歌声から野鳥の種類を聞き分けることができる技術などを扱っています。また,名古屋大学や京都大学の研究グループと共同で,これらを発展させ,野鳥の歌によるコミュニケーションを解析する研究も進めています。
複数のマイクロホンアレイによる野鳥の歌からの位置推定
野鳥の歌のシーン解析(when, where, what)

共有データなしでの生物音響分類器の統合
中臺研では、鳥・クジラ・カエルなどの様々な動物グループをまとめて識別できるAI分類器を作ることを目指しています。
機械学習では多くの場合、全ての学習データを集めて一度に学習をさせますが、実用上ではデータ共有ができない場合も多くあります。そこでこの研究では、それぞれの動物の鳴き声が異なる周波数帯を有している傾向にあることに着目しました。
この性質を利用して、別々に学習した分類器のパラメータを平均することで統合し、データを共有することなく、多くの動物種に対応できる1つの分類器を実現しました。

長時間録音における弱教師ありクジラ鳴き声検出
クジラの鳴き声を検出するAIを学習させるには、通常、長時間の録音データの中からすべての鳴き声の位置を人の手で細かく記録する必要があり、何百時間もの作業がかかります。
そこで本研究では、録音ごとに「クジラの鳴き声がある/ない」という簡単なラベルだけを使って学習できる手法を提案しました。
さらに、この手法は録音の中で「いつ鳴き声が発生しているのか」も自動的に推定できるようになっています。

クロックずれがある環境下でのマルチチャネル音声同期
野生動物の位置を3次元で特定するためには、複数の録音機を自然環境のさまざまな場所に設置します。
しかし、それぞれの録音機に内蔵された時計は時間とともに少しずつずれてしまうため、録音データ同士のタイミングが合わなくなります。
そこで本研究では、この「クロックずれ」を深層学習によって予測し、自動的に補正する手法を提案しました。
この研究は、国際コンペティション「BioDCASE 2025」で第1位を獲得しました。
