特生中心AI可辨識5百種動物聲音 明年挑戰聽不見的蝙蝠超音波

經過訓練,AI學會〝看見〞動物的聲音,再佐以快速運算能力,能為研究人員大幅節省分析研究的時間。圖為聲音的頻譜圖。(圖片提供/特生中心)

農委會特生中心開發可自動辨識動物叫聲的人工智慧(AI),可以快速分析特定環境中的各種動物聲音,目前這套系統已能辨識5百種分別來自2百種物種的聲音,主要是鳥類,其次是哺乳類、蛙類。這是屬於國土綠網計畫之下的研究計畫,明年AI的辨識能力將進一步擴展至人類聽不到的聲音-蝙輻的超音波。

這套自動辨識動物聲音的AI系統,其設計概念是參考人類的語音辨識技術,但比人類語音辨識單純,因為每種動物的叫聲,遠比人類講話會用到發音少了很多。特生中心助理研究員吳世鴻說,電腦會把聲音轉換成頻譜圖,橫軸是時間,縱軸是頻率,每個聲音都會有自己的頻譜圖,他們再以大量的資料訓練AI,辨識頻譜圖及物種。

開發這套辨識系統最繁雜的工作,就是前置作業。吳世鴻說,聲音範本來源有2個,一是專業鳥友們放在網路平臺上公開的各種鳥類聲音,另外一個就是中研院的亞洲聲景監測平臺,這2個聲音蒐集管道都是開放資料。鳥友們收集來的聲音已經被標識物種,很容易應用,缺點是資料比較少;亞洲聲景平臺裡的資料很多,來源包括臺灣及東南亞國家,且不只陸上的聲音,還有水下的聲音,但音源未經識別,得靠研究人員自己海選這些錄音。

AI要準確辨識動物聲音,須經人為訓練及考試,準確率達9成以上,AI對該物種聲音的辨識能力才能獲得研究人員的認可。吳世鴻說,現在對於200種物種的聲音辨識,準確率從5成到9成不等,不足的部分還要繼續訓練,但無論如何,透過AI,已大大減輕研究工作負擔。

在實際運用上,特生中心與實施友善耕作的農友合作,啟動田野調查,在田邊架設自動錄音機,記錄野生動物的鳴叫聲,再利用AI分析田間在這段時間內出現過哪些動物,位於宜蘭員山的一處生態友善農田,經自動錄音及AI分析,記錄到初春清晨5時許,來了這些訪客:青足鷸、澤蛙、白腹秧雞、紅冠水雞、褐頭鷦鶯、彩鷸、大卷尾。

研究人員在野外架設的自動錄音機,收集包括動物聲音在內的各種聲音。(圖片提供/特生中心)

「農田裡的科學計畫」團隊經營的生態友善農田,記錄並由AI分析出許多動物的聲音。(圖片提供/特生中心)

吳世鴻表示,AI透過聲音辨識動物的計畫,其實可以一直延續下去,技術及資料運用範圍很廣,有利於縮短生態研究的時間、提高效率,明年他們規劃要做超音波(超聲波)的辨識,蝙蝠會發出超音波,雖然人類聽不到,但機器可以記錄、AI可以辨識。不同品種的蝙蝠發出的超音波頻率不同,在指定研究地點,架設錄音機及可錄下超音波的麥克風,如果有蝙蝠造訪就能錄下聲音,蝙蝠何時出現、停留多久,以及有哪些種類的蝙蝠來會,透過AI,調查資料可以快速取得,也有利於做系統性的研究。在國土綠網計畫中,蝙蝠其實扮演重要角色,因為蝙蝠會吃昆蟲,包括病媒蚊在內,還會為花授粉。

雖然目前這套AI系統可以辨識的約有2百種物種、5百種聲音,但吳世鴻表示,今年會先篩選出50個資料量最多的聲音、確認準確度,讓有需要的人可以實際用得上;未來將建置臺灣聲音資料庫網站,進入網站即可以聽到臺灣物種的聲音,像是鳥類、蛙類、飛鼠、山羌等等,若想要聆聽動物的聲音,在此可輕易取得正確資訊。AI辨識系統也預留成長空間,可以收納更多的聲音種類、數量,隨著資料庫的成長,可以增加動物聲音辨識的廣度及準確度。