「AI聽聲辨種」從聲音辨識動物物種 生多所SILIC系統準確率達95% 一分鐘解讀一小時音檔

農業部生物多樣性研究所開發「SILIC」AI系統,可透過野外錄音資料辨識不同出物種。(圖片提供/農業部生物多樣性研究所)

維護生態環境的生物多樣性,需以充足的監測資料作為基礎,但透過人力調查生物多樣性,耗費人力、時間,調查規模也受到侷限,農業部生物多樣性研究所開發「SILIC」AI系統,可透過錄音資料辨識不同出物種,現可精確辨識包括鳥類、蛙類及哺乳類等共184種,準確率達95%。並且,SILIC系統僅需一分鐘時間就可辨識完成1小時音檔,將可大幅節省調查人力,擴大資料收集。

相較全球現有透過聲音辨識野生動物物種的AI軟體,只能識別音檔中有無特定物種,SILIC系統除識別物種,還能識別聲音出現確切時間及筆數,精確度更高。生多所今(18)日舉辦「聽見自然:SILIC系統打開生物多樣性智慧辨識的聲音世界」記者會,公開SILIC系統平臺:https://silic.tbn.org.tw/民眾可自行運用上傳音檔、辨識物種;平臺中也提供GitHub原始程式碼,免費提供民間開發相關物種聲景辨識APP軟體使用。

生多所今日舉辦「聽見自然:SILIC系統打開生物多樣性智慧辨識的聲音世界」記者會。(攝影/游昇俯)

以往透過人員調查生物多樣性,受限於人力,無法大規模、長時間尺度調查;以紅外線自動相機監測記錄,雖可全天運作,但也需要動物進入偵測範圍且體積夠大才能有效記錄,均有其侷限,因此生多所嘗試透過自然環境聲音組成的聲景資料,獲取生物資訊。

開發SILIC系統的生多所副研究員吳世鴻指出,此AI系統是將聲音轉換成頻譜圖,再以「CNN卷積神經網路物件偵測模型」訓練系統辨識;SILIC系統不是全球第一個能「聽聲辨種」的AI,但其他AI訓練辨識一個聲音,需要從上千、上萬筆聲音資料去學習,他因有生態知識背景,可以提供AI有效判讀參數,加上深度學習,平均只要100筆資料即可訓練辨識出一種聲音。

每種鳥的叫聲各有其特性,轉換成頻譜圖後,可以圖像方式進行深度學習與AI辨識。(圖片提供/農業部生物多樣性研究所)

生多所副研究員吳世鴻指出,SILIC系統可精準辨識不同鳥叫聲,即便叫聲重疊。(攝影/游昇俯)

生多所自2020年起於全臺各地架設超過50臺錄音機,收錄近16萬小時錄音資料,生多所即利用SILIC系統,從中擷取出1,400萬筆以上的鳥叫聲。目前SILIC已訓練完成可辨識物種共184種,包括鳥類141種、蛙類32種,以及獼猴、山羌、水鹿、石虎、白面鼯鼠等10種哺乳類動物與壁虎1種爬蟲類。

吳世鴻表示,未來系統逐步擴充,將以辨識本土、保育類、紅皮書敏感物種優先,目標辨識除了昆蟲以外的所有陸域動物,包括發出超音波的蝙蝠;因昆蟲叫聲一致且持續,無須高深模型辨識,可另行以獨立系統辨識,目前SILIC已能透過超音波辨識東亞摺翅蝠、臺灣小蹄鼻蝠等25種蝙蝠。

生多所與玉山國家公園合作設置自動錄音機,已利用SILIC系統辨識並開放鳥類聲音逾600萬筆,是全球第一份由AI辨識聲音,並開放於全球生物多樣性資訊機構(GBIF)資料庫中的物種出現紀錄資料。吳世鴻說,生多所研發此一「聽聲辨種」AI系統取名「SILIC」,來自臺灣泰雅族等原住民族對繡眼畫眉這類小型雀鳥的稱呼:「希利克」(Siliq);因原住民族常以希利克的叫聲、行為作為判斷形式的吉凶,也就是「鳥占」,藉此期許SILIC系統幫助人們解讀大自然的訊息,引導人類採取正確行動。

 

延伸閱讀