從29億張電子發票撈蛛絲馬跡,農業大數據平台如何反映產銷脈動?

文/洪嘉鎂

攝影/洪嘉鎂

農產品在生產者與消費者間,長久以來存在資訊不平等的情況。過去行政院農業委員會農糧署雖有長期蒐集生產端的資料,但農產品採收至上市,會經過批發市場、公有零售市場、傳統市場、超市、量販店等通路,根據通路不同,價格也有極大差異,深深影響政府對於生鮮農產品零售端價格的掌握情況。

農委會今(7)日舉行「食農教育科技研發計畫創新應用成果發表會」,其中新發表的「農業大數據」平台頗受關注,這項計畫從106年6月開始啟動,結合產官學力量,並與財政部財政資訊中心合作,運用電子發票資料及資料科學技術,進行農產品消費者行為分析等研究。

該平台先是從29億筆電子發票資料選定甘藍、青蔥、香蕉等15項常見蔬果,建立消費市場輪廓,再進一步納入氣象、人口分布、病蟲害狀況、進出口及網路輿情等資料,建構零售價格預測模型、颱風價格預測模型等,目前經資料驗證和網友查價發現,預估價格準確度達75%以上,未來該平臺將先供農委會內部做決策使用。

不僅如此,農委會根據這個平台分析結果做好預測後,可望將資訊釋放給一般大眾,像颱風期間菜價上揚,消費者付出費用是否合理等,供民眾進行判斷。

29億筆電子發票資料,找到消費市場樣貌

想要找到消費市場的樣貌及動態並非一件簡單事,農委會跨部會整合資源,從財政部財政資訊中心介接104年起的農產品電子發票。從104年到106年間共有29億筆電子發票資料,研究團隊透過俗名、學名等關鍵字,並參考大宗蔬果農產品,選定15項蔬菜、水果資料,從中篩選出2億筆研究資料,建立消費市場輪廓。

農委會資訊中心主任蕭柊瓊表示,雖然電子發票消費僅佔總農產品消費的2成左右,但該資料來源相當完整以及可長期取得,具有參考價值。

從電子發票資料庫中,農委會找出8項蔬菜(甘藍、青蔥、空心菜、小白菜、青江菜、包心白菜、絲瓜、胡瓜)及7項水果(香蕉、金鑽鳳梨、巨峰葡萄、珍珠芭樂、愛文芒果、椪柑、木瓜)的消費資料。據統計資料顯示,六都的蔬菜類、水果類消費佔全國8成左右,其中水果類的香蕉產值高達29.4億元,而蔬菜類中的甘藍產值達16.7億元。

找出消費市場的樣貌是農業大數據平台建立的第一步。

大數據抓住有機農產品市場消費行為

近年國人越來越注重飲食,有機農產品的的市場消費量及種植面積逐年增加,106年6月底,全國經過驗證有機農產品的年產值高達37.8億元。台灣農業資訊科技展協會專案組組長陳淑慧指出,根據《有機誌》的2017年有機消費者通路年度調查報告中,可以知道消費者購買有機產品的通路中,約有76%為電子發票通路。

根據電子發票數據進行的初步成果顯示,有機農產品價格大幅高於非有機農產品,且市價穩定,估計有85%的有機農產品是在六都消費。從數據中也發現到,有機市場的重度消費區域前三名為:新竹縣、新竹市及新北市。

陳淑慧進一步表示,政府積極推動有機農業,電子發票能加強政府對於有機農產品的消費掌握度,農政單位可從生產成本投入及市場消費狀況進行消費者行為研究,預測未來消費量,這可為產業找到新的機會,當電子商務、行動支付等工具導入後,規劃新的產銷模式。

四大模型,發現市場現在動態及未來趨勢

找到消費市場樣貌僅是第一步,對於政府單位來說能否使用大數據輔以決策才是關鍵點。

建構農業大數據平台不僅使用電子發票資料庫,更納入氣象、人口分布、病蟲害狀況、進出口及網路輿情等十幾種資料資料,透過機器學習方法建立「零售價格估計模型」、「零售價格預測模型」、「颱風價格預測模型」,及「農業關鍵事件推薦模型」等四大模型,可讓政府能適時掌握市場動態。

浚鴻數據開發股份有限公司總經理楊雅惠以106年10月香蕉跌價狀況為例,透過零售價格估計模型可得知香蕉跌價期間的市場狀況,從中加入跌價期間的市場事件及政策施行項目,例如:13位民進黨立委舉辦香蕉促銷大會、農委會提加工方向解決香蕉過剩、雲林縣政府努力行銷當季當地香蕉等措施,即可得知那些策略是有助於價格回穩。

楊雅惠進一步說明,政府知道市場狀況,但民眾不見得如此了解真實情況,透過農業關鍵事件推薦模型,可分析香蕉跌價期間的輿論狀況,政府能及時做因應措施,告知民眾正確的訊息。

農業大數據的應用範圍相當廣泛,在颱風季來臨時,可針對颱風條件、農產品生產週期、產季、種植面積等條件,可預測產量及批發交易量,還可以加入休市及預期心理等短期因子,可調整預測批發價格、零售,適時調節供給狀況。

透過預測模型,能模擬颱風對農產品市場造成的影響。(資料提供/農委會)

目前預估價格有透過資料驗證及讓網友協助查價,準確度大於75%以上,是可以運用到產業界。蕭柊瓊補充說明,由於開立電子發票的商家可能還有稅金、上架費等,需透過市場查價做比例分配,消除各通路間的價格差距,才能估計零售市場價格。

農業大數據資料將實際應用於決策

蕭柊瓊表示,該平台目前已經能使用在農委會決策分析上,現階段將鎖定在農委會內部使用,由農委會做預測後,將資訊公布給一般民眾知道,如:公開蔬果預估價格,消費者可依據價格差異,選擇不同的購買策略。未來是否會將資料都放上網路提供給民眾做資料串接,蕭柊瓊指出,仍需與業務單位研議。

農委會表示,利用資料科學方法發展大數據分析工具,已經建立甘藍、香蕉等15項農產品消費市場趨勢零售價格估計模型,也應用歷史資料建立的預測模型,模擬不同颱風路徑、強度、雨量對於菜價影響,將有助事先掌握價格波動。最後藉由分析網路輿情民眾關注的聲量、情緒,掌握農業關鍵事件輿論發展脈絡與政策傳播成效,可作為施政決策參考,以拉近與民眾距離。