TaiBIF讓生物資料易查好用 助攻保育研究
【記者陳曼寧、黃詩媛/台北市報導】台灣擁有大量生物多樣性相關資料,從研究單位到公民科學社群,都累積了豐富的物種紀錄與環境觀察。然而,這些資料分散、格式各異,欠缺標準與整合機制,政府部門在規劃保育政策、進行開發評估時,常因缺乏即時、具體的指標與視覺化資訊而難以下判斷,學界與政策端之間也形成明顯的資料落差。為解決這樣的問題,TaiBIF開始投入資料工具產品的研發,嘗試將既有資料「變得好用」,目標不是重建資料,是降低理解門檻、促進轉譯,讓數據不再只是倉庫倉儲。
例如,中興大學團隊即透過 TaiBIF 提供的資料,結合氣候、土壤等開放數據,於台中霧峰與太平地區進行大赤鼯鼠生態調查;臺灣大學則應用平台上的出現紀錄與分類資訊,重整沙錢海膽的親緣關係與總科架構,讓分類研究能結合數據資源同步更新。
張筑竣原本主修嘉義大學的海洋科學,碩士階段改投入與環境相關的研究並就讀於中山大學海科學系,他在過程中開始接觸環境資料的處理與分析。當時,由於資料處理需要依序使用多套不同軟體,每一階段都得手動切換工具、轉換格式,不僅繁瑣,也容易出錯。為了解決這個問題,他與共同做分析研究的朋友合作,設計了一套能將流程整合成單一界面的分析服務,減少操作複雜度與技術門檻。和朋友共同研究的經驗成為張筑竣後來加入TaiBIF的契機。「當時剛好TaiBIF有開缺,是朋友介紹我來面試的。」張筑竣表示。他畢業後即加入TaiBIF團隊,擔任研發工程師,負責網站維運與開發各式資料應用工具。
張俊怡則是團隊中的產品經理,大學就讀嘉義大學水生生物科學系,碩士則就讀於中山大學海洋科學系,她負責協調辦公室內各項專案進度,並與工程師們協作排程。兩人分工明確,攜手推動資料產品的設計與落地。「大概二十幾年前就開始談合作,TaiBIF的角色就是把台灣的資料對接到國際。」張俊怡說明,平台最初聚焦於資料整合與共享,但隨著需求變化,團隊也逐步思考如何讓這些龐大資料真正發揮效用。
台灣生物多樣性資訊設施TaiBIF,目前是國際組織全球生物多樣性資訊機構「GBIF」在台灣的節點,設於中研院生物多樣性研究中心的。TaiBIF 致力於推動生物多樣性資訊的整合、管理與應用,核心工作可分為兩大面向:一是打造資料服務的基礎建設,透過制度建立與軟體設計,協助研究者在資料上傳、轉譯與應用過程中,擁有合適的技術工具與支援;二則是推廣資料共享文化,與各機關或研究團隊討論資料管理觀念,協助他們將資料標準化與備份工作納入日常研究流程。為此,TaiBIF 團隊不僅建置開放資料平台,也積極辦理教學活動,鼓勵更多資料上傳與再利用。
研發流程與技術應用:打造屬於台灣的開放資料工具
在TaiBIF的資料產品開發中,最具代表性的例子之一就是「TaiBIF Open Data Toolkit(ODT)」。這是一套整合式工具,專門協助使用者在開放生物多樣性資料的過程中,從觀察記錄表的欄位建立、學名校對、出現地點與時間格式標準化,到整筆資料的欄位驗證與轉換,全程一站式完成。「以往要處理這些步驟,可能要用Excel、英文工具或其他軟體來回切換,我們就是把這些常見需求整合成一個中文操作的服務。」張筑竣說。
這項工具的主要用途,是幫助研究人員、公民科學者或典藏單位,將自己蒐集的物種觀察資料,轉換成可公開於 TaiBIF 或 gBIF 平台的國際標準格式。使用者不需再熟悉多種工具或自行查找格式規範,就能順利完成上傳作業,也減少因格式錯誤或資料不完整而重工的情況。
以中興大學森林系的研究為例,團隊於2019年至2022年間在台中霧峰與太平地區進行大赤鼯鼠生態調查,累積超過90次巡視與超過40筆個體紀錄。過往這類資料多半以手動紀錄與圖檔保存,若無法轉為標準格式公開,便難以跨機構共享與進一步應用。透過 TaiBIF 提供的 ODT 工具,研究團隊得以將這些觀察記錄結構化處理,使其符合 GBIF 所採用的 Darwin Core 標準,並成功上傳至全球平台,提升資料的可檢索性與再利用性。
除了ODT之外,團隊也因應使用者諮詢需求,推出「數位 TaiBIFer」,一款建置於 ChatGPT 平台的自動問答助手,能即時協助回答TaiBIF 平台本身或資料開放流程有關的常見問題,減少人力負擔。「有時候使用者深夜提問,我們沒辦法即時回覆,就希望AI能先幫忙處理一些基本問題。」這樣的技術導入,讓TaiBIF在服務設計上更為靈活,也打開了資料產品的另一種可能。
此外,數位 TaiBIFer 在近期的開放資料教學活動中被實測使用,參與者在填寫欄位或理解欄位代碼時可即時查詢,成功減少了講師人力壓力,也加速工作坊進程。例如,有參與者在填寫「eventDate」欄位時不清楚格式要求,便直接在數位 TaiBIFer中輸入「eventDate 是什麼意思?格式要怎麼寫?」系統數位 TaiBIFer即回覆「需使用 yyyy-mm-dd 格式,例如 2024-05-18」,大幅降低現場等待助教解釋的時間。
ODT 工具也被應用於多項研究資料的整備與格式化工作,以雷公根(積雪草)相關研究為例,研究團隊在野外記錄了這種植物的出現位置與時間,這些資料原本以 Excel 或手抄紀錄保存,不容易直接上傳使用。透過 ODT,研究者可以依照操作指引,將這些觀察紀錄轉換成國際通用的資料格式,並確認學名、時間格式、欄位內容都正確。整理後的資料就能成功上傳到開放平台,後續再結合其他環境變數進行分析,找出雷公根適合生長的區域。這樣的流程,不但讓資料可以被更多人共享使用,也節省研究團隊額外整理與驗證資料的時間。
使用者回饋與資料產品應用:從現場反饋長出產品輪廓
TaiBIF 的資料產品不只在設計階段依據需求發想,後續優化更大量仰賴使用者回饋。張筑竣表示,許多使用者會透過網站「聯絡我們」的功能、粉絲專頁或活動現場直接提出意見,「我們也有固定合作的夥伴單位,像是政府機關,他們會在實際使用時告訴我們哪裡需要改善。」
張俊怡進一步說明,TaiBIF 同時也是「台灣生物多樣性資訊聯盟」的成員之一,聯盟內部涵蓋林業保育署、海保署、台博館、林試所等單位,不少新功能與改版就是與這些單位持續對話後共同催生出來的結果。
ODT在釋出初期即收到不少使用建議,例如有使用者反映,希望能自動對應資料欄位,減少人工比對格式的時間;也有人建議增加「欄位說明提示」功能,幫助非專業使用者理解資料規範。團隊會根據這些意見,內部開會討論哪些建議可以確實增強工具效能,若評估下來認為這個建議是可行的,便會納入下一輪開發。「我們收到回饋後,不會馬上加上去,而是要評估這是不是這個工具該做的事情。」張筑竣強調,產品的更新是持續性的,且必須與初衷一致。
而團隊每年固定舉辦至少兩場,針對公民科學家或研究單位的教學工作坊,以此獲取來自參與者的實質建議,例如曾有參與者反映,他們在上傳長期監測資料時,會遇到「同一筆記錄需對應多個物種」的問題,TaiBIF 之後新增了批次欄位展開與群組標記功能,讓類似資料更容易被處理與上傳。那些建議影響了 TaiBIF 資料產品的設計方向。今年,TaiBIF 特別以公民科學家為主要對象,設計課程內容聚焦於他們在資料開放過程中較常遇到的工具操作問題,協助理解平台邏輯並提升實作能力。
ODT 的應用也已在實際研究中展現效益,例如臺大地質系使用 TaiBIF 與博物館典藏資料,重新整理沙錢海膽的物種分類架構,先透過 TaiBIF 與各大博物館典藏單位取得現存台灣地區沙錢標本的學名與記錄資訊,再比對形態與文獻資料,釐清部分標本過去被誤歸為同一種的情況。研究最終提出將原本歸於同一屬的標本拆分為兩個不同屬別,並調整其總科分類,修正了台灣沙錢海膽的分類系統。這項研究成果也透過 TaiBIF 平台釋出,回饋給其他使用者與分類學者參考。
這些場域互動,不僅提升了產品設計的實用性,也讓TaiBIF得以理解用戶真正的難點與期待,實現資料服務的在地化與使用導向。參與ODT開發的劉孟儀補充:「我們希望這個工具能符合資料發布者的需求,並促進更順暢、使用者友善的資料管理與發布流程。」她指出,TaiBIF 會持續根據現場使用狀況進行調整,以降低實務操作門檻。
困難與推廣挑戰:從語言轉譯到觀念建立
TaiBIF 團隊在推動資料產品的過程中,面臨不少實際挑戰,尤其是語言轉換與資料概念的推廣。開源工具是原始程式碼公開、任何人都可以免費使用或修改的軟體,常用於處理資料格式、轉換欄位或視覺化操作等功能。張筑竣指出,許多開源工具原本都是英文介面,在語言與使用邏輯對台灣使用者來說並不友善,要讓台灣使用者理解並順利操作,必須進行中文化處理。張筑竣表示:「外文轉成繁體中文不只是翻譯而已,還要確保每個詞是清楚、能被理解的。」
除了語言門檻,TaiBIF 更常遇到的挑戰是推廣資料開放的基本概念。張俊怡表示,許多研究人員雖經年累月蒐集生物多樣性資料,卻未必認同開放共享的價值,也不了解開放格式與標準化對未來應用的幫助。張俊怡說道,「有些學者會問我們:為什麼一定要把資料分享出去?開放之後我還能掌控嗎?」
另一項具體困難則來自資料本身的處理。TaiBIF 經常協助處理不同來源的物種紀錄,其中最棘手的是物種學名變異的問題。由於學名隨著分類研究持續更新,若無專業工具進行比對與修正,就需人力手動逐一確認。張筑竣表示,這樣的工作極為耗時,過去常要翻查大量文獻才能確認目前通用名稱。例如,臺大地質系團隊在整理沙錢海膽標本時,便發現多筆館藏紀錄雖標示相同學名,但實際上來自不同屬別與演化支系。透過比對 TaiBIF 提供的開放資料與國際命名系統,研究團隊最終重新劃分其總科與屬級分類,也反映出過去紀錄中,學名標示的不一致。這類例子顯示,學名變異不僅常見,也會直接影響資料查詢與分類準確性。
除了資料轉譯問題,TaiBIF 也在推廣視覺化工具時遇到實務挑戰。例如「OneZoom 生物演化樹」為一款與 GBIF 串接的互動式資料展示工具,透過樹狀結構呈現物種演化關係與分類層級。TaiBIF將台灣物種資訊嵌入其中,例如有使用者反映,不清楚「科」、「屬」與「物種」的階層意義,不知道點進哪個節點才會看到自己想找的動物。但目前在使用者導覽與分類邏輯上仍需反覆優化,部分視覺資訊對非生物背景者來說仍具理解門檻。
此外,TaiBIF 發現部分典藏單位與研究者對於資料共享存在顧慮,對資料引用權限或後續應用缺乏信心。因此團隊也針對這類使用者設計更明確的資料授權說明,包含在資料上傳平台中清楚區分「可自由使用」與「需標註來源或限制性使用」等不同授權選項,並在每次資料發布作業前,提供對應的授權範例、常見問題及簡明操作步驟。並在每次資料發布前提供範例與QA指引,以降低心理與法律疑慮。
發展與產品設想:從現地查詢到文獻解析,資料工具再進化
TaiBIF 團隊目前正著手開發一套針對生態顧問公司與政府部門的新資料工具,預計協助用戶快速查詢指定地點的物種分布與保育狀況。張俊怡說明,這項工具的使用情境多為環境影響評估或開發案場址查核,張筑竣表示:「我們想讓他們知道這個場址是不是有保護區重疊,附近有哪些物種,它們的保育等級又是什麼。」
這項工具目前仍處於開發初期,團隊規劃在釋出第一版後,蒐集使用者反饋再進行優化,並視需求擴增至 ESG 相關應用領域這項涵蓋環境(Environmental)、社會 (Social)與治理(Governance)的指標,常被用來衡量組織在永續發展與社會責任上的表現。張筑竣說道:「我們也在想,有些企業或單位如果要做永續報告,也會需要這類資料服務,那就可以再加入對應模組。」TaiBIF 的開放資料也被廣泛運用於公民專案中。例如由公民團隊維護的「生物版 Google 地球」專案,透過 OneZoom 系統整合 GBIF 與 TaiBIF 的開放資料,在網頁上呈現互動式生命之樹,讓使用者可以依照演化樹節點查詢全球與台灣物種資訊。TaiBIF 協助將本地物種資料嵌入其中,並針對中文使用者優化分類階層的導覽設計,降低操作門檻與閱讀難度。
這項工具不僅受到生物學教師與科普講師歡迎,也提供給學生與一般大眾一種直觀理解演化關係與物種多樣性的方式。例如,在高中或大學的生物課堂上,教師可透過這個系統實際展示「穿山甲和老鼠有多近」或「鳥類與恐龍的演化關聯」,取代靜態的教科書樹圖,大幅提升教學互動性與理解深度。對於缺乏專業背景的一般使用者而言,也能快速點選常見物種節點,認識其分類位置與相關資料,實現科普知識普及的效果。
張俊怡表示,TaiBIF 不會只停留在資料提供端,而是會持續往資料應用與政策連結的方向前進。從基礎建設到資料產品,從開發工具到教育推廣,TaiBIF 嘗試讓生物多樣性資訊「真正進入社會」,在技術與對話中,拓展公共資料的實際影響力。TaiBIF 成員何芝瑩也指出:「TaiBIF 的使命之一是促進生物多樣性資料的開放與整合,支持研究與政策制定。」她認為,資料若能順利串聯政策端與研究現場,將有助於擴大台灣自然資源資料的社會效益。
採訪側記:
因為資料成果非常多,在網路上查詢到的資料太豐富,導致我們會搞不太清楚哪些屬於TaiBIF的範疇計畫或成果,而現場採訪後,我們更清楚了解他們的工作內容,也難得可以採訪到中研院下的機構團隊,我們都覺得很新奇。
回應文章建議規則: