「國家寶藏」赴美挖台灣史料 公民協力重建記憶
【記者陳曼寧、黃詩媛/台北市報導】蕭新晟回憶到:「我們這一代念的歷史,幾乎沒有台灣歷史,所以我很想知道,真正的歷史是什麼。」2016年,蕭新晟和一群志同道合的夥伴,在紐約舉辦了一場黑客松——一項密集式創意開發活動,參與者在短時間內共同發想並設計出與主題相關的專案,這次的主題是探索美國國家檔案局中與台灣有關的歷史文件。這個活動後來演變成「國家寶藏」,一個專注於收集、數位化、開放台灣史料的非營利的平台。
如今,「國家寶藏」已經累積超過百萬份史料,包括美國駐台領事館在二二八事件發生後,於1947年3月3日與3月5日發出的機密電報,記錄當時台灣民眾雖與政府對立,仍保持克制自律,並希望和平談判,這些台灣課本未曾詳述的二二八現場,如今透過「國家寶藏」平台得以重現。這個由群眾志工翻拍、整理而成的數位史料庫,累積超過百萬份來自美國的檔案,包含二二八事件、美國在台外交紀錄、1960年代的社會觀察報告等。讓台灣歷史不再只依靠單一視角,也讓民眾有機會在他國留下的紀錄中,看見自己的過去。
「我們的目標很單純,就是讓大家能夠看到這些歷史。」蕭新晟說。這個計畫不僅改變了研究台灣歷史的方式,也讓許多意想不到的故事重現於世人眼前。
蕭新晟畢業於洛杉磯加利福尼亞大學物理碩士班,曾擔任新創公司工程師、技術長以及創辦人,也長期參與 g0v 零時政府社群,一個推動政府資訊公開與公民參與的開源社群。蕭新晟相信透過數位技術,可以讓歷史資源更容易被整理、保存與使用。2016年,他在黑客松紐約一場密集式創意開發活動中,得知美國國家檔案局內有大量台灣相關資料,但長期缺乏整理與曝光,於是他與一群志同道合的朋友決定展開這項計畫。
志工挖寶:歷史的偶然發現
國家寶藏以簡單的方式運作——平台於社群媒體中招募,自願參與國家寶藏企畫的志工們,親自前往美國國家檔案局,借出一箱箱文件,透過手機翻拍,再上傳至雲端。「美國國家檔案局有很多台灣的歷史檔案,沒什麼人知道,所以我想說做一個專案,讓大家可以去挖寶。」蕭新晟說。他們的目標很清楚:讓這些歷史資料重回公眾視野,並開放給所有人使用。
「你永遠不知道,下一個檔案會帶來什麼驚喜。」蕭新晟笑著分享了一個特別的案例——一位學者正在撰寫關於父親的回憶錄,尋找有關西螺大橋的資料,由於「國家寶藏」的檔案是隨機分派給志工們翻拍,「因為我們的任務,就是把這整件事情都挖出來。」蕭新晟說,沒辦法特定搜尋特定某個主題。但同一天,某位志工隨機抽取了一個檔案箱,打開一看,竟然全是西螺大橋的歷史文件。這批資料包含1952年西螺地區的黑白照片、美援時期橋梁工程的施工紀錄、河床負載測試影像與多張長條摺頁圖,如「台灣西岸公路系統與大橋位置圖」、「建造方法與工程進度表A、B」、「濁水溪水位變化紀錄(1946–1951)」、「西螺雨量與風向統計(1945–1951)」等,呈現了當時美方提供技術協助下,台灣地方工程的科學化與制度化過程。
「我覺得很有趣,雖然說是隨機的,沒辦法幫特定的人做主題研究,但或許也能很隨機的就找到他要的資料了。」蕭新晟說。那位找到西螺大橋歷史文件的志工日後將史料上傳至雲端,這批資料後來成為學者研究的關鍵來源,最終出版成《西螺大橋》這本書,讓更多人得以透過這些檔案,了解西螺大橋的興建背景與歷史意義。
平台中還收藏了許多反映時代交界的重要檔案。例如,一封1974年由美國國務卿季辛吉發給美國駐台大使館的電報,就揭示了美方在美中關係改善背景下,拒絕台灣要求F-4戰機、僅提供F-5的決策過程。該檔案為「最高機密」等級,內容還原了蔣經國與美國談判的真實場景。
還有一份1981年美國記者Jack Anderson報導副本,指稱國民黨政府曾在美國境內監控異議人士陳文成,並導致其死亡。報導中也引用美國國務院與國會相關備忘錄,成為美方關注台灣情治體系的歷史證據之一。
技術如何讓歷史「復活」
隨著計畫發展,團隊開發了專屬的翻拍應用程式,並整合 AI OCR(光學字符辨識)技術,讓志工可以更快速地將影像轉換成可搜尋的數位文本。這些技術聽起來像是冰冷的數據處理,但實際上卻讓歷史變得更「鮮活」。蕭新晟回憶,當時開發翻拍應用程式時,最大的目標就是「讓參與變得無腦」,也就是讓志工能夠輕鬆地投入這場挖寶行動。
此外,團隊設計了一套簡單易懂的「任務分派系統」,讓志工只要下載專屬App、點開就能馬上開始任務。App中收錄了大量與台灣相關的歷史任務清單,但這些檔案不會依照特定主題分類,而是放入任務池中。每當有志工啟動App,系統便會隨機派發一個任務,例如翻拍某一箱檔案中的所有資料。志工只需要拿起手機,對著檔案拍照,系統就會自動將影像上傳雲端,並透過OCR技術進行文字辨識與轉檔。
「我們讓志工拿起手機,對著檔案拍攝,它就會自動上傳到雲端,並透過 AI 進行文字辨識。」蕭新晟解釋,這個過程盡可能減少繁瑣的操作,確保即使是毫無技術背景的人,也能輕易參與。
AI OCR 技術的導入,讓文件數位化的速度大幅提升。「過去要整理這些檔案,可能需要人工一頁一頁輸入,但現在透過 AI,我們可以一次處理成千上萬頁。」蕭新晟表示,雖然 OCR 技術並非完美,仍需人工校正,但這已經比傳統方式快上數十倍。
一次志工翻拍任務中,有人發現了一封1963年板橋民眾王宗榘寫給美國大使的信。信中他哀悼甘迺迪總統遭刺事件,並附上自己自費出版的兩本小冊子,請求轉交給甘迺迪遺孀。志工在翻拍這份信件時驚訝地說:「原來那個年代的台灣人,也曾這麼快速回應一個遙遠的世界事件。」這些在地聲音,透過OCR文字化,成為平台中最生動的資料之一。
制度困境下的堅持
雖然「國家寶藏」計畫實行過程中遇到諸多挑戰,如歲月對文獻的侵蝕導致難以辨識來源、數位化作業進度卡關,但近年來更棘手的困境,其實來自制度層面的改變。蕭新晟表示,「主要就是檔案局越來越不開放了,變成預約制,之前可以一大團進去,現在變得很麻煩。」這樣的轉變不僅壓縮了志工進行大規模翻拍的彈性,也增加了溝通與安排上的困難。
這樣的制度變動,讓原本仰賴團隊分工合作的翻拍流程變得更加零碎且低效,原先設定的拍攝節奏和目標也因此延後。團隊本計劃拓展至英國、荷蘭、日本等國,尋找分散於世界各地的台灣史料,然而在人力與政策雙重限制下,計畫只能維持低度營運,先專注於現有內容的整理與上架。
儘管如此,「國家寶藏」計畫也沒有就此打住,他們仍希望透過開放平台的模式,讓這個計畫得以永續發展。「我們的系統是開源的,任何人都可以複製我們的模式,在世界各地建立類似的計畫。」蕭新晟表示。國家寶藏未來的希望是讓更多人參與,不論是捐款、翻譯、校正OCR,甚至只是閱讀這些歷史故事,都是一種貢獻。
未來展望:讓更多人看見台灣歷史
「國家寶藏」不僅是一個資料庫,更是一個開放的平台,一個能夠讓歷史與現代對話的空間。今後,國家寶藏團隊將繼續充實檔案量,但是他們的目標不限於擴充資料庫的數量,更在於如何將這些資料轉譯成可讀、可感的歷史敘事。
蕭新晟指出,除了持續充實檔案量,團隊近年也投入大量心力於資料的內容轉化。「我們其實很多人,尤其是在紐約的團隊,會去讀這些資料,然後轉化成大家看得懂的故事。」蕭新晟說。志工們會在蒐集完史料後,會把原本看起來像是公文或日記的內容,用口語化、敘事的方式寫成一則則小故事。例如一份美方來文中記錄:「台中兩份報紙《台灣新生報》與《民眾日報》遭到查禁,新生報中僅有三頁以中文刊印,其餘為日文。」文中觀察指出:「不是所有台灣人都會讀中文,而且能說出中國各地方言的更少,這讓中國人感到困惑。」透過志工轉譯,這則簡短的電報不再只是軍事背景的碎片,更成為揭示當時語言政策與文化錯置的生動場景。
蕭新晟邀請更多民眾一同參與這場歷史重建的行動,不論是閱讀、翻譯還是內容再製,都是對公共記憶的珍貴貢獻。「如果去翻我們的國家寶藏臉書專頁的話,這五年來或七年來,我們有很多很多非常有趣的故事。」蕭新晟說,這些動人的內容並非自動生成,而是團隊成員一字一句人工轉譯的成果。他也表示,「我們希望號召更多人一起來看這資料,一起轉譯,一起變成動人的故事跟我們分享的。」
採訪側記:
這次採訪對象,不同於以往,採訪時間為受訪者的工作時間,且地點位於受訪者工作室,在一個內湖的大型辦公大樓中。抵達採訪地點時,找不到確切辦公室與臨時聯絡不到受訪者,皆為此次採訪的小意外,然而,也因為有了這種經驗,我們了解到如何在面對突發狀況時有效應對。
回應文章建議規則: