台語文字電腦化發展 ê 現況kah問題 --
以HOTSYS®台客語文系統為例
摘要
本論文說明台語文字資訊化對台語文化 ê 復興重要意義。並且以HOTSYS® 台客語文系統發展過程tú
著
ê 問題,來探討台語文字(羅馬字)電腦化 ê 現況kah
問題。煞尾提出未來發展方向 ê 建議,誠做執政當局參考,儘速協助本土語言順利完成資訊化 ê 重要工課。
一、台語文字電腦化 ê重要性
本土語言滅亡危機
21世紀將是弱勢語言會使繼續生存的 ê 時代。世界各地的語言以驚人 ê 速度teh流失、死亡。過去五百冬內,世界上 ê 語言消失超過一半以上,估計數以百計 ê 語言將在這個世紀末消失(Sasse 1990﹕1)。Chit-má 世界上有將近六千種
ê 語言,到了21世紀末90%的語言會死亡、滅種(Krauss1992)。台灣本土語言流失 ê 情形也相當嚴重。台灣本誠有二十幾種不同 ê 語言,但是有一半已經死亡了(李壬癸 1997)。根據鄭良偉教授 ê 觀察,台灣人母語滅種 ê 徵兆,表現 t„ 母語使用 ê 人口減少、母語使用 ê 場合縮減以及使用母語 ê 能力減退(鄭良偉 1990)。調查台灣本土語言使用 ê 學者指出福佬話、客家話都有衰微 ê 跡象(Young 1988); 尚悲慘是,原住民語言已經走向滅種之路(黃宣範 1995)。語言學家張裕宏教授甚至憂心teh 指出原住民語、客家話和台語將一個續一個 ê 在台灣島上消失!文建會羅文嘉副主委指出若是情勢無改善,免kà 20冬,客語就會消失(明日報5/29/2000)。因此beh按怎挽救這種語言消失滅亡 ê 趨勢,甚至促成伊 ê 復興,實在是咱這輩台灣人 ê 重要責任!
資訊化是本土語言復興 ê 關鍵因素
Beh按怎改變本土語言滅絕 ê 危機,h³ 本土語言重新koh活過來?其中尚界重要 ê 關鍵就是按怎h³ 本土語言資訊化(電腦化),h³ 伊滿足現代資訊社會溝通 ê 需要。文字化(graphization)、標準化(standardization)、現代化(modernization)是語文規劃(corpus planning) ê 主要內容,也是語言資訊化
ê 基礎工程。文字化指 ê 是按怎將語言用文字表記 ê 問題;標準化則是進一步追求寫法一致、要求文字使用規範化;現代化是指將語文發展到符合現代社會需要,會凍成做現代文化、科技、經濟、資訊交流 ê 便利工具。講倒轉來,資訊化對語言 ê 文字化、標準化、kah 現代化仝款扮演著尚重要 ê 角色。
語言資訊化 ê 範圍誠闊,包括文字電腦化、語音電腦化等等。其中文字電腦化這項會使講是尚界重要koh 尚基礎 ê 工程。比如講,濟濟 ê 學者已經發覺,現代 ê 母語教育若干單注重口語,無適當 ê 書面語配合,註定是愛失敗 [張學謙,2000;kah 內面 ê 參考資料]。而書面語 ê 發展t„
chit-má 現代社會,一定愛透過語言資訊化 ê 協助,才有可能做到標準化、現代化。因此,本文干單beh 探討台語文字電腦化 ê 課題。
台語文字
ê 定義
廣義
ê 台語文字包括漢字kah羅馬字。除了漢字以外,福佬話所使用 ê 羅馬字,一般號做教會羅馬字iah 是白話字、台灣字(本文稱台語羅馬字),伊 ê 歷史已經超過一百冬。T„ 台灣,以台南府城為中心,1885年《台南府城教會報》創刊,陸陸續續有真濟出版品,雖然經過日本時代kah 國民政府時代政治力量 ê 壓制,˜-koh 後來政治khah 開放,台語文運動漸漸受著重視,使用台語羅馬字 ê 出版品,ùi 早期
ê 傳教、編字典、台語教材,到這陣koh 有文學創作、翻譯作品、學術論文、長短篇小說...等等台語文字,面向真濟而且豐富,koh卡重要 ê 是,使用 ê 人並無限定教會人士。台灣各原住民族 ê 語言屬南島語系,無聲調 ê 問題,t„ 電腦文書處理方面khah 無問題,˜-koh 福佬話kah 客話 ê 羅馬字需要處理聲調 ê 部分。所以t„ 電腦處理方面會khah 麻煩淡薄仔。現此時處理台語漢字kah 有聲調 ê 台語羅馬字尚界成熟、利便kah 具代表性 ê 電腦軟體應該是HOTSYS® 台客語文系統。因此後壁咱就以這個系統做例,來說明chit-má 台語文字電腦化 ê 現況kah
問題。當然koh 有其他 ê 電腦軟體[見楊允言,2000],不過˜ 是本文beh 探討 ê 對象。
另外,講著台語文字電腦化一定愛提起TW301(台語文字輸入系統,鄭良偉,1993)。TW301是美國夏威夷大學東亞語文研究所鄭良偉教授t„ 1990年發展 ê 軟體,提供彼當時台文工作者一個真利便 ê 工具,貢獻誠大。TW301是利用BIG-5、倚天中文系統t„ MS-DOS頂面做基礎來發展
ê。‹-koh
因為電腦作業系統 ê 進入圖形界面(微軟公司sak 出一系列中文視窗版本),TW301雖然對台語文運動幫贊真大,嘛無法度阻擋這個趨勢,註定愛行入歷史。
二、HOTSYS®台客語文系統
背景kah 基礎
HOTSYS®正式 ê 名稱是HOTSYS®-HAKSYS®,是tòa t„ 美國南加州 ê 蘇芝萌先生所構想、發展
ê 軟體。HOTSYS® ê「HOT」是HoloTaibun
ê 縮寫,HAKSYS® ê 「HAK」是Hakka ê 縮寫。蘇先生是電腦兼航太工程師出身,對電腦系統、軟/硬體 ê 掌握度真有夠,尚界要緊
ê ,這個軟體有團隊 (Team work) ê 概念。根據了解,目前使用台語羅馬字
ê 台文工作者,大部份攏用HOTSYS®。
蘇先生t„ 1991年 ê 時,參加南加州 ê 台文習作會(Taiwanese Writing Forum),嘛開始接觸TW301等台文軟體,漸漸開始構想組織「HOTSYSˆ台文電腦發展協調站」,並且進行相關軟體 ê 研發kah
協調
ê 工課,包括T/Windows 輸入法、永遠 ê 台文計畫(目標是20萬台語詞)、數字/
調符轉換系統、要求微軟公司 ê Word愛增加HOTSYS® 建議 ê 功能、TP( Taiwanese Protocol)白話字標準 ê 制訂、設立網站提供大眾掠HOTSYS® (http://www.HOTSYS-HAKSYS.com/)加入HAKSYS® 處理客話、……等等,這寡攏會凍說明HOTSYS® ê 目標不止仔大。
HOTSYS® ê 發展,是以Windows 作業系統做基礎,1994年正式提出,hit 陣是英文版Windows加雙橋漢字系統,這是t„ 美國 ê 台灣人beh t„ 個人電腦頂面使用漢字 ê 一種方式;˜-koh t„ 台灣,Windows 3.1 有中文版,無啥人會去用雙橋系統,所以HOTSYS®
就繼續改版。1996年sak出中文Windows 3.1 ê HOTSYS® 版本,後來微軟繼續出Windows 95/98作業系統,HOTSYS® 嘛攏tóe 有著,sak 出配合 ê 版本。圖形介面 ê Windows作業系統問世了後,DOS系統 ê 市場真緊就 kiu 去,自然引起TW301 kah HOTSYS®使用者消長 ê 情形。除了Windows作業系統,HOTSYS® 另外一個基礎是Word文書處理軟體。
技術問題:調符、漢字輸入法
調符 ê 部分,t„ Word文書處理軟體頂面使用
ê 英文字,主要是Times New Roman kah Arial兩種字型,HOTSYS®另外造HoloWin(卡óa Times New Roman)、HakkaWin!(卡óa Arial)koh Hobo(bo表示bold,粗體,通好運用t„ 標題)三種字型。T„ Windows系統,漢字 ê 顯示方式kah DOS無siâng,使用1 byte ê 字型無需要去sè 漢字內碼 ê 縫,所以˜-tä° 128-160,連161-255 tö 會使使用tit 。按呢,帶調符 ê 台語羅馬字,包括大寫 ê 攏會得入來(請參考附錄一 ê 表)。
漢字輸入法 ê 部份,Windows作業系統本身嘛有提供類似詞庫輸入法 ê 物件,˜-koh HOTSYS® 採用無仝 ê 方式。設使利用詞庫輸入法,使用者就會使根據家己 ê 需要來修改,TW301就是按呢,HOTSYS® 認為若h³ 使用者凊采去修改會造成版本無一致 ê 現象,是真˜ 好
ê 代誌。所以,伊另外發展T/Windows台文輸入法,會使將伊當做是獨立出來
ê 應用程式。觀念上,詞庫 ê 部份包起來,使用者無法度將詞庫叫出來改。
T„ 這個詞庫內底,kah TW301 仝款有多音詞、簡拍法、直拍法等 ê 功能。另外值得提起 ê ,就是E/T永遠 ê 台文計畫。 這個計畫 ê 目標是beh 收集二十萬詞(目前iah 未達到,˜-koh 已經超過五萬詞,包括江永進教授翁仔某捐贈 ê 詞),kah TW301無超過一萬詞比起來,詞條加誠濟,無仝腔口
ê 攏收(像tibah、tubah),無仝用字 ê 嘛盡量收(像「拍字」、「扑字」),而且除了基本 ê 動詞、名詞、形容詞、副詞、…以外,koh 收動詞組、名詞組、形容詞組等等,可比「台灣人 ê 」、「我是」、「123巷」…嘛攏有收。
詞條濟並˜ 是無缺點,詞條愈濟,仝一組齒,重覆 ê 機會嘛愈大,T/Windows輸入法提供一個真好用
ê 功能,咱揀過 ê 詞,以後會排t„ 頭前,可比拍「e7」出來「1會
2下
3廈…」,咱揀 2 (chh…h
F2),以後koh 拍「e7」 ê 時,順序就變做「1下 2會 3廈…」。所以用一段時間了後,卡無用著 ê 詞條就會慢慢仔走對後壁去。
另外,HOTSYS®會自動將使用者拍 ê 數字轉做調符,可比咱拍「phang2」,HOTSYS®會自動kä 換做「pháng 」,這是運用Word自動校正 ê 功能,˜-tä° 按呢,koh 根據Word提供 ê 巨集(Macro),用VBA寫一寡公用程式(Utilities)。可比講將羅馬字部份轉做斜
ê 紅字,koh 會凍將通篇 ê 調符轉數字、數字轉調符,這是顧慮著無使用HOTSYS® ê 人kah t„ Word以外 ê 軟體(可比WWW)使用 ê 時,愛有一套方便交換
ê 檔案格式。
貢獻
HOTSYS® 因為是t„ Windows系統頂面運作,排版印刷品質加誠好,所以,大部分原來使用TW301 ê 台文工作者,攏改用HOTSYS® ,包括教會公報、台文通訊、台文罔報、蓮蕉花台文雜誌、台灣字等 ê 台文雜誌,koh 親像5%台譯計畫等等,另外koh 有誠濟無公開 ê 物件攏是使用HOTSYS® 。
HOTSYS® iah 未出來 ê 時,bat 有反對使用台語羅馬字
ê 台文工作者批評,講Windows系統頂面beh 造調符iah 是輸入真費氣。暗示台語羅馬字t„ Windows系統是行未通 ê 。總是,HOTSYS® 做到--a ,親像HOTSYS® ê 廣告詞:HOTSYS® 台文系統讚koh phä°!
優點kah問題
綜合以上所講 ê ,HOTSYS®
有下腳 ê 優點:
(1)
證明台語羅馬字電腦化其實是推廣kah 心態 ê 問題,根本著˜ 是技術問題。
(2)
伊是目前所知唯一用自發性團體力量(Teamwork)合作完成 ê 台語相關軟體,t„ 台語文運動山頭滿四界、這山卡高過彼山 ê 環境之下,這點實在真可貴。
(3)
輸出品質好,h³ 人未凍用這點來嫌台文作品iah是批評台語羅馬字。
(4) 帶聲調 ê 羅馬字現拍現出現,增加拍字 ê 速度。