Language Engineering and the Knowledge Economy -- By Ali Farghaly
前言
這個章節並沒有討論計算語言學的技術細節,而是說明「語言工程學」(Language Engineering)對於知識經濟的重要性。不可諱言,作者的諸多觀點,主要是從美國的立場出發,然而,整體而言,卻顯示出未來的發展趨勢所在。
什麼是「知識經濟」?
「知識經濟」意指最近以來,產業經濟裡的基本變革,此一變革包含三個方面:產品、勞務、生產方式。在過去,主要的工業產品物是工廠所製造的貨品,但現今的工業產品,乃是知識、資訊,以及服務(knowledge, information, and services)。
在過去,產品是由機器所生產,但現今的產品,則是直接由人力,特別是腦力所產出,因此,主要的勞動者,已經由「藍領階級」變成「知識工作者」(knowledge worker)
由於「語言」是知識的重要媒介,知識經濟面臨許多與語言相關的問題,因此,對於「語言工程師」(language engineers)的需求就顯得格外殷切。也使得語言學家,在知識經濟的發展中,有機會一展長才。
知識經濟所帶來的社會變革
在1980年代及1990年代初期,科技革命使得經濟型態及生活方式產生重大改變,而背後的動力,即來自於知識與資訊。經濟的基礎,由製造產品變為知識產品,許多低階的工作,已由自動化予以取代。以美國為例,過去許多在美國國內產製的貨品,已經轉移到其他工資低廉的國家來生產,美國國內企業的重心,已經擺在研發新的技術與服務,促使現有的產品製造流程,能夠更加有效率,並耗用較少的原物料。
目前這種知識經濟的變革,大家很容易將它拿來和19世紀的工業革命相提並論。19世紀的工業革命,將社會由封建體制帶向產業經濟,它具備了三個經濟方面的特徵:
1. 主要的生產力,由原先的種植作物的農人變成操作機器的工人;
2. 主要的產品由原先的農產品轉變為工業製品,具有生產技術的國家變得富裕繁榮;
3. 社會上誕生了兩個新階級:工廠勞動者以及資本家。
過去20年間所發展的知識經濟也有類似特徵。
1. 知識工作階級的誕生,以及藍領階級人數的減少,雇用條件由體力換為腦力;
2. 「知識與資訊」比「製造品及原物料」來得更重要;
3. 知識工作者不僅享有高收入,而且,也享有前所未有的彈性管理制度。
知識經濟的特徵
知識經濟具有以下幾個特徵:
1. 電腦科技是知識經濟背後的重要動力
2. 以知識為基礎的經濟具有全球化的特點,此一特點主要是因為電腦網路連線打破了時空障礙。
3. 以知識為基礎的解決方案(knowledge-based solutions),透過自動化,提高了生產力,並減少勞力需求,增加企業利潤。而這種解決方案,本身就是一種待價而沽的產品。
4. 「知識產品」沒有具體的形象,看不見,摸不到,因此,經濟發展走向「無重量經濟」(the weightless economy),亦即,更加朝向服務,而非產品製造。
電腦模擬(computer Modeling)的重要性
電腦模擬是一項強而有力的研究工具,特別是在通訊、資訊科技、基因工程、機器人學,醫學研究等方面;研究人員,可以根據不同的理論架構,在電腦中設計不同的運算模型,然後將資料輸入,找出最佳的結果。目前在語言學的研究方面,也是用得相當普遍。
語言學與電腦模擬
Chomsky在1965年提出「衍生文法」(Generative Grammar)的概念,將語言學的理論重心由純粹的文字操作,轉向人類心智。
在過去,語言學家總是在大量的文字及語言資料之中尋找規律性;但「衍生文法」的研究者則主張,人類天生具有語言的直覺與本能,因此,所應關注者在於「語言能力」(linguistic sense),而非「語言表現」(linguistic performance)。Chomsky之重點在於,語言表現無法真正反應出母語使用者(native speaker)的語言能力,因為他們也常常講出不合文法的句子,然而,只要他們意識到文法錯誤,他們可以輕易而迅速地改正,也就是說「衍生文法」的研究者,應該模仿母語使用者的直覺,來編寫文法規則(A generative grammarian writes a grammar that mimics native speakers intuition)。
「衍生文法」既是以母語使用者的語言知識來建立模型(model),因此應該參照母語使用者在聆聽到別人講話時,解析對方談話內容的方式,來建構語言解析器(parser)。
「衍生文法」研究者的看法是,母語使用者的語言能力(liguistic competence),就語言工程學的觀點而言,並非完美無瑕;因此,語言工程學所面臨的一項挑戰就是,要處理大量破碎、不完整、非標準以及拼音錯誤的句子,在這方面,可以借助統計分析。在語言學工具的協助之下,統計分析可以顯示出語言的偏好。由於特定情境領域(domain)的人,對於他們所處在的情境,具備共通的知識與推論(common knowledge and assumptions about the domain),因此,統計分析除了能夠顯示語言方面的特質之外,也同時能反映出交談者的身分及人格特質,也就是說,語言工程學能夠透過語言分析,亦能夠對人類心智活動,例如認知心理學方面,有進一步瞭解。
網路連結(Connectivity)的影響
網路連結對語言工程學也帶來新的機會與挑戰,透過網際網路,一方面,人們以更簡短,更非正式的語言進行溝通,另一方面,尤於任何人都能上網表達意見,因此,產生許多沒有價值的「垃圾訊息」,如何慮除這些「垃圾訊息」,也是語言工程學發展的方向之一。
知識經濟的利基所在
「數位化社會」(digital society)的價值表現在於知識與資訊,如何提出解決方案,有效率地處理知識與資訊,將是利基所在。舉例來說,基因治療就是一個現成的例子,如何有效率地處理基因資訊,具有潛在的商機;更明顯的例子就是無線通訊,雖然目前語音辨識,以及人工語音合成的發展還在十分原始的階段,但語音系統已經為電話公司的客服部門,節省了大批人力,使電話公司享有更高的利潤。
舉個例子來說,AT&T是美國電訊市場的霸主,它其中的一個營業項目就是受話方付費(collect call)服務。在早期,打電話的一方必須透過接線生,由接線生先詢問受話方是否願意支付電話費,如果受話方同意付費,接線生才將電話接通。這樣的操作模式需要大量的人力成本。
如今,AT&T使用簡單的電腦程式來取代接線生,這個程式以人工合成語音向受話方提出問題,然後以簡單的語音辨識功能來辨識對方回答的是「yes」或「no」,藉以決定是否接通。
這個簡單的電腦程式,為AT&T節省了大量的人力成本。
目前,語音辨識的發展已經更為先進,可以辨識出口音、性別,以及慣用語表達方式(idiosyncratic ways of talking)。這些科技發展,對於企業與客戶之間的互動,提供了更有效率的解決方案(rovide cost‑effective solutions to business‑customer interaction)。
知識經濟與全球化
全球化具有以下特徵:
1. 冷戰結束之後,全球不再分為兩大陣營,而是更加成為一體。
2. 世界貿易組織(WTO)的成立,打破了貿易壁壘,使得全球成為單一市場。
3. 製造業由先進國家轉移到工資較為低廉的開發中國家。
4. 電腦網路科技的進步,使得美國公司能夠在印度及其他工資較為低廉的國家,雇用電腦工程師,透過網路替他們工作。
5. 市場行銷及客戶服務的範圍,都更為全球化,服務的對象跨越了文化及語言界線。
就知識經濟的整體趨勢而言,製造業將會持續移往工資較為低廉的開發中國家,而美國及其他先進國家的發展重心,將會集中於科學研究、醫藥、電腦科技、通訊等等方面的創新,以全球市場的開發。
知識經濟與語言學
知識經濟以語言為媒介,因此,語言工程及語言學的發展,將是知識經濟的重要關鍵。
史丹福大學知名的語言學大師 Karttunen,曾在1983年預言:電腦科技的快速發展,將會使得人機互動能夠以自然語言進行(human‑machine interaction in natural languages),計算語言學將會更加蓬勃發展;另外,計算語言學將會在學術研究方面,改變語言學的特性。
這兩項預言皆已獲得實現,愈來愈多的語言學家針對語言結構提出新的理論,和以往不同的是,語言學家不但提出語言規則,同時也開始研究語言的模糊性,並進行解釋與規納,例如附屬介系詞片語(prepositional phrase attachment)的特性,以及句子修飾語和名詞修飾語的區分(distinctions between sentence modifiers and NP modifiers)。要研究這樣的主題,必須從日常的語言使用,建立龐大的語料庫,也因此,統計分析就顯得十分重要,因為它們可以呈現語言的使用機率及趨勢,這對自然語言的分析格外重要。
以今天的世界局勢來說(反恐),情報單位也從各種不同的管道,例如報紙、聊天室、電子郵件等,收集大量的語言資料,從中過濾出所需要的資訊,這些語言資料的數量十分驚人,而且包括各種不同的語言,如果沒有透過語言工程學的分析,幾乎無從著力。
語言工程學不只獲得政府的重視,民間企業的需求更為迫切。許多公司,每天都要處理及收發大量的語言資料,對於客戶的回覆若是發生錯誤或延遲,都有可能造成商機的龐大損失,如果雇用大量的客服人員來進行處理,公司所費不貲,因此,如何以電腦科技自動化處理種種的電話、郵件、網頁互動等等,都是企業迫切需要的服務,而其中更重要的是,這些自動化系統必須「瞭解」客戶發送的訊息,才能做出適切的回應。這些都有賴人工智慧及語言學的研究,以創造出更合乎企業需求的系統
由以上種種的論述看來,語言工程學,在21世紀,將有無可限量的發展。