2000/8/4 中國時報浮世繪版  數位世界說法 專欄

 

資料壓縮術 -- 親愛的,我把資料變小了。

 

趙坤茂

 

資料壓縮是透過編碼的技術,來降低資料儲存時所需的空間,等到我們要用時,再做解壓縮的動作即可。

資料經過壓縮後,除了需要較少的儲存空間外,當我們在網路上傳輸時,所需的傳輸時間也較短。因此,我們從網際網路下載的資料,常常是壓縮後的資料,這樣我們才能更快速取得資料,在解壓縮後,我們就能還原成本來的資料。

我們如何做資料壓縮呢?下面這些技巧是常常被使用的。我們可以根據資料內各個字符出現機率的不同,來決定表示該字符所對應的二元碼(01位元的組合)長度,我們用較短的碼來表示出現機率較高的字符,用較長的碼來表示出現機率較低的字符,這樣平均而言,我們所需的位元數會比我們用等長的碼來表示每個字符的情況來得省。例如在英文中,字母E是出現機率最高的字符,而字母Z是出現機率最低的字符,所以比較好的編碼方式是用最短的碼來表示E,而用最長的碼來表示Z

另一種壓縮技巧是將重複性的資料以它們的特質來表示。例如,如果我們的資料內容為111…,總共有一千個1,與其用一千個位元來儲存這些都是1的資料,倒不如用“重複一千次的1”來得省。這種壓縮技巧大幅使用在影像壓縮方面,因為在影像上,我們常常有相同的色彩在一片鄰近的位置上。

最近顛覆整個唱片娛樂業的MP3,基本上是一種數位音樂的壓縮技術,它讓我們可以在一片光碟片上,儲存約十片CD唱片的音樂,也讓我們可以更便捷地從網路上下載喜愛的音樂,真是不同凡響。

WinZip壓縮軟體是目前在個人電腦世界裡,最風行的一個資料壓縮軟體。我們現在從網路上下載的軟體,在使用前,幾乎都要先用WinZip來還原才行。它所使用的最主要壓縮格式是zip檔,而zip格式的發明人是卡茲,卡茲同時也是WinZip風行前,廣受歡迎的PKZip壓縮軟體的創作人。

今年四月,卡茲因酗酒而死亡,得年僅三十七歲。當檢方搜索他的豪華住宅時,發現卡茲家的四處都是腐爛的食物,而且垃圾深及膝蓋,這位在數位世界為眾生爭取時空的壓縮專家,在現實世界裡,竟然沒能將這種超人的智慧,也套用在日常生活上,卻讓自己沉浸於成堆的垃圾及爛食物中,實在太反諷了,真叫人不勝唏噓!