背景
DjVu 是一種專為掃描文件設計的壓縮格式,由深度學習領域的三位巨頭 Yann LeCun、Léon Bottou 與 Yoshua Bengio 在 90 年代共同開發。儘管 DjVu 在處理文字與影像混合的文件時展現出遠超早期 PDF 的壓縮效率與清晰度,但隨著 PDF 格式的普及與技術演進,DjVu 逐漸淡出主流視野,成為技術史上一段有趣的插曲。
社群觀點
在 Hacker News 的討論中,許多資深使用者對 DjVu 抱持著一種懷舊且敬佩的情感。不少人回憶起大學時期,若要下載數學或物理類的稀有學術書籍,DjVu 幾乎是唯一能兼顧檔案大小與閱讀品質的選擇。支持者認為,DjVu 的分層壓縮技術(如 IW44 與 JB2)在處理掃描文件時極具優勢,不僅檔案體積遠小於 PDF,開啟速度也更快。然而,這種格式的成功也伴隨著陰影,有留言指出 DjVu 長期以來與俄羅斯盜版圖書館或非法學術資源掛鉤,導致一般大眾在接觸到這種副檔名時,常會產生「這是否包含惡意軟體」的心理防備,這種負面標籤在一定程度上阻礙了它的合法推廣。
關於 DjVu 為何未能取代 PDF,社群給出了多樣的解釋。除了 Adobe 強大的生態系推廣外,軟體支援的匱乏是致命傷。許多使用者提到,雖然 DjVu 的閱讀體驗良好,但創作工具卻極其難用且缺乏維護。此外,隨著 PDF 格式逐漸吸收了 DjVu 的創新技術,例如支援 JPEG2000 壓縮與 JBIG2 二進位影像編碼,兩者在檔案體積上的差距已大幅縮小。這導致許多原本採用 DjVu 的機構,如 Archive.org 或政府機關,為了符合法律規範或提升跨平台相容性,紛紛將館藏重新轉檔回 PDF。
討論中也觸及了技術細節的爭論。有觀點認為,雖然 PDF 現在也能達到類似的壓縮率,但其複雜的結構隱藏了更多安全漏洞,相比之下 DjVu 的標準更為純粹。然而,現實情況是 Google 等搜尋引擎對 DjVu 的索引支援極差,導致託管在網路上的 DjVu 文件難以被搜尋到。這種技術上的孤立,加上缺乏像 GhostScript 這樣強大的開源驅動支援,使得 DjVu 即使在技術上更為優越,也難以逃脫被邊緣化並最終被轉化為 PDF 存檔的命運。
延伸閱讀
在技術實作方面,留言者分享了幾個實用的工具與專案。針對想要將 DjVu 轉換為高品質 PDF 的使用者,有開發者分享了利用 jbig2enc 進行影像編碼的轉換腳本,旨在保留 DjVu 的壓縮優勢同時兼顧 PDF 的通用性。此外,Internet Archive 開發的 archive-pdf-tools 也是處理混合光柵內容(MRC)的重要資源。對於喜愛復古讀物的讀者,維基共享資源(Wikimedia Commons)中仍保有大量以 DjVu 格式儲存的早期科幻雜誌掃描檔,是觀察該格式壓縮魅力的絕佳範例。