古騰堡計畫

毛慶禎
輔仁大學圖書資訊學系


2003/02/19


  1. 目標
  2. 簡史
  3. 現況
  4. 公版作品
    • 著作權與財產權
  5. 志工
  6. 相關計畫
  7. 願景
百萬圖書供全球十億人自由取用
古騰堡計畫

1. 目標

古騰堡計畫的目標是:
  1. 為社會大眾製作及散布電子文本。
  2. 所有的人都能接受, 不受價格及取用性(硬體及軟體)的限制, 電子文本沒有任何標價。
  3. 立即可用的電子文本, 不需額外的調整, 可被人眼及電腦程式讀取, 甚至比紙本還受歡迎。
  4. 每年倍增電子文本。

2. 簡史

1971年麥克•哈特在美國伊利大學(University of Illinois)時, 材料研究實驗室(Materials Research Lab)有一部全錄Sigma V大型電腦, 麥克•哈特及其兄弟的二個最好朋友, 恰是四位操作員的成員, 幸運地得到一個帳號, 得以無限制的使用該電腦, 麥克•哈特把它視為價值一億美元。

這部電腦恰巧是當時網路上的15部電腦之一, 也就是日後網際網路的起點, 麥克•哈特相信電腦終究會成為人人可及的工具, 經過一小時又47分鐘的思考, 體會出電腦的價值在於它可以儲存、檢索的資訊, 背包裡恰好有一份美國獨立宣言, 把它鍵入, 成為 古騰堡計畫的第一個作品, 並把它寄給其他朋友。

麥克•哈特自承, 他祗是在恰當的空間, 合適的時間, 在恰好的環境下, 構思出古騰堡計晝。

1990年代中期, 古騰堡計畫移到伊利諾本篤學院(Illinois Benedictine College), 稍後由卡耐基•美隆大學(Carnegie Mellon University)贊助其財務。 到2000年, 古騰堡計畫才成為獨立的法人組織, 在密西西比州登錄為非營利組織, 取得國稅局的減稅權, 現在遷至麻塞諸塞州。

古騰堡計畫的作品都是免費的,任何人都可以自由取用及再散布, 倘若修改其內容或格式, 則不可使用古騰堡計畫之名。

俄國人萊蒙托夫(Mikhail Lermontov,1814-1841)

早年, 每本書都需要逐字鍵入, 現在則採用字元辨識技術, 時間及成本都大幅下降, 祗需要校對及編輯的工夫。

3. 現況

古騰堡計畫由麥克.哈特(Michael Hart)於1971年創辦, 依西方世界第一個採用活字刷的15世紀德國印刷商命名。它的任務是把已經出版的圖書電子化, 放在網路上供大眾自由取用。以公版著作(public domain)為主, 本來就沒有著作財產權, 或著作財產權消滅的作品; 少數作品由作者主動授權。以圖書為主, 偶有少數音樂作品。

古騰堡計畫的全文, 由 ibiblio.org - the public's library and digital archive 代為典藏 http://www.ibiblio.org/。依照製作年份分別儲存, 檔名有點神秘, 通常不會直接下載特定檔名, 而是到主站及鏡射站以特定的方式檢索 http://www.ibiblio.org/gutenberg/:
在若干地方有鏡射站 http://www.promo.net/pg/list.html, 在北京有兩個鏡射站, 祗限從中國上網者才能使用:
鏡射站與主站之間, 還有些許出版間距。

閱讀器

15世紀德國出版商古騰堡(Johannes Gutenberg, 1397-1468)以活字印刷圖書, 提昇文獻的價值, 改寫教育的版圖, 把圖書的價格降到原來的400分之一, 圖書不再那麼昂貴, 在歐洲鄉間的市集, 屢屢出現一車車的圖書, 即使是一般農民也有能力擁有它。

電子書同樣的提昇文獻的價值, 透過遠距教學, 再度改寫教育的版圖。祗有數十本網路電子書時, 在每部電腦安裝一本電子書的費用, 可能也是印本的400分之一; 當電子書多到100 Giga byte, 用戶達數百萬人時, 每本電子書的費用將低到無法計算。對於那些事事以金錢來衡量的俗人, 很難想像有古騰堡計畫(Project Gutenberg, PG)的存在。



收錄的作品有三類:
  1. 休閒文學 - 愛麗絲夢遊仙境等
  2. 經典文學 - 莎士比亞, 白鯨記, 失樂園等
  3. 參考工具書 - Roget的辭語典等
20世紀初期興起的公共圖書館運動, 有效的散布公共文學及文化遺產, 古騰堡計畫也有相同的情懷, 以「打破無知與文盲的阻礙」為其口號。因此, 所有的作品都以純文字檔呈現(Plain ASCII), 避過PDF等臃腫的其他格式。

從1971年到1993年, 古騰堡計畫祗收錄了100本電子文本, 這種進度完全符合電腦/網路的本質, 起步慢但呈指數型態成長。2003年初, 已有近一萬種電子文本。

古騰堡的官方網站, 每月被下載百餘萬種電子文本。

4. 公版作品

著作權法

1970年, 古騰堡計畫啟動時, 美國的著作財產權保護期祗有30年, 現在已延長到95年。這種保護主義的行為, 阻礙文獻的流動、降低知識的需求、歧視窮人, 尤有甚者, 妨害民主社會的發展。不但影響公版著作的成長速度, 還可能因此而減少。以全球取用文獻及知識為代價, 祗為了少數可以獲取少許利益的著作權人。

從著作權法保護財產權的角度來看, 資訊時代已經進入第四期, 影響複製文本的新科技出現後, 緊接著就是資本家以法律嵌制文獻的流動。
從1998年到2019年之間, 美國不會有任何新的公版著作, 英國亦復如此。曾經是公版著作義大利的歌劇, 已失去公版的性質。德國政府把著作財產權的保護期延長到70年以上, 回溯到1960年, 造成寒蟬效應。澳洲政府公開聲明, 不會把著作財產權的保護期從20年延長到70年以上。

科技讓每個人可以擁有每個事物, 但是法律禁止我們這麼做。

著作財產權消滅

假設作者在25歲時, 發表其著作, 存活至75歲(八十七年臺閩地區人口平均壽命), 再加上著作權法規定著作財產權存續期五十年, 臺灣地區對於百年之前的出版品, 可判定其著作權失效, 成為公眾財(public domain), 任何人都可以把它上網, 無違法之虞。

著作財產權消滅的規定, 各國不同, 臺灣的著作權法規定如下:
第三十條 (著作財產權之存續期間)
  著作財產權,除本法另有規定外,存續於著作人之生存期間及其死亡後五十年。
  著作於著作人死亡後四十年至五十年間首次公開發表者,著作財產權之期間,自公開發表時起存續十年。

第四十三條 (著作財產權消滅之著作得自由利用)
  著作財產權消滅之著作,除本法另有規定外,任何人均得自由利用。
根據《世界著作權公約(Universal Copyright Convention)》第四條第(2)項規定,一般著作之保護期間最低標準為著作人終生加二十五年; 《伯恩公約(Berne Convention for the Protection of Literary and Artistic Works)》的保護期間為著作人終生加五十年, 臺灣採用這個模式。哥倫比亞等國給予較長的保護期, 最長可達著作人終生加八十年。

著作財產權消滅期限, 並不因為它被重新製版印刷或上網, 而有所改變, 印本的製版權在著作權法第七十九條, 有清楚的規範:
第七十九條 (製版權)
  無著作財產權或著作財產權消滅之文字著述或美術著作,經製版人就文字著述整理印刷,或就美術著作原件以影印、印刷或類似方式重製首次發行,並依法登記者,製版人就其版面,專有以影印、印刷或類似方式重製之權利。
  製版人之權利,自製版完成時起算存續十年。
  前項保護期間,以該期間屆滿當年之末日,為期間之終止。
  第一項登記之辦法,由主管機關定之。
至於上網後的電子檔, 它的版面格式仍可能有製版權, 內容原文仍舊受到著作權法第三十條的限制。

特許

著作權法第九條(著作權標的之限制)規定, 有五項資訊不得為著作權之標的:
  1. 憲法、法律、命令或公文。
  2. 中央或地方機關就前款著作作成之翻譯物或編輯物。
  3. 標語及通用之符號、名詞、公式、數表、表格、簿冊或時曆。
  4. 單純為傳達事實之新聞報導所作成之語文著作。
  5. 依法令舉行之各類考試試題及其備用試題。
前項第一款所稱公文,包括公務員於職務上草擬之文告、講稿、新聞稿及其他文書。

5. 志工

古騰堡計畫是網際網路的現實典範:
古騰堡計畫的作品, 幾乎都是由志工協助, 鍵入及校對。以公版著作為主, 掃瞄、校對及上傳電子文本, 每個電子文本都是平等的。沒有評鑑、品質控制、版本選定等措施, 完全尊重志工的選擇。

除了增加電子文本之外, 還有很多工作等待志工的參與:
  1. 各國新設網站
  2. 著作權研究
  3. 編目分類
祗有志工的模式, 才能夠召集數百萬人, 用閒遐時間, 工作一週或一個月, 奉獻一個電子文本, 累積這些成果, 構成人類的公共文明。

我們有各種協助弱勢團體的方式, 食物、衣服、藥品、金錢等, 資訊及知識可以成為協助的項目之一。

訂閱電子報, http://promo.net/pg/subs.html

製作古騰堡作品

古騰堡計畫的主機在美國, 所有製作的電子文本, 必須符合美國著作權法的規定, 已是著作財產權消滅的公版作品, 須進行下列的程序:
  1. 到這個網址查詢古騰堡計畫已收錄的電子文本記錄 http://ibiblio.org/gutenberg/GUTINDEX.ALL, 每週更新, 古騰堡計畫的首頁 http://www.gutenberg.net/, 有一個可供檢索的機制, 不過, 它有數月的空窗期。
  2. 到另個網址查詢進行中的電子文本, David's In-progress List http://www.dprice48.freeserve.co.uk/GutIP.html, 有些電子文本已經公告多年, 仍沒有進展, 可以向大衛•匹里斯(David Price)洽問, 與原來的志工連繫。
  3. 1923年以前的作品, 或1923-1988年之間出版沒有著作權宣告的作品, 都是著作財產權消滅的作品, 可能被古騰堡計畫收錄, 把書名頁及版權頁(title page and verso page)掃瞄後, 即使是空白頁也要掃瞄, 寄到這個網址: Project Gutenberg Copyright Submission, http://beryl.ils.unc.edu/copy.html
  4. 公版作品資格審核通過後, 把校對後, 也格式化的檔案, 上傳至這個網址, Upload to the Project Gutenberg Posting Team, http://beryl.ils.unc.edu/upload.html
幾天後, 就會有回音。

You'll hear back within a few days.
  1. 確定該作品的著作財產權已消滅 - 作者已往生超過50年
  2. 沒有縮格, 目次、篇章等, 都不縮格, 祗有引用的詩文可以縮格。
  3. 大寫遵照一般的文法規則, 不可以把篇章的每個字母全部大寫
  4. 作品的第一行是, 製作者名字、地址、電話及電子郵件信箱
  5. 每列結束, 要回行, 按下[Enter]鍵。即 hard return, MS Window 系統的記事本會加入cr/lf兩個控制碼
  6. 每列長度為65個位元組, 即32個中文字, 含全型標點符號; 必要時, 可以放寬為 55 至 75 位元組, 最多到 51 至 79 位元組
  7. 沒有任何字跨列呈現, 不要在列尾用連字符號, 直接移到下列, 重新開始。
  8. 作品以書名開始, 最後一列的文字為 [End of this Project Gutenberg Etext of The Old Man and the Sea.], The Old Man and the Sea 應以該作品之原名代替, 然後按三下[Enter]鍵
  9. 為了校對方便, 可以在最左邊標名頁碼。
  10. 回行用[Enter]鍵表示, 它的規則是這樣的 -
  11. 志工交出來的古騰堡作品, 每件都需要5至10小時左右的編輯時間, 即使不能正確使用以上的格式, 也沒關係, 我們會代為處理。
  12. 每個作品以一個純文字檔(Planin ASCII)呈現, 不要分章呈現, 壓縮的方式祗限 ZIP, 不用 TAR 及 Z 的壓縮方式。
  13. 作品的檔名以標準的 DOS 檔名呈現, 八個英文字母或數字加三個英文字母或數字

  1. 作品的第一行是, 製作者名字、地址、電話及電子郵件信箱
  2. 古騰堡計畫辦公室負責查證著作財產權消滅事宜
  3. 消除印刷文本的痕跡 -
    1. 頁碼, 必要時(如, 參照指引至內文頁碼), 仍保留
    2. 連字符號, 每行最後的連字符號, 除非真的是一個連字
    3. 孤兒及寡母, 頁、段及行的單一個字, 均調整
    4. 排版錯誤, 故意寫錯字, 故意的壞文法, 仍保留
      空格
    5. 句子結束, 空兩格; !?不是句子結束時, 祗空一格
    6. 小段落之後, 空一行, 即兩個回行[enter]鍵, cr/lf
    7. 大段落之後, 空二行
    8. 每章之後, 空四行
    9. 章節標題之後, 空三行
    10. 刪節符號以三個連續的黑點表示, 如 [...], 前後均不空格; 句子結束處的刪節符號, 以四個連續黑點及二個空格表示, 如 [.... ], 接著是新的句子。
    11. 破折號用兩個連接號表示, 如 [--], 沒有任何空格
  4. 儘量正確
  5. 請其他志工幫忙, 互相校對
  6. 詩文及其他引文: 可隨意使用縮格及空行
  7. 引句的引號, 是否區分開始與結束, 由製作者自行決定

6. 相關計畫

古騰堡計畫在全球各地造成迴響, 除了參與的志工之外, 澳洲、德國都有獨立的計畫:
  1. 澳洲古騰堡計畫(Project Gutenberg of Australia) - http://www.gutenberg.net.au/
    它的副題是文學寶藏(a treasure-trove of literature)
  2. 德國古騰堡計畫(Projekt Gutenberg-DE) - http://projekt.gutenberg.de/
    1994年成立
公版著作的相關計畫, 世界各地都有, 較著名者為:
  1. 青空文庫(Aozora Bunko) - http://www.aozora.gr.jp/
    蒐藏豐富的文學作品電子書,針對作者身後五十年著作權消失的著作予以電子化。整理著作權消失之作者清單供參考,電子作品可依作者名或作品名查閱,均按日本讀音排序供查閱,電子全文提供文字檔、HTML、擴大本等格式供線上閱覽。
  2. Projekt Runeberg - http://www.lysator.liu.se/runeberg/
    1992年成立, 專收網路上的北歐文學。
  3. 百萬圖書計晝(Million Books Project) - http://zeeb.library.cmu.edu/Libraries/LIT/Projects/1MBooks.html
    美國國家科學基金會補助Drs. Raj Reddy and Gloriana St. Clair的2001年計畫, 掃瞄公版著作或絕版圖書。
  4. 英仙計畫(Perseus Digital Library) - http://www.perseus.tufts.edu/
    1987年展開, 針對古希臘及羅馬文獻的原文及英譯
販賣古騰堡計畫電子文本的場所:
其他電子書
授權方式

協同機構

ibiblio.org

自許為「館藏的館藏」, 公共圖書館及數位館藏的家, 自由開放取存的資訊都在它的服務範圍內: 軟體、音樂、文獻、藝術、歷史、科學、政治、文化研究等。

成立於2000年九月, 主要的合作對象是公版中心(Center for the Public Domain)及北加州大學教堂山校區(University of North Carolina - Chapel Hill)的MetaLab。由新聞及大眾傳播學院(School of Journalism and Mass Communication)、資訊及圖書館學院(School of Information and Library Science)、資訊技術服務處(Information Technology Services), 共同支持。

採用 VA Linux 開發的 SourceForge 軟體及 IBM 提供的硬體設備。

它的任務是:
網際網路對分享知識提供絕佳的機會, 公共圖書館在免費的原則下, 可以提供更多的文本、音樂、軟體等作品。還可以分享讀者的感想, 出版讀者的相關作品。即使是當今資源最豐富的圖書館, 也不敢想像的服務內容, 藉著網際網路的運作, 都可以全面提供。

研究美國詩壇及民謠的人, 可以從 ibiblio.org 找到相關的原詩及歌譜, 耹聽原聲的朗誦及演唱, 閱讀詩人及原創者的傳記, 下載相關的評論, 提供自己的研究心得。對珍珠港事件有興趣的人, 可以在 ibiblio.org 找到當事人的證詞, 並提供自己的親身資料或研究結果。

公共圖書館的每天不過接待數百名到訪者, ibibilo.org 每天有三百多萬名點閱者, 每天更新館藏內容, 採取開放源碼的模式, 接納各界的資訊, 共享每個領域裡的所有知識。


其他電子圖書館
  1. ibiblio.org - the public's library and digital archive, http://www.ibiblio.org/
  2. Center for the Public Domain, http://www.centerforthepublicdomain.org/

7. 願景

公版著作絕版之後, 祗被收藏家保存, 藉著古騰堡計畫, 將來能夠再被利用。
影像及音樂作品耗費大量的網路資源, 且檔案格式還有爭議, 留待將來再處理。
中文公版著作的電子文本

30年前還沒有可以印出百萬畫素的彩色印表機, 可以複製任何東西的立體複印機, 祗是時間問題。

當食物都經由基因工程改造出來時, 每項食物都有著作財產權, 我們還能到郊外自由採摘野果嗎?

智慧權與財產權,

龔婉婷報告2003/4/28, http://140.136.247.245/~a8710040/Lis2/912_finfo/pgmemory.htm


毛慶禎
臺北縣新莊市輔仁大學圖書資訊學系
Tel: 02 29031111 ext 2334, 3244(研究室) - Fax: 02 29017405
E-mail: mao@blue.lins.fju.edu.tw
http://www.lins.fju.edu.tw/mao/foi/pg.htm