CBETA XML P5 使用手冊

出自DILA Wiki
於 2013年10月1日 (二) 10:46 由 imported>Ray 所做的修訂 →‎檔案架構

Download

GitHub CBETA XML P5

檔案架構

依各藏經分資料夾, 例如 T 為大正藏, X 為卍續藏. 編碼請參考: CBETA 藏經代碼

各藏經資料夾下, 再依冊分資料夾, 例如 T/T01, T/T02 等等.
冊數大多為兩碼數字, 但也有三碼的情況.
例如 A091, A097 等.

一部典籍一個 XML 檔案. 檔名為冊數加 典籍編號(俗稱經號).
例如 T01n0001.xml 表示大正藏第一經.

一部典籍通常是一個 XML 檔, 但跨多冊時例外, 例如大正藏《大般若經》跨 T05~T07.
就分為多個 XML 檔在多個冊數資料夾裡:

  • T05
    • T05n0220a.xml
  • T06
    • T06n0220b.xml
  • T07
    • T07n0220c.xml
    • T07n0220d.xml
    • T07n0220e.xml
    • T07n0220f.xml
    • T07n0220g.xml
    • T07n0220h.xml
    • T07n0220i.xml
    • T07n0220j.xml
    • T07n0220k.xml
    • T07n0220l.xml
    • T07n0220m.xml
    • T07n0220n.xml
    • T07n0220o.xml

為什麼 T05、T06 都只有一個檔,而 T07 卻分為 13 個檔?

這是因為要把各般若的別本或相關經文放在一起,所以要把大般若經拆開處理,才因此切成許多小經。(參考 CBReader 左側目錄區)

別本

經號通常為四碼數字, 但也有例外, 像 T02n0128a.xml, T02n0128b.xml, 在主檔名最後多了小寫英文.
這是大正藏只給了一個經號 128 《須摩提女經》, 但是在內文裡收了兩本.
所以 CBETA 以不同的經號 128a, 128b 來區別.

又如 T02n0150A.xml, T02n0150B.xml, 在主檔名最後多了大寫英文
這是大正藏只給一個經號 150, 但是有給了兩個編號 150A, 150B,
CBETA 就根據這兩個編號為檔名.

以上檔名最後的大小寫英文分別表示不同的情況, 這是須留意的.
大寫英文是大正藏給的, 小寫英文是 CBETA 給的.

Global Attributes

CBETA XML P5 Global Attributes

Elements

Elements