CBETA XML P5 使用手冊

出自DILA Wiki
於 2013年10月2日 (三) 08:06 由 imported>Ray 所做的修訂 →‎檔案架構

Download

GitHub CBETA XML P5

檔案架構

依各藏經分資料夾, 例如 T 為大正藏, X 為卍續藏. 編碼請參考: CBETA 藏經代碼

各藏經資料夾下, 再依冊分資料夾, 例如 T/T01, T/T02 等等.
冊數大多為兩碼數字, 但也有三碼的情況.
例如 A091, A097 等.

一部典籍一個 XML 檔案. 檔名為冊數加 典籍編號(俗稱經號).
例如 T01n0001.xml 表示大正藏第一經.

一部典籍通常是一個 XML 檔, 但跨多冊時例外, 例如大正藏《大般若經》跨 T05~T07.
就分為多個 XML 檔在多個冊數資料夾裡:

  • T05
    • T05n0220a.xml
  • T06
    • T06n0220b.xml
  • T07
    • T07n0220c.xml
    • T07n0220d.xml
    • T07n0220e.xml
    • T07n0220f.xml
    • T07n0220g.xml
    • T07n0220h.xml
    • T07n0220i.xml
    • T07n0220j.xml
    • T07n0220k.xml
    • T07n0220l.xml
    • T07n0220m.xml
    • T07n0220n.xml
    • T07n0220o.xml

為什麼 T05、T06 都只有一個檔,而 T07 卻分為 13 個檔?

這是因為要把各般若的別本或相關經文放在一起,所以要把大般若經拆開處理,才因此切成許多小經。(參考 CBReader 左側目錄區)

檔案編號般若類別
T051a大品般若-1/因跨冊所以分成a、b
T061b大品般若-2/因跨冊所以分成a、b
T072c中品般若-1
T073c中品般若-2
T074d小品般若-1
T075d小品般若-2
T076e天王般若
T077f 文殊般若
T078g那伽室利般若
T079h金剛般若
T0710i理趣般若
T0711j六分般若-布施波羅蜜多
T0712k六分般若-淨戒波羅蜜多
T0713l六分般若-安忍波羅蜜多
T0714m六分般若-精進波羅蜜多
T0715n六分般若-靜慮波羅蜜多
T0716o六分般若-般若波羅蜜多

別本

經號通常為四碼數字, 但也有例外, 像 T02n0128a.xml, T02n0128b.xml, 在主檔名最後多了小寫英文.
這是大正藏只給了一個經號 128 《須摩提女經》, 但是在內文裡收了兩本.
所以 CBETA 以不同的經號 128a, 128b 來區別.

又如 T02n0150A.xml, T02n0150B.xml, 在主檔名最後多了大寫英文
這是大正藏只給一個經號 150, 但是有給了兩個編號 150A, 150B,
CBETA 就根據這兩個編號為檔名.

以上檔名最後的大小寫英文分別表示不同的情況, 這是須留意的.
大寫英文是大正藏給的, 小寫英文是 CBETA 給的.

Global Attributes

CBETA XML P5 Global Attributes

Elements

Elements