YBh XML 標記手冊

出自DILA Wiki
於 2022年12月19日 (一) 11:51 由 imported>Ray 所做的修訂 →‎note
(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

前言

參考 2002 郭麗娟製作之 標記說明

卷次

T0099.xml 卷次依印老著作重排,與大正藏卷次順序不同。

軟體安裝、電腦環境設定

Git

Mac

請參考〈Git 安裝教學

Git Client

Sourcetree for Mac

Sourcetree

Clone Git 倉庫

以下兩種方法二選一,如果使用 SSH 的話,要先製作 SSH Key.

Clone with SSH: git@gitlab.com:dila/ybh.git

Clone with HTTPS: https://gitlab.com/dila/ybh.git

xml 檔編輯流程

1. 每次上傳前需先檢查 Well-Formedness。

2. 上傳 T1579 前需先檢查 T1579 Validate。

3. 107.07.04 月會決議採用平行版本,先將原有的 xml 檔以 “convert xml to text” 軟體產生一份無標記、無標逗之純文字檔,再將重新標逗後的 xml檔轉成無標記、無標逗之純文字檔,兩份加以比對以確保文字的正確性。但是文字有變動時,兩份皆需修改。

Validate

validate 是針對整份 xml 文件,包含主檔及副檔,要開啟主檔,從主檔做 validate,副檔也會被驗證,不必另外驗證。

區塊標記

div

章節

<div xml:id="Bo-SWD01_002">

上面的 Bo-SW 是 Document ID, D01_002 表示第一層的第二個 div

n

n 屬性值有可能是範圍,例如 T1582.xml

<div n="4-5" xml:id="T1582D17_019" type="L17">

label

根據 2018-08 月會記錄,以五識身相應地之內容為例,在 T1579.xml 檔中,div 標示 label="【韓科】" 者,該科判確實只有出現在《韓科》,而《倫科》無。

但有些沒有標示【韓科】,卻也是依《韓科》。詳參以下2018.08月會附件3 及 T1579.xml。

level

<div level="1">

以上 level="1" 表示是第一層 div,程式不會用到,但是讓標記人員容易辨識目前是第幾層 div.

type

<div type="di">
  <head>五識身相應地</head>
</div>

di: 地

div合併

漢譯兩段合併至藏譯一段

漢譯本

<div n="2" xml:id="T1579D18_238" type="L18">
  <head type="added">3 明戒所作<link targets="T1581D13_051"/><link targets="T1583D01_003"/><link targets="T1828D32_105"/><link targets="Bo-SWD16_052"/></head>
  <div n="1" xml:id="T1579D19_185" type="L19">
    <head type="added">1 攝九為三<link targets="T1581D14_065"/><link targets="Bo-SWD17_065"/><link targets=”CT3267D19_185”></head>
    <p xml:id="T1579p4654" type="inline">如是如上<lb n="0522c28"/>所說一切自性戒等九種尸羅,當知三種<lb n="0522c29"/>戒所攝。</p>
  </div>

  <div n="2" xml:id="T1579D19_186" type="L19">
    <head type="added">2 明三聚各有所作<link targets="T1581D14_066"/><link targets="Bo-SWD17_066"/><link targets=”CT3267D19_185”></head>
    <p xml:id="T1579p4655" type="inline">謂律儀戒,攝善法戒,饒益有情戒。如<pb ed="T" xml:id="T30.1579.0523a" n="0523a"/><lb n="0523a01"/>是三種菩薩淨戒,以要言之,能為菩薩三<lb n="0523a02"/>所作事。</p>
  </div>
  …(中略)...
</div>

藏譯本

<div xml:id=”CT3267D19_185”>
  <head>1 攝九為三、2 明三聚各有所作<link targets=”T1579D19_185”/><link targets="T1581D14_065"/><link targets="Bo-SWD17_065"/></head>
<p>ཚུལ་ཁྲིམས་ཀྱི་ངོ་བོ་ཉིད་ལ་སོགས་པ་རྣམ་པ་དགུ་པོ་ཇི་སྐད་བསྟན་པའི་ཚུལ་ཁྲིམས་དེ་ཐམས་ཅད་ནི་སྡོམ་པའི་ཚུལ་ཁྲིམས་དང་དགེ་བའི་ཆོས་སྡུད་པའི་ཚུལ་ཁྲིམས་དང༌། སེམས་ཅན་གྱི་དོན་བྱེད་པའི་ཚུལ་ཁྲིམས་དང༌། ཚུལ་ཁྲིམས་རྣམ་པ་གསུམ་གྱིས་བསྡུས་པར་རིག་པར་བྱའོ། །"</p>
<p>ཚུལ་ཁྲིམས་རྣམ་པ་གསུམ་པོ་དེ་དག་ཀྱང་མདོར་བསྡུ་ན་བྱང་ཆུབ་སེམས་དཔའི་བྱ་བ་རྣམ་པ་གསུམ་བྱེད་དེ། སྡོམ་པའི་ཚུལ་ཁྲིམས་ནི་སེམས་གནས་པར་བྱེད་དོ། །</p>
</div>

gloss

梵文

例 T1579.xml, lb: 4240

<gloss>vana
</gloss>

head

@added

原典文字在 head 裡,但是本專案另外採用「2 意地」做為科判標題,記錄在 added 屬性裡,例如:

<head added="2 意地">本地分中意地第二之一...</head>

@type="added"

表示這個 head 在原典中沒有,由本專案加入,例如:

<head type="added">1 本地分...</head>

juan

卷數

《大正藏》T1579的卷數標法如下:

<juan fun="close" n="001">
<jhead><title>瑜伽師地論</title>卷第一</jhead></juan>

<juan fun="open" n="002">
<jhead><title>瑜伽師地論</title>卷第二</jhead>
<head>本地分中意地第二之二</head>
</juan>

《中華藏》 བམ་པོ། 卷數標法如下:

<juan fun="open" n="1">
  <jhead>བམ་པོ་དང་པོ།</jhead>
</juan>

lg

偈頌

例 Bo-SW.xml, lb: 050-06

<lg rend="text-indent:7">
  <l>namas te puruṣ'ā (23a) janya namas te puruṣottama</l>
  <lb n="050-07"/>
  <l>yasya te nābhijānīmaḥ kiṃ tvaṃ niśritya dhyāyasīti.</l>
</lg>


p

段落

依《韓科》 分段落

  <p> bcu bdun gang zhe na/ </p>

rend

藏譯與漢譯內文順序不同時,使用 rend="shift" 標示被 <ref type="shift"> 參照的段落。

例 CT3267-13.xml

<p xml:id="p73.405.14" rend="shift">...</p>

pp

連結點,例 T1828.xml

<pp target="T1579xp0085">有行相</pp>

被連結的點,例如 T1579-1.xml

更互相應<pp xml:id="T1579xp0085">有行相</pp>

行中標記

<!-- = -->

根據 2017.09 月會決議停用,改用 <pc force="weak">。

原書在這裡換行,而且有一個等號,表示這是一個字 samudānītaṃ 被換行切開。

例 Bo-SW, p. 3.5

samu<!-- = --><lb n="003-05"/>dānītaṃ

anchor

原書中腳注有範圍時,例:Sh-ST.xml, lb="018-01"

Ybh-sk-note1.jpg

將保留前後之”...”但將圓括弧改為方括弧。標記方式將用:

<anchor type=”note-begin” n=”1”></anchor>rakṣati cakṣurindriyam, cakṣurindriyeṇa saṁvaram āpadyate<note n=”1”>
....
</note>

annotateterm

例如 T1579-1.xml, lb="0279b05"

<annotateterm>顯色</annotateterm>者、謂青黃赤白

整個 YBh XML 只找到兩筆 annotateterm.

app

app 標記記錄不同版本的不同用字,說明詳見: [1]

app 標記可省略

2022-06 月會決議:

為降低 XML 檔案複雜度,來自 CBETA 的漢譯本,已有 <note type="orig">, <note type="mod"> 等校注標記,可省略 app 標記。

沒有 app 標記,仍可正確顯示校注,但是就不會呈現校注涵蓋的範圍。

已存在的 app 標記可保留。 未來希望呈現 app 範圍的,例如藏譯本,也可繼續使用 app.

如果 app 標記是記錄 CBETA 對於底本的修訂底本,這類 app 標記仍然需要,才能以紅色或其他醒目格式顯示 CBETA 做過修訂的用字。

藏譯本 章節尾注 (end notes)

章節附註

<app n="校勘記之編號" source="校勘記之所在頁碼">  
  <lem wit="CT">中華藏</lem>
  <rdg wit="P N">北京版、奈塘版用字</rdg>
  <rdg wit="P N C">北京版、奈塘版、卓尼版用字</rdg>
  <rdg wit="D">德格版用字</rdg>
  <rdg wit="P">北京版用字</rdg>
  <rdg wit="N">奈塘版用字</rdg>
  <rdg wit="C">卓尼版用字</rdg>
</app>

實例:

གར་སྐད་དུ། ཡོ་<app n="671.2" source="p.1343">  
  <lem wit="CT">གཱ་ཙཱརྱ་</lem>  
  <rdg wit="P N">ག་ཙརྱ།</rdg>
</app>བྷཱུ་མི།


錯置章節附註的標法:

即如實標示查章節附其所在位置於 source。 例如:中華藏冊72內文第 851頁的第三個註標,查章節附註第 1354頁, 應該排在 851 的第三個註解,卻誤排為 852 的第一個註解, 這種情況在 app 的 source 屬性中標示如下:

<app n="851.3" source="p.1354.852.1"> 
  <lem wit="CT">བྱེད་དོ་</lem>
  <rdg wit="P N">བྱ་བའོ།</rdg>
</app>


遺漏章節附註的標法:

即不標source 屬性,改標resp="Chueh",表由Chueh所增補。 例如:中華藏73冊1066頁少664.4該章節附註

<app n="664.4" resp="Chueh">
  <lem wit="CT">རིམས་</lem>
  <rdg wit="P N"> རིམ།</rdg>
</app>


注釋跨二個段落的標法:

1. 注釋跨二個段落,以下標記驗證並不會通過

<p>ཅི་རྒྱུ་ཡོད་པས་སེམས་ཅན་སྤྱོད་པའམ། འོན་ཏེ་རྒྱུ་མེད་པར་སྤྱོད་པར་འདོད། གལ་ཏེ་རྒྱུ་ཡོད་ན་ནི་སེམས་ཅན་གྱི་སྤྱོད་པ་ལ་ཡང༌། བྱེད་དུ་འཇུག་པ་གཞན་ཞིག་ཡོད་པར་འགྱུར་བས་མི་རུང་ངོ༌། །གལ་ཏེ་རྒྱུ་མེད་པ་ཡིན་ན་ནི། རྟག་ཏུ་དུས་ཐམས་ཅད་དུ་ཐམས་ཅད་སྤྱོད་པར་འགྱུར་བས
<app n="829.3" source="p.1352">
  <lem wit="CT">མི་རུང་ངམ་</p><p>ཅི་</lem>
  <rdg wit="P N">—མི་རུང་ངམ་ཅི།</rdg>
</app>
སེམས་ཅན་རང་དབང་གིས་སྤྱོད་པའམ། འོན་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་པར་འདོད། གལ་ཏེ་རང་དབང་ཡོད་ན་ནི། བདག་ཉིད་ན་བ་དང༌། རྒ་བ་དང༌། འཆི་བ་དང༌། སྡུག་བསྔལ་བ་དང༌། ཀུན་ནས་ཉོན་མོངས་པའི་སྤྱོད་པའི་མི་རིགས་སོ། །གལ་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་ན་ནི། བདག་སྤྱོད་དོ་ཞེས་བྱར་མི་རུང་ངོ༌། །
</p>

2. 建議分成兩個 app

因為 XML 標記必須符合巢狀結構,才算是一個 well-formed xml 文件。 分成兩個 app,編號可用 829.3a, 829.3b,如下所示:

<p>ཅི་རྒྱུ་ཡོད་པས་སེམས་ཅན་སྤྱོད་པའམ། འོན་ཏེ་རྒྱུ་མེད་པར་སྤྱོད་པར་འདོད། གལ་ཏེ་རྒྱུ་ཡོད་ན་ནི་སེམས་ཅན་གྱི་སྤྱོད་པ་ལ་ཡང༌། བྱེད་དུ་འཇུག་པ་གཞན་ཞིག་ཡོད་པར་འགྱུར་བས་མི་རུང་ངོ༌། །གལ་ཏེ་རྒྱུ་མེད་པ་ཡིན་ན་ནི། རྟག་ཏུ་དུས་ཐམས་ཅད་དུ་ཐམས་ཅད་སྤྱོད་པར་འགྱུར་བས
<app n="829.3a" source="p.1352">
  <lem wit="CT">མི་རུང་ངམ་</lem>
  <rdg wit="P N">—མི་རུང་ངམ།</rdg>
</app>
</p>
<p>
<app n="829.3b" source="p.1352">
  <lem wit="CT">ཅི་</lem>
  <rdg wit="P N">—ཅི།</rdg>
</app>
སེམས་ཅན་རང་དབང་གིས་སྤྱོད་པའམ། འོན་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་པར་འདོད། གལ་ཏེ་རང་དབང་ཡོད་ན་ནི། བདག་ཉིད་ན་བ་དང༌། རྒ་བ་དང༌། འཆི་བ་དང༌། སྡུག་བསྔལ་བ་དང༌། ཀུན་ནས་ཉོན་མོངས་པའི་སྤྱོད་པའི་མི་རིགས་སོ། །གལ་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་ན་ནི། བདག་སྤྱོད་དོ་ཞེས་བྱར་མི་རུང་ངོ༌། །
</p>

choice

修訂,例如 Bo-SW.xml

<choice>
  <sic>boddhisattvasya</sic>
  <corr resp="lijuan">bodhisattvasya</corr>
</choice>

sic 元素放原本的用字,corr 元素放修訂後的用字,corr 的 resp 屬性放修訂人員的姓名,可以直接放中文全名,例如:resp="陳莉娜"。

例如 Sh-SH.xml

<choice>
  <sic>[2]</sic>
  <corr resp="Lina"></corr>
</choice>

修訂或更改梵文本段落符號位置

例如 T1828.xml

<choice>
  <sic>小事小<lb n="0539a09"/>業小希望</sic>
  <corr resp="xinru" evidence="T30n1579p0517a16">少事少<lb n="0539a09"/>業少悕望</corr>
</choice>

<corr resp="xinru" evidence="T30n1579 T42n1828p0536b24" sic="障"></corr>

@evidence

evidence 可以有多個值,以半形空格隔開。

<corr resp="xinru" evidence="T30n1579 T42n1828p0536b24" sic="障"></corr>
<choice><sic></sic>
<corr resp="liyi" evidence="AC5456-017-0064a24 T42n1828_p0771b10"></corr>
</choice>

"AC"表中國國家圖書館藏本《趙城金藏》(略符:金藏乙;代碼:AC)的文獻資訊。 "AC5456-017-0064a24"表金藏乙第5456號第17卷第64圖第24行。

lb

@break

例如 Bo-SW 以下標記中的 break="no" 表示 lb 不插入空白字元,前後文字應連續:

<p xml:id="Bo-SWp0001" rend="text-indent:2">
  [Tib. 1] rnal-ḥbyor-spyod-paḥi sa-las byaṅ-chub-sems-<lb n="001-02" break="no"/>dpaḥi sa. bam-po daṅ-po.
</p>

@ed

ed="CT"

中華藏行號。

<lb ed="CT" n="1"/>

ed="D"

德格版行號。

<lb ed="D" n="1"/>

ed="P"

北京版行號。

<lb ed="P" n="1"/>

ed="ms1"

例如 Sh-ST.xml 以下表示梵本中的換行:

vipari<lb ed="ms1"/>ṇāmaduḥkhatā

原書掃描圖如下:

Ybh lb ms example.png

原書關於此符號的凡例說明:

Ybh lb ms remarks.png

ed="ms2"

例 Sh-SH.xml

<lb ed="ms2" n="11A-3[2]" break="no"/>

11A-3[2] 表示 編號 11 的木板的第3張貝葉 A 面的第2行。 所以 11A-3 之後是接 11B-3.

原書掃描圖如下:

Ybh sk Sh SH 1.jpg

梵本手稿,一塊木板,多張貝葉,15B 的照相檔如下 (點進去可以放大顯示):

YBh-Sh-SH-ms2.jpg

這塊木板的第8張貝葉編號為 15B-8

link

連結

科判之間的連結

例如CT3267,欲與T1579連結,則兩經 id 應相同,即"CT3267D01_001"、"T1579D01_001",其 id 皆為D01_001。

<div xmlns="http://www.tei-c.org/ns/1.0" n="1" xml:id="CT3267D01_001" type="fen">
  <head type="added">1 本地分
    <link targets="T1579D01_001"/>
    <link targets="T1829D04_003"/>
  </head> 
</div> 

2022-06 月會決議:

為增進 XML 可讀性,可於 <link> 前換行、內縮。<head> 下的 <link> 前後的換行、空格,在呈現之前會由程式自動刪除。

內文連結

link 的 targets 屬性 指向 pp 元素的 xml:id,例如 T1579-3.xml

<link targets="T1579xp2710"><lb n="0750a09"/>者、假立名</link>
...(中略)
<pp xml:id="T1579xp2710"><lb n="0750a13"/>立名</pp>者:謂於內、假立我及有情命者等名。

milestone

juan

<milestone unit="juan" n="1"/>

vol

中華藏

<miletsone ed="CT" unit="vol" n="72"/>

德格版

<milestone ed="D" unit="函" n="229"/>

德格版

<milestone ed="D" unit="經" n="4035"/>

note

1. 原書中腳注放前面時,例:Sh-ST lb:026-02

Ybh-sk-note2.jpg

<note place="bottom" n="1">Ms. is partly broken and looks like: ādirya...ṇāhrīkyānapatrāpyeṇa. Tib. daṅ po ñid nas ṅo tsha med pa daṅ / khrel med pa chen po, Ch. 謂彼本性成就上品無慚無愧 . Sh. [anekaparyā] [yeṇa] gāmīduḥ[khā]patrāpyeṇa.
</note>
ādita<lb ed="ms1"/>evādhimātreṇāhrīkyāna

腳注仍放前面但呈現時改為[1]。


2. 科判有需要加注解時可於xml檔標記<note>注解</note>。


@place

place="bottom" 表示註解放在頁尾,例 Bo-SW.xml:

<note place="bottom" n="1">
  byaṅ-chub-kyi phyogs-kyi chos thams-cad kyaṅ = sarvaś ca bodhi-pakṣa-dharmaḥ
</note>

@resp

漢譯與梵本、藏譯不同時,依倫科來分段落。 在介面顯示時用「案」。

例 T1579-1

<note type="editor" resp="Lina">「此中道理,當知亦爾。」對應梵本 (Sh-SH, Sh-SS) "evam ihāpi nayo veditavyaḥ /" 在前一段的結尾。</note>

@type

editor

例 T1579-1.xml

<note type="editor" resp="Lina">cf.「此中道理、當知亦爾。」對應梵本 (Sh-SH, Sh-SS) "evam ihāpi nayo veditavyaḥ /" 在前一段的結尾。</note>


例 T1579-5.xml, 倫科科判有誤時:

<head type="added">2 總解緣起支<note type="editor" resp="Lina">cf. 韓科</note></head>

foot

例 T1579-1.xml, lb: 0543a07

<note n="054301" type="foot">胝毘間宋元明宮聖五本連續而毘下間空</note>


cf1; cf2

例 T1828.xml, lb:0573c22

<app n="0573002">
<lem resp="liyi"><note type="cf1">AC5456_007_0024a27</note>
<note type="cf2">T42n1828_p0615c28</note></lem>
<rdg resp="Taisho" wit="【甲】"></rdg>
<rdg wit="【大】"></rdg></app>

cf1; cf2 表參考1;參考2。

star

某些星號校勘 <app type="star">,因為 YBh 允許省略 app,在 YBh 就改為 <note type="star">. 例如 T1581.xml

菩薩得<note corresp="#0888011" type="star"/>阿耨多羅三藐三菩提。是名果<lb 
n="0888b20"/>勝。

@subtype

例 CT3267-13.xml

<note type="editor" subtype="shift" resp="闕慧貞">
〔案:對應的藏譯原來位於<ref type="shift" target="#p73.485.1">下方</ref></note>

pb

頁碼/葉碼

中華藏 <pb ed="CT" n="72.671"/>
德格版 <pb ed="D" n="229.4035.1b"/>
北京版 <pb ed="P" n="244.5536.1a"/>

pc

標點符號

Bo-SW 使用等號「=」表示換行處的前後文字要連續:

para<pc force="weak">=</pc><lb n="003-04" break="no"/>mpar'āgato

force="weak" 表示 the punctuation mark is not a word separator

ref

移位

要連到藏譯本的另一個位置的標法,例 CT3267-13.xml:

<p xml:id="p73.313.15" xml:lang="zh">
  <note type="editor" subtype="shift" resp="闕慧貞">
    〔案:對應的藏譯原來位於<ref type="shift" target="#p73.405.14">下方</ref></note>
</p>

上面的 target 屬性,對應到下面的 id 屬性。

被連結的位置的標法,例 CT3267-13.xml:

<p xml:id="p73.405.14" rend="shift">...</p>

seg

上標字

<seg style="vertical-align:super">上標字放這裡</seg>

下標字

<seg style="vertical-align:sub">下標字放這裡</seg>

小字

<seg style="font-size:small">小字放這裡</seg>

下標小字 (多個樣式用半形分號隔開)

<seg style="vertical-align:sub;font-size:small">下標小字</seg>

劃底線

<seg style="text-decoration:underline">要劃底線的字放這裡</seg>

skgloss

梵漢對照

例 t1579.xml, lb: 4240

<skgloss n="049009">
  <gloss>vana</gloss>
  <term></term>
</skgloss>

term

漢譯

例 T1579.xml, lb: 4240

<term></term>

trailer

一個區段結束時的結尾題名或尾錄

例 Bo-SW.xml, lb: 868
<trailer rend="margin-left:8">Bodhisattva-bhūmāv ādhāre1) yoga-sthāne [Tib. 32a] <lb n="057-05"/>caturthaṃ tattvārtha-paṭalam.
</trailer>

tt

例 T1579-1.xml

<tt n="1.0.0.0.0">
  <term xml:lang="sk">gotra</term>
  <term>種姓自性</term>
  <term xml:lang="bo">rigs</term>
</tt>

網站

網站下載區需更新與增補,時間上每季、每半年或每年一次。