「YBh XML 標記手冊」:修訂間差異
imported>Lina.chen 無編輯摘要 |
imported>Ray (→@break) |
||
| 行 263: | 行 263: | ||
[Tib. 1] rnal-ḥbyor-spyod-paḥi sa-las byaṅ-chub-sems-<lb n="001-02" break="no"/>dpaḥi sa. bam-po daṅ-po. | [Tib. 1] rnal-ḥbyor-spyod-paḥi sa-las byaṅ-chub-sems-<lb n="001-02" break="no"/>dpaḥi sa. bam-po daṅ-po. | ||
</p> | </p> | ||
</syntaxhighlight> | |||
=== @ed === | |||
例如 Sh-ST.xml 以下表示梵本中的換行: | |||
<syntaxhighlight lang="XML"> | |||
vipari<lb ed="Ms."/>ṇāmaduḥkhatā | |||
</syntaxhighlight> | </syntaxhighlight> | ||
於 2018年6月21日 (四) 16:18 的修訂
前言
參考 2002 郭麗娟製作之 標記說明
卷次
T0099.xml 卷次依印老著作重排,與大正藏卷次順序不同。
xml 檔編輯流程
1. 每次上傳前需先檢查 Well-Formedness。 2. 上傳 T1579 前需先檢查 T1579 Validate。
區塊標記
div
章節
<div xml:id="Bo-SWD01_002">
上面的 Bo-SW 是 Document ID, D01_002 表示第一層的第二個 div
level
<div level="1">
以上 level="1" 表示是第一層 div,程式不會用到,但是讓標記人員容易辨識目前是第幾層 div.
type
<div type="di">
<head>五識身相應地</head>
</div>
di: 地
gloss
梵文
例 t1579.xml, lb: 4240
<gloss>vana
</gloss>
head
@added
原典文字在 head 裡,但是本專案另外採用「2 意地」做為科判標題,記錄在 added 屬性裡,例如:
<head added="2 意地">本地分中意地第二之一...</head>
@type="added"
表示這個 head 在原典中沒有,由本專案加入,例如:
<head type="added">1 本地分...</head>
juan
卷數
《大正藏》T1579的卷數標法如下:
<juan fun="close" n="001">
<jhead><title>瑜伽師地論</title>卷第一</jhead></juan>
<juan fun="open" n="002">
<jhead><title>瑜伽師地論</title>卷第二</jhead>
<head>本地分中意地第二之二</head>
</juan>
《中華藏》 བམ་པོ། 卷數標法如下:
<juan fun="open" n="1">
<jhead>བམ་པོ་དང་པོ།</jhead>
</juan>
lg
偈頌
例 Bo-SW.xml, lb: 050-06
<lg rend="text-indent:7">
<l>namas te puruṣ'ā (23a) janya namas te puruṣottama</l>
<lb n="050-07"/>
<l>yasya te nābhijānīmaḥ kiṃ tvaṃ niśritya dhyāyasīti.</l>
</lg>
link
連結
例如CT3267,欲與T1579連結,則兩經 id 應相同,即"CT3267D01_001"、"T1579D01_001",其 id 皆為D01_001。
< div xmlns="http://www.tei-c.org/ns/1.0" n="1" xml:id="CT3267D01_001" type="fen">
<head type="added">1 本地分
<link targets="T1579D01_001"/>
<link targets="T1829D04_003"/>
</head>
</div>
p
段落
依《韓科》 分段落
<p> bcu bdun gang zhe na/ </p>
pp
連結點,例 T1828.xml
<pp target="T1579xp0085">有行相</pp>
被連結的點,例如 T1579-1.xml
更互相應<pp xml:id="T1579xp0085">有行相</pp>
行中標記
<!-- = -->
根據 2017.09 月會決議停用,改用 <pc force="weak">。
原書在這裡換行,而且有一個等號,表示這是一個字 samudānītaṃ 被換行切開。
例 Bo-SW, p. 3.5
samu<!-- = --><lb n="003-05"/>dānītaṃ
annotateterm
例如 T1579-1.xml, lb="0279b05
<annotateterm>顯色</annotateterm>者、謂青黃赤白
整個 YBh XML 只找到兩筆 annotateterm.
app
章節附註
<app n="校勘記之編號" source="校勘記之所在頁碼">
<lem wit="CT">中華藏</lem>
<rdg wit="P N">北京版、奈塘版用字</rdg>
<rdg wit="P N C">北京版、奈塘版、卓尼版用字</rdg>
<rdg wit="D">德格版用字</rdg>
<rdg wit="P">北京版用字</rdg>
<rdg wit="N">奈塘版用字</rdg>
<rdg wit="C">卓尼版用字</rdg>
</app>
實例:
གར་སྐད་དུ། ཡོ་<app n="671.2" source="p.1343">
<lem wit="CT">གཱ་ཙཱརྱ་</lem>
<rdg wit="P N">ག་ཙརྱ།</rdg>
</app>བྷཱུ་མི།
錯置章節附註的標法:
即如實標示查章節附其所在位置於 source。 例如:中華藏冊72內文第 851頁的第三個註標,查章節附註第 1354頁, 應該排在 851 的第三個註解,卻誤排為 852 的第一個註解, 這種情況在 app 的 source 屬性中標示如下:
<app n="851.3" source="p.1354.852.1">
<lem wit="CT">བྱེད་དོ་</lem>
<rdg wit="P N">བྱ་བའོ།</rdg>
</app>
遺漏章節附註的標法:
即不標source 屬性,改標resp="Chueh",表由Chueh所增補。 例如:中華藏73冊1066頁少664.4該章節附註
<app n="664.4" resp="Chueh">
<lem wit="CT">རིམས་</lem>
<rdg wit="P N"> རིམ།</rdg>
</app>
注釋跨二個段落的標法:
1. 注釋跨二個段落,以下標記驗證並不會通過
<p>ཅི་རྒྱུ་ཡོད་པས་སེམས་ཅན་སྤྱོད་པའམ། འོན་ཏེ་རྒྱུ་མེད་པར་སྤྱོད་པར་འདོད། གལ་ཏེ་རྒྱུ་ཡོད་ན་ནི་སེམས་ཅན་གྱི་སྤྱོད་པ་ལ་ཡང༌། བྱེད་དུ་འཇུག་པ་གཞན་ཞིག་ཡོད་པར་འགྱུར་བས་མི་རུང་ངོ༌། །གལ་ཏེ་རྒྱུ་མེད་པ་ཡིན་ན་ནི། རྟག་ཏུ་དུས་ཐམས་ཅད་དུ་ཐམས་ཅད་སྤྱོད་པར་འགྱུར་བས
<app n="829.3" source="p.1352">
<lem wit="CT">མི་རུང་ངམ་</p><p>ཅི་</lem>
<rdg wit="P N">—མི་རུང་ངམ་ཅི།</rdg>
</app>
སེམས་ཅན་རང་དབང་གིས་སྤྱོད་པའམ། འོན་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་པར་འདོད། གལ་ཏེ་རང་དབང་ཡོད་ན་ནི། བདག་ཉིད་ན་བ་དང༌། རྒ་བ་དང༌། འཆི་བ་དང༌། སྡུག་བསྔལ་བ་དང༌། ཀུན་ནས་ཉོན་མོངས་པའི་སྤྱོད་པའི་མི་རིགས་སོ། །གལ་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་ན་ནི། བདག་སྤྱོད་དོ་ཞེས་བྱར་མི་རུང་ངོ༌། །
</p>
2. 建議分成兩個 app
因為 XML 標記必須符合巢狀結構,才算是一個 well-formed xml 文件。 分成兩個 app,編號可用 829.3a, 829.3b,如下所示:
<p>ཅི་རྒྱུ་ཡོད་པས་སེམས་ཅན་སྤྱོད་པའམ། འོན་ཏེ་རྒྱུ་མེད་པར་སྤྱོད་པར་འདོད། གལ་ཏེ་རྒྱུ་ཡོད་ན་ནི་སེམས་ཅན་གྱི་སྤྱོད་པ་ལ་ཡང༌། བྱེད་དུ་འཇུག་པ་གཞན་ཞིག་ཡོད་པར་འགྱུར་བས་མི་རུང་ངོ༌། །གལ་ཏེ་རྒྱུ་མེད་པ་ཡིན་ན་ནི། རྟག་ཏུ་དུས་ཐམས་ཅད་དུ་ཐམས་ཅད་སྤྱོད་པར་འགྱུར་བས
<app n="829.3a" source="p.1352">
<lem wit="CT">མི་རུང་ངམ་</lem>
<rdg wit="P N">—མི་རུང་ངམ།</rdg>
</app>
</p>
<p>
<app n="829.3b" source="p.1352">
<lem wit="CT">ཅི་</lem>
<rdg wit="P N">—ཅི།</rdg>
</app>
སེམས་ཅན་རང་དབང་གིས་སྤྱོད་པའམ། འོན་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་པར་འདོད། གལ་ཏེ་རང་དབང་ཡོད་ན་ནི། བདག་ཉིད་ན་བ་དང༌། རྒ་བ་དང༌། འཆི་བ་དང༌། སྡུག་བསྔལ་བ་དང༌། ཀུན་ནས་ཉོན་མོངས་པའི་སྤྱོད་པའི་མི་རིགས་སོ། །གལ་ཏེ་གཞན་གྱི་དབང་གིས་སྤྱོད་ན་ནི། བདག་སྤྱོད་དོ་ཞེས་བྱར་མི་རུང་ངོ༌། །
</p>
lb
@break
例如 Bo-SW 以下標記中的 break="no" 表示 lb 不插入空白字元,前後文字應連續:
<p xml:id="Bo-SWp0001" rend="text-indent:2">
[Tib. 1] rnal-ḥbyor-spyod-paḥi sa-las byaṅ-chub-sems-<lb n="001-02" break="no"/>dpaḥi sa. bam-po daṅ-po.
</p>
@ed
例如 Sh-ST.xml 以下表示梵本中的換行:
vipari<lb ed="Ms."/>ṇāmaduḥkhatā
note
@place
place="bottom" 表示註解放在頁尾,例 Bo-SW.xml:
<note place="bottom" n="1">
byaṅ-chub-kyi phyogs-kyi chos thams-cad kyaṅ = sarvaś ca bodhi-pakṣa-dharmaḥ
</note>
@type
type="foot"
例 T1579-1.xml, lb: 0543a07
<note n="054301" type="foot">胝毘間宋元明宮聖五本連續而毘下間空</note>
pb
頁碼/葉碼
中華藏 <pb ed="CT" n="72.671"/>
德格版 <pb ed="D" n="229.4035.1b"/>
北京版 <pb ed="P" n="244.5536.1a"/>
pc
標點符號
Bo-SW 使用等號「=」表示換行處的前後文字要連續:
para<pc force="weak">=</pc><lb n="003-04" break="no"/>mpar'āgato
force="weak" 表示 the punctuation mark is not a word separator
seg
上標字
<seg style="vertical-align:super">上標字放這裡</seg>
下標字
<seg style="vertical-align:sub">下標字放這裡</seg>
小字
<seg style="font-size:small">小字放這裡</seg>
下標小字 (多個樣式用半形分號隔開)
<seg style="vertical-align:sub;font-size:small">下標小字</seg>
劃底線
<seg style="text-decoration:underline">要劃底線的字放這裡</seg>
skgloss
梵漢對照
例 t1579.xml, lb: 4240
<skgloss n="049009">
<gloss>vana</gloss>
<term>林</term>
</skgloss>
term
漢譯
例 T1579.xml, lb: 4240
<term>林
</term>
trailer
一個區段結束時的結尾題名或尾錄
例 Bo-SW.xml, lb: 868
<trailer rend="margin-left:8">Bodhisattva-bhūmāv ādhāre1) yoga-sthāne [Tib. 32a] <lb n="057-05"/>caturthaṃ tattvārtha-paṭalam.
</trailer>
tt
例 T1579-1.xml
<tt n="1.0.0.0.0">
<term xml:lang="sk">gotra</term>
<term>種姓自性</term>
<term xml:lang="bo">rigs</term>
</tt>