「CBETA XML P5 Elements」:修訂間差異

出自DILA Wiki
imported>Ray
→‎lem
imported>Ray
→‎char
行 94: 行 94:


 參考: lem 元素、rdg 元素
 參考: lem 元素、rdg 元素
=byline=
T01n0001
<syntaxhighlight lang="XML">
<lb n="0001a04" ed="T"/><byline cb:type="Author">長安釋僧肇述</byline>
</syntaxhighlight>


=char=
=char=

於 2013年8月29日 (四) 15:36 的修訂

anchor

nkr_note_orig

T01n0001, p. 1a02

<anchor xml:id="nkr_note_orig_0001001" n="0001001"/><head><title>長阿含經</title></head>

nkr_note_orig_0001001 對應到 back 元素裡的 note:

<note n="0001001" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001001">此序依宋元明三本ニ依テ載ス</note>

resp14 對應到 teiHeader 裡的宣告:

<respStmt xml:id="resp14"><resp>corrections</resp><name>Taisho</name></respStmt>

也就是說這是大正藏的註.

type="cb-app"

CBETA 修訂

T01n0001, p. 1b02

涼州沙門佛<anchor xml:id="beg_2" type="cb-app"/><anchor xml:id="end_2"/>為譯,秦國道士道含筆受。時,

對應到 back 元素裡的:

<choice cb:from="#beg_2" cb:to="#end_2"><corr></corr><sic></sic></choice>

大正藏原文為「沙門佛忘」, CBETA 修訂為「沙門佛念」.

type="circle"

T01n0008, p. 211a21

即時<anchor type="circle"/><anchor xml:id="nkr_note_orig_0211002" n="0211002"/><anchor xml:id="nkr_note_mod_0211002" n="0211002"/>合掌頂禮說伽陀曰:

對應到 back 元素裡的:

<note n="0211002" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0211002">(修無…未聞佛)五百六十四字+合【三】</note>

大正藏原文為 ◎ 符號

即時◎ 合掌頂禮說伽陀曰:

大正藏書末略符說明 ◎ 的意思是:「異同 (卷品ノ同異, 'Various division'), (文章ノ出入, 'Various sentence')」.

type="star"

T01n0001, p. 1a20, 大正藏紙本原文為:

邪正難*辨,顯如晝夜

*表示「同上」, 在 XML 裡標記為:

邪正難<anchor xml:id="beg_1" type="star"/><anchor xml:id="end_1"/>,顯如晝夜

對應 back 裡的:

<app from="#beg_1" to="#end_1" corresp="#0001004"><lem wit="#wit4"></lem><rdg resp="#resp14" wit="#wit10"></rdg></app>

corresp 表示這是參照註解 0001004, 也就是 back 裡的:

<note n="0001004" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001004">辨=辯【宋】*</note>

app

校勘

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

from 屬性表示校勘範圍起始點, to 屬性表示校勘範圍結束點, #beg0001004 及 #end0001004 對應到內文裡的 anchor 元素:

是以如來出世,大教有三:
約身口,則防之以禁律;
明善惡,則導之以契經;
演幽微,則<anchor xml:id="beg0001004" n="0001004"/><anchor xml:id="end0001004"/>之以法相。

beg0001004 的前三碼 beg 表示校勘範圍的開始, 接下來的 0001 表示第一頁, 004 表示是本頁第4個校勘.

參考: lem 元素、rdg 元素

byline

T01n0001

<lb n="0001a04" ed="T"/><byline cb:type="Author">長安釋僧肇述</byline>

char

缺字宣告

T01n0001

<char xml:id="CB00178">
  <charName>CBETA CHARACTER CB00178</charName>
  <charProp>
    <localName>composition</localName>
    <value>[木*奈]</value><!-- CBETA 組字式 -->
  </charProp>
  <mapping type="unicode">U+3B88</mapping>
  <mapping cb:dec="983218" type="PUA">U+F00B2</mapping>
</char>

參考 mapping 元素.

悉曇字

T18n0848

<char xml:id="SD-A6A9">
  <charName>CBETA CHARACTER SD-A6A9</charName>
  <charProp>
    <localName>Romanized form in CBETA transcription</localName>
    <value>haa</value>
  </charProp>
  <charProp>
    <!-- 對應到造字字型檔裡所用的字碼 -->
    <localName>Character in the Siddham font</localName>
    <value></value>
  </charProp>
  <charProp>
    <localName>Romanized form in Unicode transcription</localName>
    <value></value>
  </charProp>
  <mapping cb:dec="1066665" type="PUA">U+1046A9</mapping>
</char>

SD-A6A9 是 CBETA 缺字碼, 悉曇字都以 SD 開頭.

蘭札體

<char xml:id="RJ-C947">
  <charName>CBETA CHARACTER RJ-C947</charName>
  <charProp>
    <localName>Romanized form in CBETA transcription</localName>
    <value>aa.h</value>
  </charProp>
  <charProp>
    <localName>rjchar</localName>
    <value></value>
  </charProp>
  <charProp>
    <localName>Romanized form in Unicode transcription</localName>
    <value>āḥ</value>
  </charProp>
  <mapping cb:dec="1100103" type="PUA">U+10C947</mapping>
</char>

RJ-C947 是 CBETA 缺字碼, 蘭札體都以 RJ 開頭.

choice

T01n0001

<choice cb:from="#beg_2" cb:to="#end_2"><corr></corr><sic></sic></choice>

sic 元素為大正藏原文「忘」, corr 元素為 CBETA 修訂為「念」.

event

A112n1502

<lb ed="A" n="0258a03"/><cb:event><date>六年</date>
<lb ed="A" n="0258a04"/><p xml:id="pA112p0258a0401" rend="margin-left:1em">夏五月天竺沙門寶賢貢梵
<lb ed="A" n="0258a05"/>經十九夾佛骨菩提樹葉無
...
<lb ed="A" n="0259a04"/>為僧是歲
<lb ed="A" n="0259a05" type="honorific"/>詔以入內殿頭李懷信監院。</p></cb:event>

foreign

外文

T01n0026

<note target="#beg0434012"><foreign n="0434012" cb:resp="#resp14" xml:lang="pi" cb:place="foot">Nigaṇṭhasāvaka.</foreign></note>

cb:place="foot" 表示此外文出現在頁尾註腳.

g

缺字

T01n0001, p. 3c01

波羅<g ref="#CB00178"></g>

CB00178 是 CBETA 的缺字碼, 參考 char 元素.

head

章題標題 T01n0001, p. 1a02

<head><title>長阿含經</title></head>

p. 1b11

<head>(一)第一分初大本經第一</head>

jhead

卷標題

T01n0001

<cb:juan n="001" fun="open">
  <cb:mulu n="001" type="卷"></cb:mulu>
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

juan

fun="open"

卷首資訊

<cb:juan n="001" fun="open">
  <cb:mulu n="001" type="卷"></cb:mulu>
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

fun="close"

卷末資訊

<cb:juan n="001" fun="close">
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

lb

換行

type="honorific"

A112n1502

<lb ed="A" n="0258b07"/>眾僧望免輸稅
<pb ed="A" xml:id="A112.1502.0259a" n="0259a"/>
<lb ed="A" n="0259a01" type="honorific"/>詔可之賜證義沙門簡長號

lem

校勘底本用字

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

lem 的 wit 屬性, 表示這是哪一個版本的用字, #wit4 對應到 teiHeader 裡的:

<listWit>
  ...
  <witness xml:id="wit4">【大】</witness>
</listWit>

【大】表示大正藏.

listWit

宣告本部著作所使用到的對校版本

T01n0001

<listWit>
  <witness xml:id="wit1">【CBETA】</witness>
  <witness xml:id="wit10">【宋】</witness>
  <witness xml:id="wit11">【元】</witness>
  <witness xml:id="wit12">【明】</witness>
  <witness xml:id="wit13">【聖】</witness>
  <witness xml:id="wit14">【unknown】</witness>
  <witness xml:id="wit15">【磧砂】</witness>
  <witness xml:id="wit2">【補編】</witness>
  <witness xml:id="wit3">【CBETA】</witness>
  <witness xml:id="wit4">【大】</witness>
  <witness xml:id="wit5">【史】</witness>
  <witness xml:id="wit6">【原】</witness>
  <witness xml:id="wit7">【卍續】</witness>
  <witness xml:id="wit8">【麗】</witness>
  <witness xml:id="wit9">【嘉興】</witness>
</listWit>

mapping

type="unicode"

該缺字對應的 Unicode 碼

<mapping type="unicode">U+3B88</mapping>

type="PUA"

<char xml:id="CB00178">
  ...
  <mapping cb:dec="983218" type="PUA">U+F00B2</mapping>
</char>

U+F00B2 是這個缺字對應的 Unicode 造字區 (PUA, Private Use Area) 的編碼.
由 U+F0000 起算, 加上十進位 178 (來自 CB00178), 也就是十六進位 B2, 所以是 U+F00B2.
983218 是 F00B2 的十進位值.

悉曇字

T18n0848

<char xml:id="SD-A6A9">
  ...
  <mapping cb:dec="1066665" type="PUA">U+1046A9</mapping>
</char>

U+1046A9 是 U+FA000 起算, 加上十六進位 A6A9.
1066665 是 U+1046A9 的十進位值.

蘭札體

<char xml:id="RJ-C947">
  ...
  <mapping cb:dec="1100103" type="PUA">U+10C947</mapping>
</char>

U+10C947 是由 U+100000 起算, 加上 C947, 所以是 U+10C947

note

place="inline"

行中夾註

T01n0001, p. 30a15

<p xml:id="pT01p0030a1501">何等時佛生?等時成道?何等時滅度?沸星出時生,沸星出出家,沸星出成道,沸星出滅度
<note place="inline">丹本注云問中應有何等時出家諸本並闕</note></p>


type="cf."

T01n0001

<note n="0030012" place="foot" type="cf." target="#nkr_note_cf._0030012">[No. 8]</note>

type="cf1"

CBETA 修訂的參考依據

T01n0001

<app from="#beg0006001" to="#end0006001">
  <lem resp="#resp1" wit="#wit3">傳抱<note type="cf1">楊郁文《阿含辭典》編輯體例說明 (大) 1,6a4,a7</note><note type="cf2">K17n0647_p0820a22L</note></lem>
  <rdg wit="#wit4">傅抱</rdg><rdg resp="#resp14" wit="#wit10 #wit11 #wit12">懷抱</rdg>
</app>

type="cf2" 以及 type="cf3" 也是.

type="equivalent"

註解內容是對應巴利文書名 T01n0001

<note n="0011004" place="foot" type="equivalent" target="#nkr_note_equivalent_0011004">遊行經~D. 10. Mahāparinibbānasuttanta.</note>

type="mod"

CBETA 修改過的註

T01n0001

<note n="0002001" resp="#resp3" type="mod" target="#nkr_note_mod_0002001"><choice><corr>剎利</corr><sic><space quantity="0"/></sic></choice>~Khattiya.</note>

type="orig"

底本原註

T01n0001

<note n="0001001" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001001">此序依宋元明三本ニ依テ載ス</note>

p

rend="inline"

底本未分段落, CBETA 所切的段落

T01n0001, p. 1a10

<lb n="0001a10" ed="T"/><p xml:id="pT01p0001a1001">禁律,律藏也,四分十誦。法相,阿毗曇藏也,四
<lb n="0001a11" ed="T"/>分五誦。契經,四阿含藏也:《增一阿含》四分八
<lb n="0001a12" ed="T"/>誦,《中阿含》四分五誦,《雜阿含》四分十誦,此《長
<lb n="0001a13" ed="T"/>阿含》四分四誦,合三十經以為一部。</p><p xml:id="pT01p0001a1315" rend="inline">阿含,秦
<lb n="0001a14" ed="T"/>言法歸。法歸者,蓋是萬善之淵府,總持之林
<lb n="0001a15" ed="T"/>苑。...</p>

rdg

其他版本用字

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

rdg 的 resp 屬性表示校勘根據, #resp14 對應到 teiHeader 裡的:

<editionStmt>
  <edition>$Revision: 1.73 $<date>$Date: 2013/02/27 09:32:00 $</date>新式標點版</edition>
  ...
  <respStmt xml:id="resp14"><resp>corrections</resp><name>Taisho</name></respStmt>
  ...
</editionStmt>

表示本校勘根據大正藏.

rdg 的 wit 屬性表示這是哪一個版本的用字, wit10 對應到 teiHeader:

<listWit>
  ...
  <witness xml:id="wit10">【宋】</witness>
  ...
</listWit>

ref

T43n1829, p. 1a03

<note place="inline"><ref target="../T30/T30n1579.xml#xpath2(//0279a03)">論本第一第二</ref></note>

sic

被 CBETA 修訂的原底本用字

T01n0001

<choice cb:from="#beg_2" cb:to="#end_2"><corr></corr><sic></sic></choice>

tt

多語詞條對照

rend="inline"

行中多語對照

T07n0220o, p. 1110a26, 悉漢對照

<p xml:id="pT07p1110a2601"><cb:tt rend="inline">
  <cb:t xml:lang="sa-Sidd"><g ref="#SD-A557">􄕗</g></cb:t>
  <cb:t xml:lang="zh"></cb:t>
</cb:tt>
<cb:tt rend="inline">
  <cb:t xml:lang="sa-Sidd" rend="margin-left:1em"><g ref="#SD-DA4A">􇩊</g></cb:t>
  <cb:t xml:lang="zh"></cb:t>
</cb:tt>
...</p>

type="app"

T01n0001

<cb:tt type="app" from="beg0001011" to="end0001011">
  <cb:t resp="#resp14" xml:lang="zh">長阿含經</cb:t>
  <cb:t resp="#resp14" xml:lang="sa" place="foot">Dīrgha-āgama</cb:t>
  <cb:t resp="#resp14" xml:lang="pi" place="foot">Dīgha-nikāya</cb:t>
</cb:tt>

xml:lang 屬性參考 CBETA XML P5 Global Attributes

place="foot" 表示對應的文字不在內文裡, 而是在頁尾註解裡.

unclear

T01n0023

<app from="#beg0280019" to="#end0280019">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10 #wit11 #wit12"><unclear/></rdg>
</app>