CBETA XML P5 Elements

出自DILA Wiki
於 2013年8月29日 (四) 10:04 由 imported>Ray 所做的修訂 →‎anchor

anchor

nkr_note_orig

T01n0001, p. 1a02

<anchor xml:id="nkr_note_orig_0001001" n="0001001"/><head><title>長阿含經</title></head>

nkr_note_orig_0001001 對應到 back 元素裡的 note:

<note n="0001001" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001001">此序依宋元明三本ニ依テ載ス</note>

resp14 對應到 teiHeader 裡的宣告:

<respStmt xml:id="resp14"><resp>corrections</resp><name>Taisho</name></respStmt>

也就是說這是大正藏的註.

type="star"

T01n0001, p. 1a20, 大正藏紙本原文為:

邪正難*辨,顯如晝夜

*表示「同上」, 在 XML 裡標記為:

邪正難<anchor xml:id="beg_1" type="star"/><anchor xml:id="end_1"/>,顯如晝夜

對應 back 裡的:

<app from="#beg_1" to="#end_1" corresp="#0001004"><lem wit="#wit4"></lem><rdg resp="#resp14" wit="#wit10"></rdg></app>

corresp 表示這是參照註解 0001004, 也就是 back 裡的:

<note n="0001004" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001004">辨=辯【宋】*</note>

app

校勘

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

from 屬性表示校勘範圍起始點, to 屬性表示校勘範圍結束點, #beg0001004 及 #end0001004 對應到內文裡的 anchor 元素:

是以如來出世,大教有三:
約身口,則防之以禁律;
明善惡,則導之以契經;
演幽微,則<anchor xml:id="beg0001004" n="0001004"/><anchor xml:id="end0001004"/>之以法相。

beg0001004 的前三碼 beg 表示校勘範圍的開始, 接下來的 0001 表示第一頁, 004 表示是本頁第4個校勘.

參考: lem 元素、rdg 元素

char

缺字宣告

T01n0001

<char xml:id="CB00178">
  <charName>CBETA CHARACTER CB00178</charName>
  <charProp>
    <localName>composition</localName>
    <value>[木*奈]</value><!-- CBETA 組字式 -->
  </charProp>
  <mapping type="unicode">U+3B88</mapping>
  <mapping cb:dec="983218" type="PUA">U+F00B2</mapping>
</char>

參考 mapping 元素.

悉曇字

T18n0848

<char xml:id="SD-A6A9">
  <charName>CBETA CHARACTER SD-A6A9</charName>
  <charProp>
    <localName>Romanized form in CBETA transcription</localName>
    <value>haa</value>
  </charProp>
  <charProp>
    <!-- 對應到造字字型檔裡所用的字碼 -->
    <localName>Character in the Siddham font</localName>
    <value></value>
  </charProp>
  <charProp>
    <localName>Romanized form in Unicode transcription</localName>
    <value></value>
  </charProp>
  <mapping cb:dec="1066665" type="PUA">U+1046A9</mapping>
</char>

SD-A6A9 是 CBETA 缺字碼, 悉曇字都以 SD 開頭.

蘭札體

<char xml:id="RJ-C947">
  <charName>CBETA CHARACTER RJ-C947</charName>
  <charProp>
    <localName>Romanized form in CBETA transcription</localName>
    <value>aa.h</value>
  </charProp>
  <charProp>
    <localName>rjchar</localName>
    <value></value>
  </charProp>
  <charProp>
    <localName>Romanized form in Unicode transcription</localName>
    <value>āḥ</value>
  </charProp>
  <mapping cb:dec="1100103" type="PUA">U+10C947</mapping>
</char>

RJ-C947 是 CBETA 缺字碼, 蘭札體都以 RJ 開頭.

g

缺字

T01n0001, p. 3c01

波羅<g ref="#CB00178"></g>

CB00178 是 CBETA 的缺字碼, 參考 char 元素.

jhead

卷標題

T01n0001

<cb:juan n="001" fun="open">
  <cb:mulu n="001" type="卷"></cb:mulu>
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

juan

fun="open"

卷首資訊

<cb:juan n="001" fun="open">
  <cb:mulu n="001" type="卷"></cb:mulu>
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

fun="close"

卷末資訊

<cb:juan n="001" fun="close">
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

lem

校勘底本用字

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

lem 的 wit 屬性, 表示這是哪一個版本的用字, #wit4 對應到 teiHeader 裡的:

<listWit>
  ...
  <witness xml:id="wit4">【大】</witness>
</listWit>

【大】表示大正藏.

mapping

type="unicode"

該缺字對應的 Unicode 碼

<mapping type="unicode">U+3B88</mapping>

type="PUA"

<char xml:id="CB00178">
  ...
  <mapping cb:dec="983218" type="PUA">U+F00B2</mapping>
</char>

U+F00B2 是這個缺字對應的 Unicode 造字區 (PUA, Private Use Area) 的編碼.
由 U+F0000 起算, 加上十進位 178 (來自 CB00178), 也就是十六進位 B2, 所以是 U+F00B2.
983218 是 F00B2 的十進位值.

悉曇字

T18n0848

<char xml:id="SD-A6A9">
  ...
  <mapping cb:dec="1066665" type="PUA">U+1046A9</mapping>
</char>

U+1046A9 是 U+FA000 起算, 加上十六進位 A6A9.
1066665 是 U+1046A9 的十進位值.

蘭札體

<char xml:id="RJ-C947">
  ...
  <mapping cb:dec="1100103" type="PUA">U+10C947</mapping>
</char>

U+10C947 是由 U+100000 起算, 加上 C947, 所以是 U+10C947

note

place="inline"

行中夾註

T01n0001, p. 30a15

<p xml:id="pT01p0030a1501">何等時佛生?等時成道?何等時滅度?沸星出時生,沸星出出家,沸星出成道,沸星出滅度
<note place="inline">丹本注云問中應有何等時出家諸本並闕</note></p>

rdg

其他版本用字

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

rdg 的 resp 屬性表示校勘根據, #resp14 對應到 teiHeader 裡的:

<editionStmt>
  <edition>$Revision: 1.73 $<date>$Date: 2013/02/27 09:32:00 $</date>新式標點版</edition>
  ...
  <respStmt xml:id="resp14"><resp>corrections</resp><name>Taisho</name></respStmt>
  ...
</editionStmt>

表示本校勘根據大正藏.

rdg 的 wit 屬性表示這是哪一個版本的用字, wit10 對應到 teiHeader:

<listWit>
  ...
  <witness xml:id="wit10">【宋】</witness>
  ...
</listWit>

ref

T43n1829, p. 1a03

<note place="inline"><ref target="../T30/T30n1579.xml#xpath2(//0279a03)">論本第一第二</ref></note>