「CBETA XML P5 Elements」:修訂間差異

出自DILA Wiki
imported>Ray
imported>Ray
→‎g
 
(未顯示同一使用者於中間所作的 24 次修訂)
行 178: 行 178:
sic 元素為大正藏原文「忘」, corr 元素為 CBETA 修訂為「念」.
sic 元素為大正藏原文「忘」, corr 元素為 CBETA 修訂為「念」.


=div=
  但若修訂牽涉到校勘 app 例:
<cb:div> 是 CBETA 自定標記。這是因為 <tei:div> 的定義很嚴格 跟 CBETA 所 的 div 不相容。很多地方也不好改 所以最後就用 CBETA 的名字空間 (namespace)。


==type==
T16n0657_p0134a15║即自空,無有真實。[跛>跋]陀婆羅!當知如來不以


=== type="apparatus" 校勘 ===
這類 div 會在 back 元素裡。例:T01n0001.xml
<syntaxhighlight lang="XML">
<syntaxhighlight lang="XML">
<cb:div type="apparatus">
<app>
<head>校勘記</head>
  <lem resp="CBETA.maha" wit=" 【CBETA】【麗】"> <note type="cf1">K12n0396_p1308b13</note></lem>
<p>
  <rdg wit=" 【大】"> </rdg>
<app from="#beg0001002" to="#end0001002"><lem wit="#wit4">長安</lem><rdg resp="#resp14" wit="#wit10"><space quantity="0"/></rdg></app>
</app>
<app from="#beg0001003" to="#end0001003"><lem wit="#wit4">述</lem><rdg resp="#resp14" wit="#wit10"><space quantity="0"/></rdg></app>
...
</p></cb:div>
</syntaxhighlight>
</syntaxhighlight>


=== type="bubian-notes" 大藏經補編 校勘記 ===
=div=
 
[[CBETA XML P5 Elements: div]]
這類 div 會在 back 元素裡。例:B01n0001.xml
 
<syntaxhighlight lang="XML">
<cb:div type="bubian-notes">
<head>大藏經補編 校勘記</head>
<p>
<note n="0002001" resp="#resp2" place="foot text" type="orig" target="#nkr_note_orig_0002001">大覺國師文集第十六卷、示新參學徒緇秀條。</note>
<note n="0004001" resp="#resp2" place="foot text" type="orig" target="#nkr_note_orig_0004001">忽滑谷快天著「朝鮮禪教史」一三八頁。</note>
...
</p></cb:div>
</syntaxhighlight>
 
=== type="cbeta-notes" CBETA 校勘 ===
 
這類 div 會在 back 元素裡。例:T01n0001.xml
 
<syntaxhighlight lang="XML">
<cb:div type="cbeta-notes">
<head>CBETA 校勘記</head>
<p>
<note n="0001012" resp="#resp3" type="mod" target="#nkr_note_mod_0001012">後秦弘始年=姚秦三藏法師【宋】【元】【明】</note>
<note n="0001013" resp="#resp3" type="mod" target="#nkr_note_mod_0001013">大本經=大本緣經~D. 14. Mahāpadhāna-suttanta.</note>
...
</p></cb:div>
</syntaxhighlight>
 
=== type="chu" 處 ===
 
例:T30n1579.xml, p. 395c07
 
<syntaxhighlight lang="XML">
<cb:div n="1" type="chu"><cb:mulu level="3" n="1" type="">1瑜伽處</cb:mulu>
...
</cb:div>
</syntaxhighlight>
 
* commentary
* dharani
* di
 
=== type="Dudoucheng-notes" 杜斗城註 ===
 
《正史佛教資料類編》編輯者杜斗城所加註解,這類 div 會在 back 元素裡。
 
ex: H01n0001.xml
<syntaxhighlight lang="XML">
<cb:div type="Dudoucheng-notes">
<head>正史佛教資料類编 校勘記</head>
...
</cb:div>
</syntaxhighlight>
 
=== type="equiv-notes" 相對應巴利文書名 ===
 
這類 div 會在 back 元素裡。例:T01n0001.xml
 
<syntaxhighlight lang="XML">
<cb:div type="equiv-notes">
<head>相對應巴利文書名</head>
<p>
<note n="0011004" place="foot" type="equivalent" target="#nkr_note_equivalent_0011004">遊行經~D. 10. Mahāparinibbānasuttanta.</note>
...
</p></cb:div>
</syntaxhighlight>
 
=== type="fen" 分 ===
 
例:T01n0001.xml, p. 1b11
 
<syntaxhighlight lang="XML">
<cb:div type="fen"><cb:mulu level="1" type="分">1 分</cb:mulu>
  <cb:div type="jing"><cb:mulu level="2" type="經">1 大本經</cb:mulu><head>(一)第一分初大本經第一</head>...</cb:div>
  ...
</cb:div>
</syntaxhighlight>
 
=== type="hui" 會 ===
 
例:T05n0220a.xml, p. 1a03
<syntaxhighlight lang="XML">
<cb:div type="hui"><cb:mulu level="1" n="1" type="會">1 會</cb:mulu>
  <cb:div type="xu"><cb:mulu level="2" type="序">初會序</cb:mulu><head><title>大般若經</title>初會序</head>...</cb:div>
  ...
</cb:div>
</syntaxhighlight>
 
=== type="ihp-notes" 中央研究院歷史語言研究所 校勘 ===
 
這類 div 會在 back 元素裡。例:I01n0001.xml:
 
<syntaxhighlight lang="XML">
<cb:div type="ihp-notes">
<head>中央研究院歷史語言研究所 校勘記</head>
<p>
<note n="0003001" resp="#resp7" place="foot text" type="orig" target="#nkr_note_orig_0003001"><g ref="#CB30304">󷙠</g>=詮【史】</note>
...
</p></cb:div>
</syntaxhighlight>
 
=== jie 節 ===
 
例:T30n1579.xml, p. 279a25
 
<syntaxhighlight lang="XML">
<cb:div n="1" type="jie">
  <cb:mulu level="4" n="1" type="">1節 眼識之五相</cb:mulu>
  <p xml:id="pT30p0279a2507" rend="inline">云何眼識自性。謂依眼了別...</p>
...
</cb:div>
</syntaxhighlight>
 
 
=== jing 經 ===
 
ex: T01n0001, p. 1b11
 
<syntaxhighlight lang="XML">
<cb:div type="jing">
  <cb:mulu level="2" type="經">1 大本經</cb:mulu>
  <head>(一)第一分初大本經第一</head>
  ...
</cb:div>
</syntaxhighlight>
 
=== lg 偈頌 ===
 
lg 的意思是 line group,這個名稱來自於 TEI 的 lg 元素。
 
ex: T29n1561, p. 325a11
 
<syntaxhighlight lang="XML">
<cb:div type="lg">
  <lg xml:id="lgT29p0325a1101">
   <l>稽首薄伽眾德山</l><l>稽首達磨大智海</l>
   <l>稽首僧伽和合眾</l><l>掣斯論主及吾師</l>
   <l>我將螢耀助陽光</l><l>隨力弘宣對法藏</l>
   <l>為利群生法久住</l><l>願以威神見護持</l>
  </lg>
</cb:div>
</syntaxhighlight>
 
=== mu 目 ===
 
ex: T30n1579, p. 280b21
 
<syntaxhighlight lang="XML">
<cb:div n="1" type="mu">
  <cb:mulu level="6" n="1" type="">1目 對五識明作業</cb:mulu>
  <p>彼作業者。...又能為因發起等流識身。</p>
</cb:div>
</syntaxhighlight>
 
=== nanchuan-notes 漢譯南傳大藏經 註解 ===
 
這類註解會出現在 back 元素裡。ex: N01n0001.xml:
 
<syntaxhighlight lang="XML">
<cb:div type="nanchuan-notes">
<head>漢譯南傳大藏經 註解</head>
<p>
<note n="0001001" resp="#resp1" place="foot text" type="orig" target="#nkr_note_orig_0001001">此章參照 Mahāvagga VI, 31, 5ff 及 Aṅguttara N.IV, p.172(Mahāvagga)。</note>
...
</p>
</cb:div>
</syntaxhighlight>
 
=== ncl-notes 國家圖書館善本佛典 校勘 ===
 
這類 div 會出現在 back 元素裡。ex: D03n8701.xml:
 
<syntaxhighlight lang="XML">
<cb:div type="ncl-notes">
<head>國家圖書館善本佛典 校勘記</head>
<p>
<note n="0001001" resp="#resp5" place="foot text" type="orig" target="#nkr_note_orig_0001001">國圖按:此卷子並非竺法護譯之「孟蘭盆經」原文...或在晚唐時期。</note>
</p>
</cb:div>
</syntaxhighlight>
 
=== note 註解 ===
 
ex: B06n0009, p. 464b08
 
<syntaxhighlight lang="XML">
<cb:div type="note">
  <entry>
   <form>阿毗達磨</form>
   <cb:def><p xml:id="pB06p0464b0805" rend="margin-left:1em;inline"><note place="inline">梵語也此云無比法毘頻眉切</note>。</p></cb:def>
  </entry>
  ...
</cb:div>
</syntaxhighlight>
 
=== orig 原文 ===
 
orig 的意思是 original。ex: A120n1565, p. 176b13, 原文與註釋對照:
 
<syntaxhighlight lang="XML">
<cb:div type="orig">
  <p>論云何瑜伽師地。</p>
</cb:div>
<cb:div type="commentary">
  <p>演曰將釋論文先以六門料揀...</p>
</cb:div>
</syntaxhighlight>
 
* other
* pin
* rest-notes
* she
* shi
* taisho-notes
* toc
* tt
 
=== type="W" ===
 
附文, ex: T01n0023.xml, p. 288a18
 
<syntaxhighlight lang="XML">
<cb:div type="W">
  <p xml:id="pT01p0288a1801"><anchor xml:id="nkr_note_orig_0288014" n="0288014"/><note place="inline">咸享四年章武郡公蘇慶節為父刑國公敬造一切經</note></p>
</cb:div>
</syntaxhighlight>
 
* w
* xiang
* xu
* xur
* xuzang-notes
* yongle-notes
* zangwai-notes
* zhang
* 廣釋
* 梵文
* 續補


=docNumber=
=docNumber=
行 498: 行 255:


CB00178 是 CBETA 的缺字碼, 參考 char 元素.
CB00178 是 CBETA 的缺字碼, 參考 char 元素.
g 元素的內容「㮈」,是這個缺字對應 Unicode 的碼。
如果這個缺字沒有對應的 Unicode,那麼 CBETA 會為這個缺字在 Unicode 造字區 (PUA) 定一個碼,例 T01n0001, p. 11a21
<syntaxhighlight lang="XML">
阿闍世<g ref="#CB02596">󰨤</g>首佛足
</syntaxhighlight>
在 XML 檔頭可以看到這個缺字的相關資訊,其中顯示所使用的 Unicode PUA 字碼是 U+F0A24
<syntaxhighlight lang="XML">
<char xml:id="CB02596">
<charName>CBETA CHARACTER CB02596</charName>
<charProp>
<localName>composition</localName>
<value>[(禾*尤)/上/日]</value>
</charProp>
<charProp>
<localName>normalized form</localName>
<value>稽</value>
</charProp>
<mapping type="normal_unicode">U+25873</mapping>
<mapping cb:dec="985636" type="PUA">U+F0A24</mapping>
</char>
</syntaxhighlight>
但是 CBETA 並沒有為它造字型,所以看不到是正常的。
這麼做的好處是,統計分析程式可以將缺字視同一般字碼來處理。
== PUA 字碼 ==
PUA 字碼怎麼定的?這是由缺字碼 CB02596,十進制的 2596,轉為十六進制的 0A24,由 F0000 開始編,就得到 U+F0A24。
如果是悉曇字,例如缺字碼 SD-D957,由 U+FA000 開始編,再加上 D957,於是得到 U+107957。
如果是蘭札體,例如缺字碼 RJ-C947,由 U+10000 開始編,再加上 C947,得到 U+10C947。


=head=
=head=
行 742: 行 535:
T01n0001
T01n0001
<syntaxhighlight lang="XML">
<syntaxhighlight lang="XML">
<note n="0002001" resp="#resp3" type="mod" target="#nkr_note_mod_0002001"><choice><corr>剎利</corr><sic><space quantity="0"/></sic></choice>~Khattiya.</note>
<note n="0002001" resp="#resp3" type="mod" target="#nkr_note_mod_0002001">
  <choice>
   <corr>剎利</corr>
   <sic><space quantity="0"/></sic>
  </choice>~Khattiya.
</note>
</syntaxhighlight>
</syntaxhighlight>
如果某個版本用字是 CEBAT 查的,會在版本符號後面加上「-CB」,例如 T19n0930.xml:
<syntaxhighlight lang="XML">
<note n="0067011" resp="Taisho" place="foot text" type="orig">〔而〕-【三】【乙】【丙】</note>
<note n="0067011" resp="CBETA" type="mod">〔而〕- 【宋】【元】【明】【乙】【丙】【麗-CB】【CB】</note>
</syntaxhighlight>
上面的【麗-CB】表示這是 CBETA 查證的高麗藏用字。
<p style="text-align:right">2014.9.5</p>


==type="orig"==
==type="orig"==
行 806: 行 614:
   ...
   ...
</listWit>
</listWit>
</syntaxhighlight>
== type="correctionRemark" 校譌 ==
T01n0001.xml, p. 65b28
校勘:明校譌曰喜念樂當喜樂念樂
<syntaxhighlight lang="XML">
<respStmt xml:id="resp1"><resp>corrections</resp><name>Taisho</name></respStmt>
...
<witness xml:id="wit1">【大】</witness>
<witness xml:id="wit4">【明】</witness>
...
<app from="#beg0065011" to="#end0065011">
  <lem resp="#resp1" wit="#wit1">喜、念樂</lem>
  <rdg resp="#resp1" wit="#wit4" type="correctionRemark">喜樂念樂</rdg>
</app>
</syntaxhighlight>
== type="variantRemark" 校異 ==
校勘:我=乘【宮】*,乘ィ【丙】*
<syntaxhighlight lang="XML">
<respStmt xml:id="resp1"><resp>corrections</resp><name>Taisho</name></respStmt>
...
<witness xml:id="wit1">【大】</witness>
<witness xml:id="wit5">【宮】</witness>
<witness xml:id="wit8">【丙】</witness>
...
<app from="#beg0007009" to="#end0007009">
  <lem wit="#wit1">我</lem>
  <rdg resp="#resp1" wit="#wit5">乘</rdg>
  <rdg resp="#resp1" wit="#wit8" type="variantRemark">乘</rdg>
</app>
</syntaxhighlight>
</syntaxhighlight>


行 861: 行 703:
</cb:tt>
</cb:tt>
...</p>
...</p>
</syntaxhighlight>
==雙行悉漢對照==
T18n0859, p. 178a17
原書:
[[圖片:T18p0178a17.png‎]]
XML:
<syntaxhighlight lang="XML">
<lb n="0178a17" ed="T"/>
<p xml:id="pT18p0178a1701" cb:type="dharani">
  <cb:tt><cb:t xml:lang="sa-Sidd">「<g ref="#SD-A5A9"/></cb:t><cb:t xml:lang="zh">南</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A5F0"/></cb:t><cb:t xml:lang="zh">麼</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A67A"/></cb:t><cb:t xml:lang="zh">三</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A5E5"/></cb:t><cb:t xml:lang="zh">曼</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-CA56"/></cb:t><cb:t xml:lang="zh">多</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-E3AD"/></cb:t><cb:t xml:lang="zh">勃</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-D9FA"/></cb:t><cb:t xml:lang="zh">馱</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-E040"/></cb:t><cb:t xml:lang="zh">喃</cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A6A8"/></cb:t><cb:t xml:lang="zh">訶」</cb:t></cb:tt>
</p>
<lb n="0178a18" ed="T"/>
</syntaxhighlight>
</syntaxhighlight>



於 2015年8月18日 (二) 08:59 的最新修訂

anchor

nkr_note_orig

T01n0001, p. 1a02

<anchor xml:id="nkr_note_orig_0001001" n="0001001"/><head><title>長阿含經</title></head>

nkr_note_orig_0001001 對應到 back 元素裡的 note:

<note n="0001001" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001001">此序依宋元明三本ニ依テ載ス</note>

resp14 對應到 teiHeader 裡的宣告:

<respStmt xml:id="resp14"><resp>corrections</resp><name>Taisho</name></respStmt>

也就是說這是大正藏的註.

type="cb-app"

CBETA 修訂

T01n0001, p. 1b02

涼州沙門佛<anchor xml:id="beg_2" type="cb-app"/><anchor xml:id="end_2"/>為譯,秦國道士道含筆受。時,

對應到 back 元素裡的:

<choice cb:from="#beg_2" cb:to="#end_2"><corr></corr><sic></sic></choice>

大正藏原文為「沙門佛忘」, CBETA 修訂為「沙門佛念」.

type="circle"

T01n0008, p. 211a21

即時<anchor type="circle"/><anchor xml:id="nkr_note_orig_0211002" n="0211002"/><anchor xml:id="nkr_note_mod_0211002" n="0211002"/>合掌頂禮說伽陀曰:

對應到 back 元素裡的:

<note n="0211002" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0211002">(修無…未聞佛)五百六十四字+合【三】</note>

大正藏原文為 ◎ 符號

即時◎ 合掌頂禮說伽陀曰:

大正藏書末略符說明 ◎ 的意思是:「異同 (卷品ノ同異, 'Various division'), (文章ノ出入, 'Various sentence')」.

type="star"

T01n0001, p. 1a20, 大正藏紙本原文為:

邪正難*辨,顯如晝夜

*表示「同上」, 在 XML 裡標記為:

邪正難<anchor xml:id="beg_1" type="star"/><anchor xml:id="end_1"/>,顯如晝夜

對應 back 裡的:

<app from="#beg_1" to="#end_1" corresp="#0001004"><lem wit="#wit4"></lem><rdg resp="#resp14" wit="#wit10"></rdg></app>

corresp 表示這是參照註解 0001004, 也就是 back 裡的:

<note n="0001004" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001004">辨=辯【宋】*</note>

app

校勘

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

from 屬性表示校勘範圍起始點, to 屬性表示校勘範圍結束點, #beg0001004 及 #end0001004 對應到內文裡的 anchor 元素:

是以如來出世,大教有三:
約身口,則防之以禁律;
明善惡,則導之以契經;
演幽微,則<anchor xml:id="beg0001004" n="0001004"/><anchor xml:id="end0001004"/>之以法相。

beg0001004 的前三碼 beg 表示校勘範圍的開始, 接下來的 0001 表示第一頁, 004 表示是本頁第4個校勘.

參考: lem 元素、rdg 元素

byline

T01n0001

<lb n="0001a04" ed="T"/><byline cb:type="Author">長安釋僧肇述</byline>

cell

表格一列中的一格

參考 table 元素.

char

缺字宣告

T01n0001

<char xml:id="CB00178">
  <charName>CBETA CHARACTER CB00178</charName>
  <charProp>
    <localName>composition</localName>
    <value>[木*奈]</value><!-- CBETA 組字式 -->
  </charProp>
  <mapping type="unicode">U+3B88</mapping>
  <mapping cb:dec="983218" type="PUA">U+F00B2</mapping>
</char>

參考 mapping 元素.

悉曇字

T18n0848

<char xml:id="SD-A6A9">
  <charName>CBETA CHARACTER SD-A6A9</charName>
  <charProp>
    <localName>Romanized form in CBETA transcription</localName>
    <value>haa</value>
  </charProp>
  <charProp>
    <!-- 對應到造字字型檔裡所用的字碼 -->
    <localName>Character in the Siddham font</localName>
    <value></value>
  </charProp>
  <charProp>
    <localName>Romanized form in Unicode transcription</localName>
    <value></value>
  </charProp>
  <mapping cb:dec="1066665" type="PUA">U+1046A9</mapping>
</char>

SD-A6A9 是 CBETA 缺字碼, 悉曇字都以 SD 開頭.

蘭札體

<char xml:id="RJ-C947">
  <charName>CBETA CHARACTER RJ-C947</charName>
  <charProp>
    <localName>Romanized form in CBETA transcription</localName>
    <value>aa.h</value>
  </charProp>
  <charProp>
    <localName>rjchar</localName>
    <value></value>
  </charProp>
  <charProp>
    <localName>Romanized form in Unicode transcription</localName>
    <value>āḥ</value>
  </charProp>
  <mapping cb:dec="1100103" type="PUA">U+10C947</mapping>
</char>

RJ-C947 是 CBETA 缺字碼, 蘭札體都以 RJ 開頭.

choice

T01n0001

<choice cb:from="#beg_2" cb:to="#end_2"><corr></corr><sic></sic></choice>

sic 元素為大正藏原文「忘」, corr 元素為 CBETA 修訂為「念」.

但若修訂牽涉到校勘,則用 app,例:

T16n0657_p0134a15║即自空,無有真實。[跛>跋]陀婆羅!當知如來不以

<app>
  <lem resp="CBETA.maha" wit="【CBETA】【麗】"><note type="cf1">K12n0396_p1308b13</note></lem>
  <rdg wit="【大】"></rdg>
</app>

div

CBETA XML P5 Elements: div

docNumber

T01n0001

<cb:docNumber>No. 1</cb:docNumber>

entry

詞典裡的一個詞條項目

<entry>
  <form>天道</form>
  <cb:def><p xml:id="pA091p0312b0703" rend="margin-left:1em;inline"><note place="inline">日月星辰陰陽變化謂之天道易曰乾道變易是也</note></p></cb:def>
</entry>

event

A112n1502

<lb ed="A" n="0258a03"/><cb:event><date>六年</date>
<lb ed="A" n="0258a04"/><p xml:id="pA112p0258a0401" rend="margin-left:1em">夏五月天竺沙門寶賢貢梵
<lb ed="A" n="0258a05"/>經十九夾佛骨菩提樹葉無
...
<lb ed="A" n="0259a04"/>為僧是歲
<lb ed="A" n="0259a05" type="honorific"/>詔以入內殿頭李懷信監院。</p></cb:event>

figure

插圖

T16n0719

<figure><graphic url="../figures/T/T16p0845_01.gif"></graphic></figure>

foreign

外文

T01n0026

<note target="#beg0434012"><foreign n="0434012" cb:resp="#resp14" xml:lang="pi" cb:place="foot">Nigaṇṭhasāvaka.</foreign></note>

cb:place="foot" 表示此外文出現在頁尾註腳.

formula

H01n0001

<lb ed="H" n="0017a04"/><p xml:id="pH01p0017a0401" rend="margin-left:0em;text-indent:2em">十一年,請告西還,留之不可,乃以其弟亦憐真嗣焉。十六年,八思巴
<lb ed="H" n="0017a05"/>卒,<formula rend="vertical-align:super">(1)</formula>訃聞,賻贈有加,賜號皇天之下一人之上〔開教〕宣文輔治大聖至德
<lb ed="H" n="0017a06"/>普覺真智佑國如意大寶法王<formula rend="vertical-align:super">(2)</formula>、西天佛子、大元帝師。至治間,特詔郡縣
<lb ed="H" n="0017a07"/>建廟通祀。泰定元年,又以繪像十一,頒各行省,為之塑像云。</p>

g

缺字

T01n0001, p. 3c01

波羅<g ref="#CB00178"></g>

CB00178 是 CBETA 的缺字碼, 參考 char 元素.

g 元素的內容「㮈」,是這個缺字對應 Unicode 的碼。

如果這個缺字沒有對應的 Unicode,那麼 CBETA 會為這個缺字在 Unicode 造字區 (PUA) 定一個碼,例 T01n0001, p. 11a21

阿闍世<g ref="#CB02596">󰨤</g>首佛足

在 XML 檔頭可以看到這個缺字的相關資訊,其中顯示所使用的 Unicode PUA 字碼是 U+F0A24

<char xml:id="CB02596">
	<charName>CBETA CHARACTER CB02596</charName>
	<charProp>
		<localName>composition</localName>
		<value>[(禾*尤)/上/日]</value>
	</charProp>
	<charProp>
		<localName>normalized form</localName>
		<value></value>
	</charProp>
	<mapping type="normal_unicode">U+25873</mapping>
	<mapping cb:dec="985636" type="PUA">U+F0A24</mapping>
</char>

但是 CBETA 並沒有為它造字型,所以看不到是正常的。

這麼做的好處是,統計分析程式可以將缺字視同一般字碼來處理。

PUA 字碼

PUA 字碼怎麼定的?這是由缺字碼 CB02596,十進制的 2596,轉為十六進制的 0A24,由 F0000 開始編,就得到 U+F0A24。

如果是悉曇字,例如缺字碼 SD-D957,由 U+FA000 開始編,再加上 D957,於是得到 U+107957。

如果是蘭札體,例如缺字碼 RJ-C947,由 U+10000 開始編,再加上 C947,得到 U+10C947。

head

章題標題 T01n0001, p. 1a02

<head><title>長阿含經</title></head>

p. 1b11

<head>(一)第一分初大本經第一</head>

偈頌標題

T10n0297, p. 881b17

<lg xml:id="lgT10p0881b1701">
  <head>八大菩薩讚<note place="inline">出《八大菩薩曼茶羅經》末</note></head>
  <l>圓寂宮城門,</l><l>能摧戶扇者,</l>
  ...
  <l>以此諸有情,</l><l>如彼成讚器。</l>
</lg>

item

清單裡的一個項目

T08n0225, p. 482b05

<list>
  <item xml:id="itemT08p0482b0501">天帝釋問品</item>
  <item xml:id="itemT08p0482b0506">持品</item>
  <item xml:id="itemT08p0482b0508">功德品</item>
  <item xml:id="itemT08p0482b0601">變謀明慧品</item>
</list>

jhead

卷標題

T01n0001

<cb:juan n="001" fun="open">
  <cb:mulu n="001" type="卷"></cb:mulu>
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

juan

fun="open"

卷首資訊

<cb:juan n="001" fun="open">
  <cb:mulu n="001" type="卷"></cb:mulu>
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

fun="close"

卷末資訊

<cb:juan n="001" fun="close">
  <cb:jhead><title>佛說長阿含經</title>卷第一</cb:jhead>
</cb:juan>

lb

換行

type="honorific"

A112n1502

<lb ed="A" n="0258b07"/>眾僧望免輸稅
<pb ed="A" xml:id="A112.1502.0259a" n="0259a"/>
<lb ed="A" n="0259a01" type="honorific"/>詔可之賜證義沙門簡長號

兩個行號版本並存

X01n0001

<lb ed="X" n="0001a06"/><lb ed="R150" n="0705a03"/><cb:div><p xml:id="pX01p0001a0601" rend="margin-left:1em">余嚮偶獲古宋本大方廣圓覺修多羅了義經下

ed="R150" 表示 卍續藏經-新文豐版 第150冊.

lem

校勘底本用字

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

lem 的 wit 屬性, 表示這是哪一個版本的用字, #wit4 對應到 teiHeader 裡的:

<listWit>
  ...
  <witness xml:id="wit4">【大】</witness>
</listWit>

【大】表示大正藏.

lg

偈頌

T01n0001

<lb n="0001c03" ed="T"/><lg xml:id="lgT01p0001c0301" rend="margin-left:1em;text-indent:-1em"><l>「比丘集法堂,</l><l>講說賢聖論;</l>
<lb n="0001c04" ed="T"/><l>如來處靜室,</l><l>天耳盡聞知。</l>
...
<lb n="0001c12" ed="T"/><l>無上天人尊,</l><l>記於過去佛。」</l></lg>

list

T08n0225, p. 482b05

<list>
  <item xml:id="itemT08p0482b0501">天帝釋問品</item>
  <item xml:id="itemT08p0482b0506">持品</item>
  <item xml:id="itemT08p0482b0508">功德品</item>
  <item xml:id="itemT08p0482b0601">變謀明慧品</item>
</list>

listWit

宣告本部著作所使用到的對校版本

T01n0001

<listWit>
  <witness xml:id="wit1">【CBETA】</witness>
  <witness xml:id="wit10">【宋】</witness>
  <witness xml:id="wit11">【元】</witness>
  <witness xml:id="wit12">【明】</witness>
  <witness xml:id="wit13">【聖】</witness>
  <witness xml:id="wit14">【unknown】</witness>
  <witness xml:id="wit15">【磧砂】</witness>
  <witness xml:id="wit2">【補編】</witness>
  <witness xml:id="wit3">【CBETA】</witness>
  <witness xml:id="wit4">【大】</witness>
  <witness xml:id="wit5">【史】</witness>
  <witness xml:id="wit6">【原】</witness>
  <witness xml:id="wit7">【卍續】</witness>
  <witness xml:id="wit8">【麗】</witness>
  <witness xml:id="wit9">【嘉興】</witness>
</listWit>

mapping

type="unicode"

該缺字對應的 Unicode 碼

<mapping type="unicode">U+3B88</mapping>

type="PUA"

<char xml:id="CB00178">
  ...
  <mapping cb:dec="983218" type="PUA">U+F00B2</mapping>
</char>

U+F00B2 是這個缺字對應的 Unicode 造字區 (PUA, Private Use Area) 的編碼.
由 U+F0000 起算, 加上十進位 178 (來自 CB00178), 也就是十六進位 B2, 所以是 U+F00B2.
983218 是 F00B2 的十進位值.

悉曇字

T18n0848

<char xml:id="SD-A6A9">
  ...
  <mapping cb:dec="1066665" type="PUA">U+1046A9</mapping>
</char>

U+1046A9 是 U+FA000 起算, 加上十六進位 A6A9.
1066665 是 U+1046A9 的十進位值.

蘭札體

<char xml:id="RJ-C947">
  ...
  <mapping cb:dec="1100103" type="PUA">U+10C947</mapping>
</char>

U+10C947 是由 U+100000 起算, 加上 C947, 所以是 U+10C947

mulu

CBETA 自訂目錄

T01n0001, p. 1a02

<cb:mulu level="1" type="序"></cb:mulu><head><title>長阿含經</title></head>

note

place="inline"

行中夾註

T01n0001, p. 30a15

<p xml:id="pT01p0030a1501">何等時佛生?等時成道?何等時滅度?沸星出時生,沸星出出家,沸星出成道,沸星出滅度
<note place="inline">丹本注云問中應有何等時出家諸本並闕</note></p>


type="cf."

T01n0001

<note n="0030012" place="foot" type="cf." target="#nkr_note_cf._0030012">[No. 8]</note>

type="cf1"

CBETA 修訂的參考依據

T01n0001

<app from="#beg0006001" to="#end0006001">
  <lem resp="#resp1" wit="#wit3">傳抱<note type="cf1">楊郁文《阿含辭典》編輯體例說明 (大) 1,6a4,a7</note><note type="cf2">K17n0647_p0820a22L</note></lem>
  <rdg wit="#wit4">傅抱</rdg><rdg resp="#resp14" wit="#wit10 #wit11 #wit12">懷抱</rdg>
</app>

type="cf2" 以及 type="cf3" 也是.

type="equivalent"

註解內容是對應巴利文書名 T01n0001

<note n="0011004" place="foot" type="equivalent" target="#nkr_note_equivalent_0011004">遊行經~D. 10. Mahāparinibbānasuttanta.</note>

type="mod"

CBETA 修改過的註

T01n0001

<note n="0002001" resp="#resp3" type="mod" target="#nkr_note_mod_0002001">
  <choice>
    <corr>剎利</corr>
    <sic><space quantity="0"/></sic>
  </choice>~Khattiya.
</note>

如果某個版本用字是 CEBAT 查的,會在版本符號後面加上「-CB」,例如 T19n0930.xml:

<note n="0067011" resp="Taisho" place="foot text" type="orig">〔而〕-【三】【乙】【丙】</note> 
<note n="0067011" resp="CBETA" type="mod">〔而〕- 【宋】【元】【明】【乙】【丙】【麗-CB】【CB】</note>

上面的【麗-CB】表示這是 CBETA 查證的高麗藏用字。

2014.9.5

type="orig"

底本原註

T01n0001

<note n="0001001" resp="#resp14" type="orig" place="foot text" target="#nkr_note_orig_0001001">此序依宋元明三本ニ依テ載ス</note>

p

rend="inline"

底本未分段落, CBETA 所切的段落

T01n0001, p. 1a10

<lb n="0001a10" ed="T"/><p xml:id="pT01p0001a1001">禁律,律藏也,四分十誦。法相,阿毗曇藏也,四
<lb n="0001a11" ed="T"/>分五誦。契經,四阿含藏也:《增一阿含》四分八
<lb n="0001a12" ed="T"/>誦,《中阿含》四分五誦,《雜阿含》四分十誦,此《長
<lb n="0001a13" ed="T"/>阿含》四分四誦,合三十經以為一部。</p><p xml:id="pT01p0001a1315" rend="inline">阿含,秦
<lb n="0001a14" ed="T"/>言法歸。法歸者,蓋是萬善之淵府,總持之林
<lb n="0001a15" ed="T"/>苑。...</p>

pb

分頁

T01n0001

<pb n="0001a" ed="T" xml:id="T01.0001.0001a"/>


rdg

其他版本用字

T01n0001

<app from="#beg0001004" to="#end0001004">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10"></rdg>
</app>

rdg 的 resp 屬性表示校勘根據, #resp14 對應到 teiHeader 裡的:

<editionStmt>
  <edition>$Revision: 1.73 $<date>$Date: 2013/02/27 09:32:00 $</date>新式標點版</edition>
  ...
  <respStmt xml:id="resp14"><resp>corrections</resp><name>Taisho</name></respStmt>
  ...
</editionStmt>

表示本校勘根據大正藏.

rdg 的 wit 屬性表示這是哪一個版本的用字, wit10 對應到 teiHeader:

<listWit>
  ...
  <witness xml:id="wit10">【宋】</witness>
  ...
</listWit>

type="correctionRemark" 校譌

T01n0001.xml, p. 65b28

校勘:明校譌曰喜念樂當喜樂念樂

<respStmt xml:id="resp1"><resp>corrections</resp><name>Taisho</name></respStmt>
...
<witness xml:id="wit1">【大】</witness>
<witness xml:id="wit4">【明】</witness>
...
<app from="#beg0065011" to="#end0065011">
  <lem resp="#resp1" wit="#wit1">喜、念樂</lem>
  <rdg resp="#resp1" wit="#wit4" type="correctionRemark">喜樂念樂</rdg>
</app>

type="variantRemark" 校異

校勘:我=乘【宮】*,乘ィ【丙】*

<respStmt xml:id="resp1"><resp>corrections</resp><name>Taisho</name></respStmt>
...
<witness xml:id="wit1">【大】</witness>
<witness xml:id="wit5">【宮】</witness>
<witness xml:id="wit8">【丙】</witness>
...
<app from="#beg0007009" to="#end0007009">
  <lem wit="#wit1"></lem>
  <rdg resp="#resp1" wit="#wit5"></rdg>
  <rdg resp="#resp1" wit="#wit8" type="variantRemark"></rdg>
</app>

ref

T43n1829, p. 1a03

<note place="inline"><ref target="../T30/T30n1579.xml#xpath2(//0279a03)">論本第一第二</ref></note>

N01n0001, p. 1a01

<head><ref target="#PTS.Vin.3.1"></ref>律藏  經分別(Sutta-Vibhaṅga)</head>

row

表格裡的一列

參考 table 元素

sic

被 CBETA 修訂的原底本用字

T01n0001

<choice cb:from="#beg_2" cb:to="#end_2"><corr></corr><sic></sic></choice>

table

表格

T49n2035

<table cols="2">
<lb n="0158c17" ed="T"/><row><cell>大品<note place="inline">晉羅什譯</note></cell><cell rows="2">第一會鷲峯山說四百卷<note place="inline">七十七品單譯</note></cell></row>
<lb n="0158c18" ed="T"/><row><cell>放光<note place="inline">晉羅叉譯</note></cell></row>
...
<lb n="0159a07" ed="T"/><row><cell></cell><cell>十六會竹林園說慧八卷<note place="inline">單譯</note></cell></row></table>

tt

多語詞條對照

rend="inline"

行中多語對照

T07n0220o, p. 1110a26, 悉漢對照

<p xml:id="pT07p1110a2601"><cb:tt rend="inline">
  <cb:t xml:lang="sa-Sidd"><g ref="#SD-A557">􄕗</g></cb:t>
  <cb:t xml:lang="zh"></cb:t>
</cb:tt>
<cb:tt rend="inline">
  <cb:t xml:lang="sa-Sidd" rend="margin-left:1em"><g ref="#SD-DA4A">􇩊</g></cb:t>
  <cb:t xml:lang="zh"></cb:t>
</cb:tt>
...</p>

雙行悉漢對照

T18n0859, p. 178a17

原書:

T18p0178a17.png

XML:

<lb n="0178a17" ed="T"/>
<p xml:id="pT18p0178a1701" cb:type="dharani">
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A5A9"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A5F0"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A67A"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A5E5"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-CA56"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-E3AD"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-D9FA"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-E040"/></cb:t><cb:t xml:lang="zh"></cb:t></cb:tt>
  <cb:tt><cb:t xml:lang="sa-Sidd"><g ref="#SD-A6A8"/></cb:t><cb:t xml:lang="zh">訶」</cb:t></cb:tt>
</p>
<lb n="0178a18" ed="T"/>

type="app"

T01n0001

<cb:tt type="app" from="beg0001011" to="end0001011">
  <cb:t resp="#resp14" xml:lang="zh">長阿含經</cb:t>
  <cb:t resp="#resp14" xml:lang="sa" place="foot">Dīrgha-āgama</cb:t>
  <cb:t resp="#resp14" xml:lang="pi" place="foot">Dīgha-nikāya</cb:t>
</cb:tt>

xml:lang 屬性參考 CBETA XML P5 Global Attributes

place="foot" 表示對應的文字不在內文裡, 而是在頁尾註解裡.

unclear

T01n0023

<app from="#beg0280019" to="#end0280019">
  <lem wit="#wit4"></lem>
  <rdg resp="#resp14" wit="#wit10 #wit11 #wit12"><unclear/></rdg>
</app>