於 2014年3月11日 (二) 09:28 由 imported>Putitz 所做的修訂
敦煌漢文佛教寫卷點校本工作手冊
Critical Editions of Chinese Buddhist Dunhuang Manuscripts(Markup manual)
Date: 2014-2-14 Author: Zhang Boyong 張伯雍
本計畫為中華佛研所、馬德偉博士(Dr. Marcus Bingenheimer, Temple University)、太史文博士(Dr. Stephen F. Teiser, Princeton University)與大英圖書館國際敦煌專案(International Dunhuang Project, IDP)的合作專案。專案說明詳見計畫書。
寫卷數位化
數位化的寫卷標題範例:lengqieszj-S-4272.xml。S-4272 為敦煌文獻號碼。
所使用的標記規範為 TEI P5
寫卷結構與標記
- 以敦煌寫卷「件」為單位,即每一個檔案即為一件敦煌寫卷(如 S.4272)
行號標記例
|
<lb xml:id="S-4272-0001"/>
|
空格標記例
|
<space unit="char" extent="1"/>
|
S-4272-0008
|
異寫字標記例
|
<reg>偽</reg>
|
S-4272-0005
|
<choice><orig><g ref="#A04441-003"/></orig><reg>障</reg></choice>
|
S-4272-0013
|
難辨字標記例
|
<gap unit="char" extent="1"/>
|
P-3703-0011
|
取代標記例
|
<subst><del>无</del><add>有</add></subst>
|
S-4272-0005
|
<subst><del><gap reason="illegible" unit="chars" extent="1"/></del><add>心</add></subst>
|
S-4272-0021
|
<subst><del><choice><orig><g ref="#A03580-001"/></orig><reg>薩</reg></choice></del><add place="inline-right">提</add></subst>
|
P-3436-0037
|
插入標記例
|
<add place="inline-right">性</add>
|
S-4272-0009
|
倒乙標記例
|
出<add place="inline-right">㆑</add>不
|
(不出)
P-3436-0037
|
<choice><orig><g ref="#A04688-002"/></orig><reg>魏</reg></choice>朝<add place="inline-right"><note resp="hand2">向上</note></add>苐二
|
(苐二魏朝)
P-3436-0110
|
補充修改標記例
|
<add place="margin-bottom">軰</add>
|
P-3436-0056
|
破損標記例
|
<damage>使鬼神</damage>
|
P-3436-0057
|
<damage unit="chars" extent="1"/>
|
P-3436-0011
|
字跡不清標記例
|
<unclear>斷</unclear>
|
P-3436-0070
|
文字轉錄原則
Unicode 未收錄,但異體字字典有收錄者,則以正體字加註異體字字碼。如:<choice><orig><g ref="#B03309-004"/></orig><reg>粲</reg></choice>
1.萬國碼未收之字形。The variant character is not in Unicode.
2.教育部異體字字典有收錄者。It is attested in the "Dictionary of Chinese Character Variants" 教育部異體字字典 (Ministry of Education, RoC, 2012). Current Query Interface: http://dict2.variants.moe.edu.tw/variants/.
3.教育部異體字字典對該字的編號會記錄在<g>@ref標記中。 <g>@ref points to a header item which references the character number of the variant in the MoE Dictionary.
4.能夠以所對應的正字表達出來。 It can be represented by a semantically equivalent common character (通用字).
Non-Unicode Variants - attested 萬國碼未收之異體字──已確認
|
Ex.1: S-4272-0002:
為除忘相<choice><orig><g ref="#A03335-005"/></orig><reg>修</reg></choice>行六度
|
字型工具
- 最好安裝 Unicode Super-CJK Fonts v6.0
|