《中國佛寺史志》標記作業
回《中國佛寺史志》數位典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual)
《中國佛寺志》標記作業
工作準備
1. 進行新一本寺志標記前,應先找好該志的相關參考資料,例如:白話本、標逗本等。
2. 凡可用程式一併處理的工作,就不一一手動作業。
3. 作業檔案:git檔案四種 xml 的資料夾名稱
xml-gen(經過缺字處理,再由程式自動產生的)
xml-basic(經過缺字處理,且經過粗標的)
xml(經過缺字處理,且經過細標的)
xml-processing(正在切檔、粗標的)
標記總說
1. 本專案將以TEI-XML格式進行作業,對於文本中的人名、地名、時間皆加以標記及建置資料庫,旨在提供高質量的數位化全文。
2. 數位化的文本也將加入新式標點符號。
3. 文本中的難檢字將採用Unicode字符,若於Unicode字庫中尚未收錄的字,則將改以同義異體字代替,或者建立缺字檔。
4. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。
.「意義標記」著重在付予文字意義,例如:<persName>人名。
.「樣式標記」著重在呈現的樣貌,例如:<lb/>(折行)。
.TEI-XML標記著重於「意義標記」,而文本呈現的樣貌則多操縱於XSLT。
檔案架構
《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。
(例:重修普陀山志代碼g008)
每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
及數個小檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。
主檔內寫有版本資訊及小檔的鍊結,小檔內則是各卷的內容。
●切檔命名方式
志碼_front:版本說明、序文、目錄等(屬「卷前」,無「卷首」字樣)
志碼_00:卷首(底本有「卷首」字樣)
志碼_卷數+1:卷末(底本有「卷末」字樣)
志碼_01:卷一(依此類推)
志碼_back:附錄、增補等
段落形式
標題
1標題的標法
● <head>標題</head>
● <head>標題</head><byline><persName>作者</persName></byline>
● <head resp="ddbc.da">自加標題</head>
● <head resp="ddbc.da" rend="display:none">隱藏自加的標題</head>(例:志名頁)
ps.rend="display:none 不會留下空白
rend="visibility:hidden 會留下空白
● <head>標題<seg rend="font-size:small">副標題</seg></head>
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg>
● 標題小字要折行:<seg rend="font-size:small;display:block">縮小的字</seg>
2說明
(1)若篇章缺乏標題者,可「自訂標題」。
.自加的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。
.文本標記的格式:<head resp="ddbc.da">自加的標題</head>
.網頁樹狀目錄所呈現的樣式:(自加的標題)
(2)標題後的副標題,可以<seg>(隨機分割)標記之。
.例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
.<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。
(3)若底本格式為「作者在標題之前」,則<byline>要加標rend屬性,指定其格式為向左靠齊,字體放大,且與上首詩的行距放大。此時byline標法:<byline rend="text-align:left;font-size:20px;margin-top:2em">
例:<byline rend="text-align:left;font-size:20px;margin-top:2em">契嵩</byline>
<head>題徑山寺</head>
3標點符號
(1)標題亦可加新式標點符號,惟結尾不用句點。
段落樣式
◎全段縮小字
<p rend="font-size:small">全段縮小字</p>
範例:g009p0427
◎全段縮排一個字
<p rend="margin-top:1ex;line-height:24px;text-indent:0">縮排的段落</p>
範例:g009p0593
◎全段縮排一個字,但第一行凸排一個字
<p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落</p>
範例:g009p0023
ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。
◎第一行不縮排。(通常用在詩文夾雜的長行段落)
<p rend="text-indent:0">詩偈後接續的長行<p>
範例:g062p0104
表格
表格的標記元素:
<table>:以表格形式呈現、包含在直行橫列中的文字內容
<row>:包含表格中的一列
<cell>:包含表格中的一個儲存格
<cell rows="列數">:表格合併列
<cell cols="欄數">:表格合併欄
實例:請參見中國佛寺志 g089p0254
詩詞歌賦偈
元素
- <lg>(行組, Line Group)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
- <l>(詩行)包含詩文的一行,也許是不完整的詩行。
- <caesura/> 標記韻律詩行可能被截斷的位置。
範例
<p>...其徒理公囑余文記之,故述師行實,以此重系之以賛。賛曰:</p>
<lg><l>師負衣鉢<caesura/>循乞諸方</l>
<l>持律嚴甚<caesura/>懴聲揚揚</l>
<l>傳法天台<caesura/>卓錫育王</l>
<l>重新紺殿<caesura/>舍利增光</l>
<l>緇素皈仰<caesura/>佩德難忘</l>
<l>玉几雲白<caesura/>娑羅樹蒼</l>
<l>忽然示寂<caesura/>眷屬徬徨</l></lg>
<p rend="text-indent:0">噫!我知瓶公滅此生蓮,沼花綻金,渠極樂邦。</p>
標點
詩行不用標點,同行兩句間的間隔標<caesure/>。
詩偈的小字註解
對於註解性質的小字,可以如下標示:
1)<note rend="font-size:small">小字註</note>(註不折行)
2)<note rend="font-size:small;display:block">小字註</note> (註折行)
注意事項
- <lg>與<p>是平行的結構,故<lg>與<p>不可互包。應結束</p>後,再標<lg>。
- 當詩詞跨頁時,照書換頁,不用顧及排版問題。
- 詩偈不用標逗,詩句中間的間隔,以<caesura/>標示。
一頁多欄
例如:g003p0273
行內元素
頁碼
1頁碼放置的位置:置於<div>與<head>之間。
例1:<div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0">
<pb facs="1B009P003.jpg" n="0000a"/>
<head resp="ddbc.da">普陀山志卷前</head>
例2:<div>
<pb facs="1B009P022.jpg" n="0003"/>
<head>重修普陀志叙</head>
2版本說明頁的頁碼、卷之前無頁碼的頁碼
格式:第一頁0000a,第二頁0000b,第三頁0000c
例:<div>
<pb facs="1B009P003.jpg" n="0000a"/>
<head resp="ddbc.da">版本說明</head>
ps.由於卷首需要一個頁碼,因此「版本說明」的頁碼會被挪移到當卷第一個<head>之前。
(見頁碼放置的位置例1)
3插圖頁的頁碼
格式:插圖前頁頁碼+a
例:<pb facs="xBxxxPxxx n="0123a""/>
4空白頁
需標上當頁頁碼
例:<pb facs="1B009P043.jpg" n="0024"/>
5內文頁碼
<pb facs="1B009P294.jpg" n="0275"/>
人名
人名規範資料的建置
(若欲建檔,請先以帳號密碼登入)
● 人名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/person/
● 人名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 編輯「人名規範資料庫」
● 人名規範資料的問題討論,請參閱「佛學規範資料庫」答客問
人名標記標法
●<persName key="Axxxxxx">某某某</persName>
●<persName key="unknown">未知身份的人名</persName>
●<persName key="Gxxxxxx">人名群組</persName>
●<roleName>稱謂</roleName>(須包在<persName>內)
●<roleName type="honorific">尊稱</roleName>(須包在<persName>內)
●<name>族姓</name>
人名標記凡例
稱謂型態 | 凡例 | 標記 |
---|---|---|
官稱 |
|
|
地名當人名 |
|
|
連名 |
|
|
子 |
|
|
兒 |
|
|
公 |
|
|
氏 |
|
|
師、本師 |
|
|
大士、菩薩 |
|
|
山人 |
|
|
上人 |
|
|
老 |
|
|
老人 |
|
|
翁 |
|
|
先生 |
|
|
夫人 |
|
|
諡號 |
|
|
皇帝(皇后) |
|
|
帥 |
|
|
君 |
|
|
諱 |
|
|
人名規範資料建檔注意事項
(1) 名字:
a) 常名、別名請冠上姓氏,以便利檢索。
b) 每一語系中,應有一常名,餘則為別名。
(2) 特別字:人名中有打不出的字時,人名欄位以通用字表示。
(3) 朝代:以此人的卒年為依。
(4) 籍貫:其地名以此人的生年朝代為依。
(5) 生卒年
a) 生年的計算:生年=卒年-歲壽+1
b) 生卒年的取捨:若資料來源有干支年及西元年,以取干支年或中曆年為準。
例:重顯(980~1052),宋代雲門宗僧。於皇祐四年入寂。
建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),
而不用1052年(1052-01-01~1052-12-31)。
(6) 是否為歷史人物:若非歷史人物,則在此欄位勾「否」。
(7) 註解:
a) 以120個字為限(阿拉伯數字不算字數,標點符號算字數),並請使用全形標點符號。
b) 若此人查不到生卒年,則應在註解欄的資料中盡可能節錄相關人事物的時間參考點。
c) 僧人註解資料的基本要件:師承、師兄弟、著作、法嗣、事件時間。
d) 引用資料,盡量以紙本、藏經或佛學辭典為優先。
使用網路資料時,應注意留存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。
e) 引用資料時須註明資料來源。出處的作用:1).說明資料來源 2).幫助使用者搜尋(Finding Aid)
f)「佛學規範資料庫」對於經常引用的參考工具書編有「簡稱」,引用這些參考書時請以這些「簡稱」為依。
g) Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。
(8) 若是查詢不到任何資料的人名,請不用收錄至規範資料庫。(文本上標 key="unknown" 即可)
人名標記規則
1 文本中出現的人名,皆應標記。(例外:書名號內的人名,不標記。)
但對於文意不確定是否為人名者,則不標記。寧缺勿濫。
2 標題後的人名是「作者」時的標法
<head>標題</head><byline><persName key="Axxxxxx">作者名</persname></byline>
(<byline>:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
3 遇人名不確定是否為某人時,可加屬性值標示。
例:<persName key="A001606" cert="70%">
cert是表示標記者認為的正確度,是相對值,非絕對的。
4 非人,非人界皆要標記。(2011/1/27回函決議)
5 關於「姓氏」的類型(需配合前後文意定位),大致分為三類。
<xml code>
1. 特指某人、某女性(隱名,或無名,以姓代稱)
例:盛熙明氏、能仁氏、吳氏、母王氏、菊潭氏、葛周氏
標記:<persName key="">盛熙明<roleName type="honorific">氏</roleName></persName>
<persName key="">能仁<roleName type="honorific">氏</roleName></persName>
<persName key="">吳<roleName type="honorific">氏</roleName></persName>
母<persName key="">王<roleName type="honorific">氏</roleName></persName>
網頁呈現:姓畫底線,氏畫虛線(Excel中無法呈現虛線,暫以雙底線代),
紅字+底線(表示有人名資料連結)
2. 族姓。 例:張氏子、姓周氏 標記:<name>張</name>氏子 姓<name>周</name>氏 網頁呈現:姓畫底線,黑字(表示無人名資料連結)
3. 指教派、學說、職稱。 例:儒氏、佛氏、釋氏、浮屠氏、老氏、職方氏、野史氏、師氏、母氏、舅氏 標記:不標記人名 網頁呈現:同一般內文格式,黑字。 </xml>
6 代名詞標記
代名詞類別:
1.指示代名詞(此、彼、其、之)
2.人稱代名詞(吾、汝)
3.稱謂代名詞(省略人名所得的:氏、先生、皇帝)
4.借稱代名詞(轉變來的:鄒魯、侍御、善人)
一般印刷品的做法:
1.2.3.都不處理(無底線),4.可以用註解(類似典故之註)。
地名
地名規範資料的建置
(若欲建檔,請先以帳號密碼登入)
● 地名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/place/
● 地名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 編輯「地名規範資料庫」
● 地名規範資料的問題討論,請參閱「佛學規範資料庫」答客問
地名標記
● <placeName key="xxxxxxxxxxxxxx">地名</placeName>
● <placeName key="unknown">未知位置的地名</placeName>
● <placeName key="xxxxxxxxxGxxxx">地名群組</placeName></xml>
地名標記凡例
型態 | 凡例 | 標記 | |
---|---|---|---|
單純行政區地名 | 杭州 | <placeName key="CN0330103Z19AA">杭州</placeName>
(需配合文意而選擇朝代別) | |
單純自然區地名 | 普陀山 | <placeName key="CN0330903M01AA">普陀山</placeName> | |
連名 | 四川峨眉縣 | <placeName key="CN0511181Z02AA">四川峨眉縣</placeName>
(以連名的最小地點為其ID) | |
地名中含人名 | 遂賜額曰「天花尊者開巖院」 | <placeName key="CN0331023T57AA"><persName key="unknown">天花尊者</persName>開巖院</placeName> | |
寺內建築:一般 | 大雄寶殿、放生池 | 文本不標,資料庫不建 | |
寺內建築:具特殊意義 | 阿育王寺舍利塔殿 | 文本應標,資料庫應建 | |
地名群組 | 五嶽 | <placeName key="CN0000000G07AA">五嶽</placeName> |
地名規範資料建檔注意事項
(1)地名尾碼非AA碼者,不可重新編碼,因為會牽涉到相同主碼的其他地名。
(2)Google map與衛星圖的經緯度有落差,在標經緯度時以衛星圖為主。
(3)地名的建置,註解欄注意事項請參閱4人名規範資料建檔注意事項內有關註解的條目。
地名標記規則
● 文本中出現的地名,皆應標記。
● 非人界、傳說中的地名,不用標記、建檔。
地名問答
●Q:開元寺志中有許多建築(例:紫雲大殿、法堂等),皆有精確經緯度,是否標記地名?
A:同其他志的規則,建築不用標記。
時間
時間規範資料的查詢
(若欲查詢,請先以帳號密碼登入)
● 時間規範資料庫網頁 http://dev.ddbc.edu.tw/authority/time/
● 時間規範資料的問題討論,請參閱「佛學規範資料庫」答客問
時間標記
● <date key="j+(起始時間碼)+(結尾時間碼)" notBefore-iso="起始西元年-月-日" notAfter-iso="結尾西元年-月-日">區段性的某時間</date>
● <date key="j+(開始時間碼)+(結束時間碼)" from-iso="開始西元年-月-日" to-iso="結束西元年月日">事件持續進行的時間</date>
● <date key="j+(當日時間碼)+(當日時間碼)" when-iso="西元年-月-日">時間點</date>
● <date key="unknown">未知的時間</date>
*ISO標準:由於DDBC時間資料庫是依照ISO_8601-2004_E所發佈的標準,採用格里曆曆法推算的時間,所以時間屬性使用when-iso,notBefore-iso,notAfter-iso。
時間標記凡例
時間型態 | 凡例 | 標記 |
---|---|---|
區段性的某時間 | 余以光緒己卯游天台 | <date key="j24073722407755" notBefore-iso="1879-01-22" notAfter-iso="1880-02-09">光緒己卯< /date>
說明:a)key2407372:光緒己卯年正月一日ID |
明確日期 | 萬曆庚戌年五月十六日 | <date key="j23092772309277" when-iso="1610-06-26">萬曆庚戌年五月十六日</date> |
時間規範資料建檔注意事項
(1)佛寺志專案使用Julian day number時間系統,請確認介面是否選用此項。
(2)若未「登入」時間規範資料庫,查詢結果將不會自動計算「初年」、「末年」等較詳細之資訊。
(3)時間的查詢有多種管道:中國年(朝代、帝號、年號、年干支),西元年(三種方式),ID碼。
時間標記規則
1 有明確年號、年代、或月日等的時間,皆應標記;
無法證知(從前後文或其他資料皆無法得知)的時間,則可標記<date key="unknown">未知年的時間</date>。
2 初年,末年時間的擷取原則
取當朝(或當年號)的最前1/4為其「初」,最後1/4為其「末」。(程式自動計算)
民國年
時間為民國年的注意事項
- 民國十三年 → 用西曆
- 民國十三年冬 → 標示西曆民國十三年12月~民國十四年2月 (西曆:春3-5月,夏6-8月,秋9-11月,冬12-2月)
- 民國十三年甲子 → 用農曆民國甲子年
- 民國十三年甲子冬 → 用農曆民國甲子年10~12月
時間為民國年的查法
登入網頁「兩千年中西曆轉換」http://sinocal.sinica.edu.tw/, 兌換出相對應的西元時間,再到時間規範資料庫換算ID碼即可。
例:民國壬寅年,兌換出為西元1962年2月5日~1963年1月24日
再到時間規範資料庫以西元年查詢為 5949266~5949619
即 <date key="d59492665949619" notBefore="1962-02-05" notAfter="1963-01-24">
時間屬性的變更(2011.01.20)
notBefore,notAfter,from,to,when,全要加上-iso(計算0年)
如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso
例:<date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13">哀帝元壽間</date>
時間問答
1 萬 丙子秋(=萬曆丙子秋)
例:<date>萬 丙子秋</date>(照標時間,空格不再處理。)
2 屬性key,notBefore,notAfter的先後順序不一,不會影響驗證或呈現。
例:<date key="j22968992296986" notBefore-iso="1576-08-05" notAfter-iso="1576-10-31">萬曆丙子秋</date>
=<date notAfter-iso="1576-10-31" notBefore-iso="1576-08-05" key="j22968992296986">萬曆丙子秋</date>
3 當時間同時有年次、歲次時,可全包入時間,但中間不用逗號。
例:時<date key="j24192292419229" when-iso="1911-07-11">宣統三年歲在辛亥六月旣望</date>,長洲葉昌熾謹記
4 時間名詞+初、初年、末、末年、年:包進時間。
時間名詞+中、間、年間:不包進時間。
* 初年、末年,西元日期只擷取「年」即可,「月、日」不取。
例1:<date key="j22956292299967" notBefore-iso="1573" notAfter-iso="1584">萬曆初</date>
例2:<date>萬曆三年</date>
例3:<date>萬曆</date>年間
5 清光緒末年的時間計算問題(德宗&恭宗皆以光緒為年號)
a)光緒末年,指德宗+恭宗的年代的末1/4。
b)若有數個,可取最長的那一個末年,如上則取德宗光緒的末年即可。
6 因文本錯誤找不到ID
有些時間因文本錯誤以致無法找到id,可用note註解。
例:當穆王五十三年壬申二月十五子夜,入般涅槃。
<date key="unknown">穆王五十三年壬申二月十五</date>子夜
<note resp="ddbc.da">據《中國史厯日和中西厯日對照表》(方詩銘、方小芬編著,上海人民出版社2007)編載,周穆王只行到四十一戊戌年(-983)。</note>
知識備忘
(1)春=農曆1-3月,夏=農曆4-6月,秋=農曆7-9月,冬=農曆10-12月
(2)農曆月份的別名
一月:孟春、元春、開歲、端月、嘉月、正月。
二月:仲春、杏月、麗月、如月、花月。
三月:季春、晚春、暮春、季月、蠶月、桃月、桐月。
四月:孟夏、麥月、陰月、梅月、純陽。
五月:仲夏、榴月、蒲月、皋月、毒月。
六月:季夏、暑月、焦月、荷月、荔月。
七月:孟秋、新秋、蘭秋、蘭月、瓜月、巧月。
八月:仲秋、竹春、桂月、壯月。
九月:季秋、暮商、菊月、朽月、陽月、季秋。
十月:孟冬、初冬、開冬、露月、良月、陽月。
十一月:仲冬、辜月、葭月、龍潛月、冬月。
十二月:季冬、殘冬、臘月、冰月、嚴月。
朝代code
夏:<date key="j09902101152377" notBefore-iso="-2001-01-01" notAfter-iso="-1558-12-31">
商:<date key="j11461691337951" notBefore-iso="-1574-01-01" notAfter-iso="-1049-01-31">
周:<date key="j13339031628288" notBefore-iso="-1060-01-01" notAfter-iso="-0255-12-31">
東周:<date key="j14398241627923" notBefore-iso="-0770-01-01" notAfter-iso="-0256-12-31">
秦:<date key="j16410251646133" notBefore-iso="-0220-11-14" notAfter-iso="-0206-11-09">
漢:<date key="j16477011801742" notBefore-iso="-0201-02-24" notAfter-iso="0220-11-25">
西漢:<date key="j16477011723283" notBefore-iso="-0201-02-24" notAfter-iso="0006-02-01">
新:<date key="j17243601729737" notBefore-iso="0009-01-15" notAfter-iso="0023-10-06">
東漢:<date key="j17304061801742" notBefore-iso="0025-08-03" notAfter-iso="0220-11-25">
三國:<date key="j18017581823479" notBefore-iso="0220-12-11" notAfter-iso="0280-05-31">
曹魏:<date key="j18017581818249" notBefore-iso="0220-12-11" notAfter-iso="0266-02-04">
蜀漢:<date key="j18019131817499" notBefore-iso="0221-05-15" notAfter-iso="0264-01-16">
孫吳:<date key="j18048431823479" notBefore-iso="0229-05-23" notAfter-iso="0280-05-31">
晉:<date key="j18182531874651" notBefore-iso="0266-02-08" notAfter-iso="0420-07-08">
西晉:<date key="j18182531836822" notBefore-iso="0266-02-08" notAfter-iso="0316-12-12">
東晉:<date key="j18369381874651" notBefore-iso="0317-04-07" notAfter-iso="0420-07-08">
南朝宋:<date key="j18746541896160" notBefore-iso="0420-07-11" notAfter-iso="0479-05-29">
南朝齊:<date key="j18961611904523" notBefore-iso="0479-05-30" notAfter-iso="0502-04-22">
南朝梁:<date key="j19045331924818" notBefore-iso="0502-05-02" notAfter-iso="0557-11-14">
南朝陳:<date key="j19248221936231" notBefore-iso="0557-11-18" notAfter-iso="0589-02-12">
北魏:<date key="j18620951916335" notBefore-iso="0386-02-20" notAfter-iso="0534-08-22">
北周:<date key="j19245481933331" notBefore-iso="0557-02-15" notAfter-iso="0581-03-04">
北齊:<date key="j19221051931862" notBefore-iso="0550-06-09" notAfter-iso="0577-02-24">
隋:<date key="j19333311946884" notBefore-iso="0581-03-06" notAfter-iso="0618-04-15">
唐:<date key="j19469512052491" notBefore-iso="0618-06-21" notAfter-iso="0907-06-06">
武周:<date key="j19730671978610" notAfter-iso="0705-02-24" notBefore-iso="0689-12-21">
五代:<date key="j20524952071731" notBefore-iso="0907-06-10" notAfter-iso="0960-02-08">
後梁:<date key="j20524952058505" notBefore-iso="0907-06-10" notAfter-iso="0923-11-23">
後唐:<date key="j20583162063308" notBefore-iso="0923-05-13 " notAfter-iso="0937-01-11">
後晉:<date key="j20632642066960" notBefore-iso="0936-11-28" notAfter-iso="0947-01-11">
後漢:<date key="j20670182068412" notBefore-iso="0947-03-10" notAfter-iso="0951-01-02">
後周:<date key="j20684542071731" notBefore-iso="0951-02-13" notAfter-iso="0960-02-03">
宋:<date key="j20717322188290" notBefore-iso="0960-02-09" notAfter-iso="1279-03-26">
北宋:<date key="j20717322132773" notBefore-iso="0960-02-09" notAfter-iso="1127-03-27">
南宋:<date key="j21328572188290" notBefore-iso="1127-06-19" notAfter-iso="1279-03-26">
元:<date key="j21856422220977" notBefore-iso="1271-12-25" notAfter-iso="1368-09-22">
明:<date key="j22207422321634" notBefore-iso="1368-01-31" notAfter-iso="1644-04-25">
清:<date key="j23218222419402" notBefore-iso="1644-10-30" notAfter-iso="1911-12-31">
代名詞
標法
<ref key="Axxxxxx">人名代名詞</ref>
例:<ref key="A003672">其</ref>
<ref key="xxxxxxxxxxxxxx">地名代名詞</ref>
標記時機
當詞意不明顯時才須標
註解(底本本身)
對於註解性質的小字,可以如下標示:
1)<note>字體大小不變的註解</note>
2)<note rend="font-size:small">不折行的小字註</note>
3)<note rend="font-size:small;display:block">折行的小字註</note>
註解(ddbc.da)
1.註解內無超連結 標法:<note resp="ddbc.da">註解文字</note> 例:梁視<note resp="ddbc.da">視,疑爲「祖」字。</note>普通三年
2.註解內有超連結 標法:<note resp="ddbc.da">註解文字(<ptr target="網址"/>,日期)</note> 例:應案<note resp="ddbc.da">「案」字,萬福禪寺網站此處作「索」。 (<ptr target="http://www.huangboshan.com/zisusifu.htm"/>,2010.05.04)</note>屐而自潸。(g010p0445)
3.註解引用自CBETA資料時 標法:<note resp="ddbc.da">CBETA經文(CBETA預設的引用格式)</note> 例:著作郎<persName key="A010335">顧允祖</persName><note resp="ddbc.da"> 《集神州三寶感通錄》卷1:「著作郎顧胤祖」(CBETA, T52, no. 2106, p. 405, a17)</note>
4.夾註小字 標法:<seg rend="font-size:small">夾註小字</seg> 例:禪心風動後,空腹樹焚餘<seg rend="font-size:small">寺中銀杏樹自焚</seg>。片石文難得,東林社已虛。
其他規則: (1)標題內的註解,請置於<head>內。 例:<head>于黃檗丈室堂第三代隱元隆琦國師 上堂九則 機緣三則<note resp="ddbc.da"> 按:標題為上堂法語九則,機緣三則;內文實則收錄上堂法語八則,機緣五則。</note></head>
空格
<space quantity="1" unit="chars"/>:一個英文半形空格(最早期使用,停用)
<space quantity="1" unit="eng_chars"/>:一個英文半形空格(停用)
<space quantity="1" unit="chi_chars"/>:一個中文全形空格(停用)
<space quantity="1" unit="cjk_char"/> 一個全形空格(現在使用)
<space quantity="0.5" unit="cjk_char"/> 半個全形空格(停用)
<space quantity="1" unit="lat_char"/> 一個半形空格(正確,但未用)
<space quantity="1" unit="cjk_char" resp="ddbc.da"/>自加的一個全形空格(現在使用)
訛字處理
文本中的錯字,包含看似錯誤但仍照實轉錄的字,則加以修訂。
標法:
<choice><sic>底本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
範例:
一切殿宇皆頹<choice><sic>圯</sic><corr resp="ddbc.da">圮</corr></choice>剝落
呈現方式:
網頁呈現:一切殿宇皆頹圯[>圮]剝落 g010p0264
PDF呈現:(內文)一切殿宇皆頹圮剝落 (註腳)「圮」為底本「圯」的勘誤
漏字處理
文本中的缺漏字,或模糊不清的字,或難以認識的字,則以 <gap>標記之。
缺漏字
標法1:<gap extent="1" unit="cjk_char" reason="lost"/>(漏字)
標法2:<gap extent="1" unit="cjk_char" reason="unclear"/>(模糊不清的字,例如印刷不清)
標法3:<gap extent="1" unit="cjk_char" reason="illegible"/>(難以認識的字,例如草書)
標法4:<gap extent="unknown" unit="cjk_char" reason="lost"/>(缺漏一段文字)
標法5:<gap extent="1" unit="cjk_char" reason="taboo-char"/>(避諱)
註:unit 屬性是單位,extent 屬性是單位數量,本例中 unit="cjk_char",extent="1" 便表示有1個字。
範例1:地屬三寶<gap extent="2" unit="cjk_char" reason="lost"/>鬼神護訶。
範例2:有侵佔者,身墮地獄,<gap extent="1" unit="cjk_char" reason="unclear"/>及子孫。
範例3:<gap extent="2" unit="cjk_char" reason="illegible"/>諸寺
範例4:余曰:「盍行乎?」<gap extent="unknown" reason="cjk_char" unit="chars"/>迄于今甲子周,而事始稍稍竣也。
範例5:明萬<gap extent="1" unit="cjk_char" reason="taboo-char"/>甲寅,泰和郭孔太E恭詣育王謁舍利。
呈現方式:以一個空白方框代表一個缺漏字。
網頁呈現1:地屬三寶□□鬼神護訶。g043p0072 網頁呈現2:有侵佔者,身墮地獄,□及子孫。g043p0072 網頁呈現3:□□諸寺 g081p0013 網頁呈現4:余曰:「盍行乎?」□...□迄于今甲子周,而事始稍稍竣也。g086p0286 網頁呈現5:明萬□甲寅,泰和郭孔太恭詣育王謁舍利。g010p0328
PDF呈現:(內文)與網頁呈現相同
補字
文本原無此字,在他版本找到該處可填某字的根據。(若一文補入多處,則於第一個補處做註。)
標法:
<supplied reason="lost">闕漏字</supplied><note resp="ddbc.da">參考來源</note>
範例:g043p0069
<supplied reason="lost">木鐸徇于道路,《周官》所以警其頑</supplied>
<note resp="ddbc.da">「木鐸徇于道路周官所以警其頑」十三字此處闕漏,茲依卷一 p. 54〈明,唐寅:姑蘇寒山寺化鐘疏〉一文補入。本篇補缺字所據同此。</note>
愚;銅鍾司其<supplied reason="lost">晨昬</supplied>,釋氏所以覺夫靈性。
呈現方式:
網頁呈現:[[木鐸徇于道路,《周官》所以警其頑]][註]愚;銅鍾司其[[晨昬]],釋氏所以覺夫靈性。
PDF呈現:(內文)[[木鐸徇于道路,《周官》所以警其頑]][註]愚;銅鍾司其[[晨昬]],釋氏所以覺夫靈性。
(註腳)[註]「木鐸徇于道路周官所以警其頑」十三字此處闕漏,茲依卷一 p. 54〈明,唐寅:姑蘇寒山寺化鐘疏〉一文補入。本篇補缺字所據同此。
備註:
1.底本之模糊字或殘缺字,若能辨識,則自動打入,不用標記<supplied>。
2.補入的闕漏字,亦可於其中加上標點符號,以利閱讀,但非他版原有。
重複字
<choice><orig><g ref="#bty117000301"/><備註組字式拆法!--[?]--></orig><reg(這裏中間要空1格)resp="ddbc.da">重複的字</reg></choice>
底本本身的刪塗、訂正字
訂正字
<del>刪塗字</del>
<add>原著(編)者訂正字</add>
例:(g094p0206)
<del>行</del>
<add>存</add>
呈現方式:
<del>行</del>(劃一橫線表示刪去)
{存}(加上大括弧表示原著(編)者訂正字)
若刪除的字辨識不清時,reason用 "cancelled":
<del><gap extent="2" unit="chars" reason="cancelled"/></del>
印章
標法:<stamp>印章上的文字</stamp>
例1:乾隆御覽之寶<stamp>清乾隆玉璽</stamp>
例2:<closer>萬曆丁未孟夏,賜進士第定海令椘潛樊王家撰<stamp>樊王家印</stamp></closer>(這是個印章)
*文章結尾署語的用印,可包在<closer>裡。
上標字及頁註
上標字
1.標法:<seg rend="vertical-align:super">上標字</seg>
例:藏外佛經<seg rend="vertical-align:super">1</seg>
2.目前打字時用以表示上標字的記號:@上標字/@(須使用全形記號以避免和內文混淆)
例:藏外佛經@1/@
頁註
1.有兩種標法:
標法一:
<body>被註內文<ptr n="f001"/>其他內文</body>
<back>其他頁尾的文字<note xml:id="f001">被註內文在頁尾的註文</note> 其他頁尾的文字</back>
標法二:
被註內文<note place="foot" n="1">被註內文的註文</note>其他內文
(所以標法二的註文是因為有 place="foot" n="1"會自己出現在頁尾)
2.目前打字時用以表示頁註的記號:以全形#單獨一行,將內文與頁註格開
字元層次
特字
標逗
書名
1.書名的標符樣式:《》
2.書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。
結尾署語
Q:結尾署語<closer>中的文字是否標逗? A:原則上開放標點,適度添加,方便閱讀。但結束可不加句號。
例如: 元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記
加上標逗: 元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記
詩篇名
詩篇名標符樣式:〈〉
偈頌
標法:<l>詩句<caesura/>詩句</l>
範例:
<lg>
<l>稽首觀音<caesura/>大悲之主</l>
<l>我今說偈<caesura/>畧讚所以</l>
<l>所以者何<caesura/>所謂三摩</l>
<l>菩薩證入<caesura/>常住寶陀</l>
<lg/>
*偈頌中不使用標點符號,詩句中的分隔,以 <caesura/> 標示。
底本有黑點(•)白點(。)
有些寺志底本中有黑點(•)白點(。),這是個不錯的標逗參考,但可不必完全依照。標逗以文意暢達為要。
例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)
可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰:
標記問答
Q:格式問題:是否照書編排?
A:數位文本不必全照書編排。
Q:敬格的情況,有空一格,有另起一行。
A:"敬格"統一都不須空格或另起一行。
Q:並列的文字。
A:不作並列標記。可標記縮小字<seg rend="font-size:small">。
Q:若印刷錯誤,文字內容重複時。
A:可用[註]標示。但若有跨頁,頁碼要放在note的外面。
Q:文本若超出可處理的範圍,如元朝蒙語譯文。
A:可不標句讀,但須於檔頭<teiHeader>作說明。
Q:雙關語的標記(人地混雜)
A:依字面標記元素,以註解說明喻意。
例1:g077p0293
淳氣日凋薄,<placeName key="PL000000021567">鄒</placeName><placeName key="PL000000021513">魯</placeName><note resp="ddbc.da">此處「鄒魯」代指「孔孟」。鄒魯乃孔子和孟子的誕生地。</note>亡眞承。
例2:g017p0194
笙歌日日娛<persName key="A008915">西子</persName><note resp="ddbc.da">此處「西子」代指「西湖」。</note> 為愛幽閒到玉岑