佛寺志粗標
電校
1.電校流程:
請參看《中國佛寺志》專案執行步驟#校對
切檔
1.分檔方式:
請參看《中國佛寺史志》標記作業#檔案架構
2.版本頁的納入:
舉例:g030崇福寺志(《中國佛寺史志彙刊》,第1輯,第30冊,頁f1)
說明:明丹書局的「版本頁」有助於讀者快速得知當志的版本,因此可納入數位化範圍。(這有別於之前細標的14志。14志因要出版,所以顧及智產權問題,而不將明丹書局所編輯的內容納入。)
粗標
1.段落標記:
請參看《中國佛寺史志》標記作業#段落形式
2.行號問題:
1)無格線
規則:有文字的行才算數,由1起算。
實例:文字雖置中,但前無文字。
標記:<lb n="1"/>實例待找
2)有格線
規則:行號標示它所在的行數。其中的空白行,不用標示行號。
實例:崇福寺志「西天目祖山志卷七終」
標記:<lb n="10"/><closer>西天目祖山志卷七終</closer>
3)跨格線1
規則:標示在第一行下。
實例:崇福寺志「禪源寺住持際界增訂」
標記:<lb
n="1"/></div><div><head>西天目祖山志補遺</head>
n="2"/><p>禪源寺住持際界增訂</p>
n="4"/><div><head>稽古</head>
4)跨格線2
規則:標示在最後一行下。
實例:仰山乘卷之四里人程文舉、民逸氏 本山沙門性玉、性覺仝編錄
標記:<pb facs="2B021P347.jpg" n="0331"/>
<lb n="1"/><head>仰山乘卷之四<seg rend="font-size:small">詩部</seg></head>
<lb n="2"/><byline>里人程文舉、民逸氏
<lb n="3"/>本山沙門性玉、性覺 仝編錄</byline>
網頁呈現:里人程文舉、民逸氏
本山沙門性玉、性覺 仝編錄
3.補字標記修訂(2013.05.20):加resp屬性
原 <supplied reason="lost">闕漏字</supplied><note resp="ddbc.da">引用出處</note>
今 <supplied reason="lost" resp="ddbc.da">闕漏字</supplied><note resp="ddbc.da">引用出處</note>
4.自加標題標記修訂(2013.05.20):加supplied元素
原 <head resp="ddbc.da">自加標題</head>
今 1.<head><supplied resp="ddbc.da">自加標題</supplied></head>
例:普陀洛迦新志(藝文序)
2.<head>原標題<supplied resp="ddbc.da">自加標題</supplied></head>
例:重修普陀志叙(周應賓撰)
*取代標記,但不變動任何文字
原 <head resp="ddbc.da">(.*?)</head>
改→ <head><supplied resp="ddbc.da">$1</supplied></head>
5.地名標題下的詩偈,不用標<head>(標<p>及<lg>)
例:g009_02_p96 磐陀石
6.法語中,如有「上堂」法語,可分段。(每一次上堂分一段)
例:g010_09_p436 上堂
7.尾註的標法
例:g054p4正如晉釋道安說的,『不依國主,則法事難舉』。<ref type="endnote" target="#n00-01-01">〔一〕</ref>(若是第二篇文章的尾註,則可命名為 #note00-02-01)
<!-- 章節末 -->
尾註標記:<p rend="font-size:small;text-indent:-2ex;margin-top:3ex"><note xml:id="n00-01-01" place="end">[一]世說新語賞譽篇注引車頻秦書。高僧傳五釋道安傳。</note></p>(記得要用全段縮排及第一行凸排喔)
特字處理
1.通用字的提供:
以「一篇文章」為單位。對於當代讀者難以辨識的特異字,我們會在一篇文章中它第一次出現時提供其通用字。
特殊問題
1.稿本有大量塗改的情形,如何標記?例:g026虎跑定慧寺志
文本上有後人刪劃、添加修改的筆記,由於刪改的情況複雜,所以我們僅數位化其「原本」,而忽略其「稿本」(亦即刪改的筆記)。
2.標題很長,像前言,如何標記?例:g076仰山乘
「本源上人余姻家之子以儒流而入釋門遂精進其道大闢仰山宗風傳燈說法耆宿一時推尊誠新安之叢林故敬贈之」,像這樣「勒勒長」的標題,TEI英文版<head>元素中也有類此「長標題」的範例。所以還是標<head>。
3.以程式標記詩偈
1)XML作業,標上詩句的字數。
將每一首詩標上<lg n="X"><l>一首詩的文字</l></lg>
註:X 代表每句規律的字數,例如若是一首五言詩,就標<lg n="5">。
2)執行lg.py程式
電腦環境:電腦中要安裝Python 3.3版以上的軟體才能開得起來。
Python 3.3軟體存放路徑:Z:\數位典藏組\python\python-3.3.0
lg.py存放路徑 D:\Projects\BTG\fosizhi_xml\bin\lg.py(每人所設置的git路徑也許不一樣)
執行步驟:
A)以 dos 視窗開啟 lg.py程式
B)在dos視窗中bin>後面閃動的游標處,打上程式檔名、檔案路徑、檔案名稱,然後按Enter。(例:bin>lg.py xml-processing g076)
C)程式預設每組<l></l>會自動折行,如果不想折行, 就在檔案名稱後面加個 -n。(例:bin>lg.py xml-processing g076 -n)
D)產生的檔案會在 D:\Projects\BTG\fosizhi_xml\output/xml/g076 裡
E)檢查一下產生的檔案,若沒問題,就可以拿來用了;
若是發覺有誤失(例如詩句字數算錯),可於修改原檔後,再重新執行lg.py程式。
提醒:有些詩句中含有小字(seg)標記,會造成程式判讀錯誤,這部份需人工檢查。
4.底本的全段落小字,有時可用「全段縮排」的樣式,取代「小字標記」。 例:g038p166〖案〗祖心住金山事
標點符號問題
1.本計畫由於時程的關係,未將內文加上標點符號。全文化新式標點是佛寺志專案未來階段的目標之一,而標記人員在現行標記過程中,多多少少已對文本進行解讀,因此順此之勢,可順手在XML做斷句、加上標點符號(非全面性),有利於工作的進行。網路版可選擇是否隱藏標點符號。