「《中國佛寺史志》標記作業」:修訂間差異
imported>Miaomiao (→人名) |
imported>Jiayu.xu 無編輯摘要 |
||
(未顯示由 7 位使用者於中間所作的 498 次修訂) | |||
行 1: | 行 1: | ||
[http://wiki.dila.edu.tw/pages/%E5%90%8D%E5%B1%B1%E5%8F%A4%E5%89%8E-%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%95%B8%E4%BD%8D%E5%85%B8%E8%97%8F 回《 中 國佛寺史志》 數位 典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual )] | |||
《中國佛寺志》 標記作業<br> | |||
另可參考 :[http://wiki.dila.edu.tw/pages/%E9%81%B5%E5%BE%AA_TEI_%E7%9A%84%E4%BD%9B%E5%AD%B8%E6%95%B8%E4%BD%8D%E5%8C%96_XML_%E6%A8%99%E8%A8%98 遵循 TEI 的 佛學 數位 化 XML 標記] | |||
==標記 | = 工作準備= | ||
1. 參考資料: | |||
進行寺志 標記 前,應先找好該志的相關參考資料,例如:白話本、點校本等。 | |||
2. 檔案管理: | |||
本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。 | |||
目前檔案資料夾分為三部份: | |||
1)xml(已完成細標 的 檔案。細標是指有人名、地名、時 間 的標記) | |||
2)xml-basic-g(明丹本) | |||
3)xml-basic-y(廣陵本) | |||
3. 作業軟體oXygen(19版)的環境設定 | |||
1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose | |||
2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾) | |||
3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排) | |||
4) 呼叫結構樹 outline:window→Show View→outline | |||
(結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。) | |||
4. 作業技巧:凡具規則性 、 大量性 之 機械 式 作業 , 應尋求以程式批次處理 , 避免人工重複作業 。 | |||
5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。 | |||
「意義 標 記」著重在付予文字意義,例如:persName(人名),p(段落)。 | |||
例 | 「樣式標記」著重在樣貌的呈現,即編輯樣式, 例 如:lb(折行),p rend="" (段落格式)。 | ||
本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。 | |||
=檔案架構= | |||
《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。<br> | |||
(例:重修普陀山志,代碼g008)<br> | |||
每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)<br> | |||
及數個分檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。<br> | |||
主檔內含有版本資訊(teiHeader)、掃描圖資訊(tei:facsimile)及分檔的鍊結(text xi:include)。<br> | |||
分檔內則是各卷的內容。<br> | |||
●切檔命名規則<br> | |||
志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名頁等)<br> | |||
志碼_00:卷首(題名頁之後的內容,如:序文、目錄、山圖等)<br> | |||
志碼_01:卷一<br> | |||
志碼_02:卷二(以下依卷次類推)<br> | |||
志碼_back:附錄、補編等<br> | |||
志碼_back1:附錄、補編有多卷時,可加序號。例如附編卷一<br> | |||
志碼_back2:附錄、補編有多卷時,可加序號。例如附編卷二<br> | |||
●特殊例子的切檔<br> | |||
例:<br> | |||
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷 題 情勢做適當的調整)。<br> | |||
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6<br> | |||
g087_03-1,g087_03-2<br> | |||
=加facs碼= | |||
<b>1.執行git中的facs.py程式,為內文中的pb加上facs</b><br> | |||
例:原<pb n="0041"/><br> | |||
執行程式後變成<pb facs="1B017P108.jpg" n="0041"/><br> | |||
<b>2.請網路工程師(阿賢)為main檔加facsimile</b><br> | |||
將 加 好pb facs 的 檔案,連同main檔 , 一併交給工程師。工 程 師 會 在main檔 加 入如下 的標記:<br> | |||
<xml code> | |||
<tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0"> | |||
<tei:graphic url="1B017P108.jpg"/> | |||
<tei:graphic url="1B017P109.jpg"/> | |||
...... | |||
...... | |||
</xml> | |||
<b> 注意事項:卷內的pb facs要與main中的facsimile url同步</b><br> | |||
各卷內 的 頁碼有時會 有 錯誤,當修改pb facs碼 時, 請順便也要一併修改main中的facsimile url , 這樣文件才會完整 。<br> | |||
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/><br> | |||
Y141_main <tei:graphic url="4B100P005.jpg"/><br> | |||
= | = 文件宣告= | ||
1 | 1 各卷文件宣告列 ,請 一致用:<br> | ||
<?xml version="1.0" encoding="UTF-8"?>(雙引號 , 大寫UTF) | |||
2 | 2 缺字在檔頭宣告,其流程:<br> | ||
<xml code> | |||
1)開啟main檔 | |||
2)在</fileDesc>之後加上以下的群組 標記 | |||
<encodingDesc> | |||
<charDecl> | |||
<char xml:id="Z0001"> <!-- Z0001為DILA難檢字庫 ID --> | |||
<charName>DILA CHARACTER Z0001</charName> | |||
<charProp> | |||
<localName>CBETA</localName> <!-- CB碼 -->(若無可省略) | |||
<value>CB30005</value> | |||
</charProp> | |||
<charProp> | |||
<localName>composition</localName> <!-- 組字式 --> | |||
<value>[宀/廣]</value> | |||
</charProp> | |||
</char> | |||
</charDecl> | |||
</encodingDesc> | |||
3)在當志中,用「<g ref="#」搜尋出所有缺字。 | |||
4)逐一將缺字碼放在「DILA 難檢字庫」中檢索,將缺字資料填補入缺字宣告中。 | |||
(從缺的項目可省略) | |||
例 :g069_main | |||
</fileDesc> | |||
<encodingDesc> | |||
<charDecl> | |||
<char xml:id="Z0393"> | |||
<charName>DILA CHARACTER Z0393</charName> | |||
<charProp> | |||
<localName>composition</localName> | |||
<value>[ 山*克]</value> | |||
< | </charProp> | ||
< | </char> | ||
<char xml:id="Z0523"> | |||
<charName>DILA CHARACTER Z0523</charName> | |||
<charProp> | |||
<localName>composition</localName> | |||
<value>[風*丘]</value> | |||
</charProp> | |||
</char> | |||
<char xml:id="Z0522"> | |||
<charName>DILA CHARACTER Z0522</charName> | |||
<charProp> | |||
<localName>composition</localName> | |||
<value>[山*右]</value> | |||
</charProp> | |||
</char> | |||
</charDecl> | |||
</encodingDesc> | |||
</teiHeader> | |||
</xml> | |||
< | |||
< | |||
< | |||
= 段落 形 式= | |||
== 標 題== | |||
1 標 題 的標 法<br> | |||
● <head> 標題</head><br> | |||
● <head>標題</head><byline><persName>作者</persName></byline><br> | |||
● <head> 標 題<seg rend="font-size:small">副標題</seg></head><br> | |||
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg><br> | |||
● 標 題小字要折行:<seg rend="font-size:small;display:block">縮小 的 字</seg><br> | |||
● 標 題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩<br> | |||
[[ | 2自訂標題<br> | ||
1.全自加<br> | |||
<head><supplied resp="dila.da">自訂標題</supplied></head><br> | |||
例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0309 〔劉仁本題跋〕]<br> | |||
2.半自加<br> | |||
<head>原標題<supplied resp="dila.da">自訂標題</supplied></head><br> | |||
例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g084&cpage=0005 雞足山志序〔二〕]<br> | |||
3.隱藏自加的標題<br> | |||
<head rend="display:none"><supplied resp="dila.da">自訂標題</supplied></head><br> | |||
例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0001 志 名 頁]<br> | |||
ps. rend="display:none" 隱藏元素格式(不留白)<br> | |||
rend="visibility:hidden" 保留元素格式(留白)<br> | |||
3說明<br> | |||
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。<br> | |||
另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。<br> | |||
段落句首折作標題與否示例(以g074雲居山志 為例) | |||
(一)直接折作標題 | |||
原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。 | |||
範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來--- | |||
標題:自寳禪師 | |||
內文:上堂。總恁麽風恬浪靜,那裏得來--- | |||
範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲--- | |||
標題:宗杲大慧禪師 | |||
內文:時圜悟詔住雲居,師往省覲--- | |||
範例3:p82 晦山顯禪師 師在廬山歸宗寺受請,辛卯十二月廿一甲子進院--- | |||
標題:晦山顯禪師 | |||
內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院--- | |||
範 例4:p105 復合神鐘 寺有巨鐘,明中葉院圮--- | |||
標題:復合神鐘 | |||
內文:寺有巨鐘,明中葉院圮--- | |||
(二)依句頭另作標題[ ] | |||
原則:若段落首句 的 文法成份是屬於「主詞」或「前 置 受詞」的,則應留作內文句頭,而另訂標題。 | |||
範例1:p65 道齊禪師 本州金氏子,徧歷禪會--- | |||
標題:[道齊禪師] | |||
內文:道齊禪師 ( 主詞),本州金氏子,徧歷禪會--- | |||
範例2:p70 克勤佛果禪師 建 炎丁未歲十一月初六日 , 奉敕住雲居--- | |||
標題:[克勤佛果禪師] | |||
內文:克勤佛果禪師(主詞 ) ,建炎丁未歲十一月初六日,奉敕住雲居--- | |||
範 例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居--- | |||
標題:[燕雷鵬禪師] | |||
內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居--- | |||
範 例4:p103 佛印禪師 周茂叔謁見 , 問曰--- | |||
標題:[佛印禪師] | |||
內文: 佛 印禪師(前置受詞),周茂叔謁見,問曰--- | |||
範 例5:p106 寺左三塔 沉埋土中多年--- | |||
標題:[ 寺左三塔] | |||
內文:寺左三塔(主詞)沉埋土中多年--- | |||
○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。 | |||
(2)標題後的副標題,可以<seg>(隨機分割)標記之。<br> | |||
.例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head><br> | |||
.<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。<br> | |||
(3)若底本格式為「作者在標題之前」,且 編輯 分類是以 「 作者 」 為主時,則作者亦可作標題。<br> | |||
例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g028&cpage=0458 g028p458 厲鶚]<br> | |||
4長詩題的另訂 | |||
關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂 標 題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對 的 理由。 | |||
5 標 點符號<br> | |||
(1)標題亦可加新式 標點 符號 , 惟結尾 不 用句點。<br> | |||
==段落樣式== | |||
===樣式語法=== | |||
◎全段縮小字<br> | |||
<p rend="font-size:small">全段縮小字</p><br> | |||
範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0427 g009p0427]<br> | |||
◎全段縮排一個字<br> | |||
<p rend="margin-top:1ex;text-indent:0">縮排 的 段落</p><br> | |||
範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0593 g009p0593]<br> | |||
[ | ◎全段縮排一個字,但第一行凸排一個字<br> | ||
<p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落</p><br> | |||
範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0023 g009p0023]<br> | |||
ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。 | |||
◎第一行不縮排。(通常用在詩文夾雜 的 長行段落 )<br> | |||
<p rend="text-indent:0">詩偈後接續的長行<p><br> | |||
範 例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g062&cpage=0104 g062p0104]<br> | |||
◎靠右對齊<br> | |||
<p rend="text-align:right"><br> | |||
< | |||
◎全 段 並排小字,有 時 可 以 調整為大字<br> | |||
例:g079 p.004崇眞 萬 壽宮<br> | |||
===序、跋、按語之格式=== | |||
1. 小序、小引<br> | |||
1)「詩」(詩行)前小序、小引,做一般段落,並依底本之大小字體編輯之。<br> | |||
例:g023卷六p371(雲林看雨圖題句小引)<br> | |||
2)「文」(長行)前小序、小引,全段縮排3格。<br> | |||
例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)<br> | |||
2. 跋、識(獨立的段落)<br> | |||
1)跋文本身無標題:全段縮排3格 。<br> | |||
例1:g016p362( - - - 慧荃跋closer)<br> | |||
例2:g023p363 ( - - - 魏成憲并識 )<br> | |||
2)跋文本身 有標 題 (或 添加標題 ) :作一般段落 , 不縮排。<br> | |||
例1:g028p445(--- 大掄敬識)<br> | |||
例2:g016p1374(李流芳題跋)<br> | |||
3. 按語(獨立的段落)<br> | |||
全段縮排3格 , 並依底本之大小字體編輯之。<br> | |||
例1:g016p378按寺舊志云觀松在香積......<br> | |||
例2:y105p54按范浦之水來自 五 雲諸山......<br> | |||
[註] 在不影響版面之識別效果下 , 上開底本之小字體可以改大 。<br> | |||
ps. 以上規則僅是個大原則 , 若遇有特殊情況 , 得依當志之特性而做適切之調整。<br> | |||
==表格== | |||
表格 的 標記元素 :<br> | |||
<table>:以表格形式呈現、包含在直行橫列 中 的文字內容<br> | |||
<row>:包含表格中 的 一列<br> | |||
<cell>:包含表格中的一個儲存格<br> | |||
<cell rows=" 列數">:表格合併列<br> | |||
<cell cols=" 欄數">:表格合併欄<br> | |||
實例:請參見中國佛寺志 g089p0254<br> | |||
== 詩詞歌賦偈== | |||
===元素=== | |||
*<lg> ( 行組, Line Group ) 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。 | |||
*<l> (詩行)包含詩文的一行,也許是不完整的詩行。 | |||
*<caesura/> 標 記韻律詩行可能被截斷的位置 。 | |||
=== 範例=== | |||
詩文的呈現方式有二:1.作詩行。2.做長行。<br> | |||
1. 詩行格式通常不用標點,同行兩句 間 標<caesure/> , 如g007p.887 。<br> | |||
<syntaxhighlight lang="XML"> | |||
<p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇 | |||
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作序 | |||
師具表奏謝仍進頌曰: | |||
<lg><l>古佛與今佛<caesura/>同一廣長舌</l> | |||
<l>於無途轍中<caesura/>為物啟途轍</l> | |||
<l>撥開千嶂雲<caesura/>放出一輪 月</l> | |||
<l>普令大地人<caesura/>言下悉照徹</l> | |||
<l>覺亦無可圎<caesura/>幻亦無可滅</l> | |||
<l>只此無亦無<caesura/> 紅爐一點雪</l> | |||
<l>稽首佛與佛<caesura/>字字無異說</l></lg> | |||
既經乙夜之覽皇情大悅</p> | |||
※p內可包lg(已可通過validate驗證) | |||
</syntaxhighlight> | |||
2. 文章 中 夾有詩文,若做詩行格式,則 不 用引號。若必須用,則改用長行,並加標點,如g038p.174 。<br> | |||
<syntaxhighlight lang="XML"> | |||
<p> 張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池, | |||
獻詩曰 : 賊寇臨京口,王師出海邊。四方喧動地, 萬 姓共瞻天。 | |||
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p> | |||
</syntaxhighlight> | |||
===標點=== | |||
<b>按語 的 標點規則:</b><br> | |||
1. 作「據查」解<br> | |||
g049編按 : 産西門寨石之「鞏州」 , 爲今甘肅之隴西縣 。<br> | |||
g049按 : 華嚴寺 , 馮守誦《華嚴經》,感玉女饋餐......<br> | |||
g049謹按:師 , 生於 上 川 。<br> | |||
2. 作「依據」解<br> | |||
g49按《莊子》 , 瞿君字鵲子。<br> | |||
g049按大師此語 , 凡 在 峨眉遊居者 , 皆當......<br> | |||
g049按《益部方物略》: 「 海棠,有數種。<br> | |||
g077按志中,前 代 諸鉅公經此境者,其唯......<br> | |||
3. 作「依照 、查看」解<br> | |||
g049按新圖 , 稽舊聞 , 亦數 月 而竣事。<br> | |||
g049故只按舊志及諸經傳而爲證訂 。<br> | |||
g077按之 九 華碑版亦然 。<br> | |||
===詩偈的小字=== | |||
1.詩偈中,解釋上句(或同行)的註解性質的小字,可標<seg rend="font-size:small">。<br> | |||
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面 、</lg>前面)<br> | |||
(由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l>同行。<br> | |||
TEI語法的規則,seg無法標在<l></l>外面。)<br> | |||
3.詩偈中,總釋前幾首詩的註解性質的小字,可標<p><note rend="font-size:small"></note></p>。<br> | |||
=== | === 注意事項=== | ||
#<lg>與<p> 是平行的結構,故<lg> 與<p> 不可互包。應結束</p> 後,再標<lg> 。 | |||
#當詩 詞 跨頁時,照書換頁,不用顧及排版問題。 | |||
#詩偈不用標逗,詩句中間的間隔,以<caesura/> 標示。 | |||
==一頁多欄== | |||
例如:g003p0273 | |||
=[http://wiki.dila.edu.tw/pages/%E6%A8%99%E8%A8%98%E5%85%83%E7%B4%A0 標記元素]= | |||
1 頁碼<br> | |||
2 人名<br> | |||
2.1 人名規範資料的建置<br> | |||
2.2 人名標記標法<br> | |||
2.3 人名標記凡例<br> | |||
2.4 人名規範資料建檔注意事項<br> | |||
2.5 人名標記規則<br> | |||
3 地名<br> | |||
3.1 地名規範資料的建置<br> | |||
3.2 地名標記<br> | |||
3.3 地名標記凡例<br> | |||
3.4 地名規範資料建檔注意事項<br> | |||
3.5 地名標記規則<br> | |||
3.6 地名問答<br> | |||
4 時間<br> | |||
4.1 時間規範資料的查詢<br> | |||
4.2 時間標記<br> | |||
4.3 時間標記凡例<br> | |||
4.4 時間規範資料建檔注意事項<br> | |||
4.5 時間標記規則<br> | |||
4.6 民國年<br> | |||
4.6.1 時間為民國年的注意事項<br> | |||
4.6.2 時間為民國年的查法<br> | |||
4.6.3 時間屬性的變更(2011.01.20)<br> | |||
4.6.4 時間問答<br> | |||
4.7 知識備忘<br> | |||
4.8 朝代code<br> | |||
5 代名詞<br> | |||
5.1 標法<br> | |||
5.2 標記時機<br> | |||
6 註解(底本本身)<br> | |||
7 註解(dila.da)<br> | |||
8 空格<br> | |||
9 訛字處理<br> | |||
10 漏字處理<br> | |||
10.1 缺漏字<br> | |||
10.2 補字<br> | |||
11 重複字<br> | |||
12 底本本身的刪塗、訂正字<br> | |||
13 印章<br> | |||
14 上標字及頁註<br> | |||
14.1 上標字<br> | |||
14.2 頁註<br> | |||
15 圖檔<br> | |||
15.1 圖檔標記<br> | |||
15.2 特殊圖表製圖流程(Odg轉svg)<br> | |||
16 標籤label<br> | |||
=字元層次= | |||
== | ==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 佛寺志專案 特字處理]== | ||
2. | 1 作業環境<br> | ||
2 特字處理方式及工具<br> | |||
3 特字處理原則<br> | |||
3.1 有 unicode 編碼的字<br> | |||
3.1.1 易於辨識<br> | |||
3.1.2 不易辨識<br> | |||
3.2 無 unicode 編碼的 字<br> | |||
3.2.1 易於辨識<br> | |||
3.2.2 不易辨識, 有通用字<br> | |||
3.2.3 不易辨識, 無通用字<br> | |||
4 特 字處 理新規則<br> | |||
5 如何統一各志間特字處理方式<br> | |||
6 難檢字庫缺字建檔<br> | |||
7 難檢字庫缺字圖檔製 作<br> | |||
7.1 原則<br> | |||
7.2 製圖步驟<br> | |||
8 缺字呈現<br> | |||
9 unicode 編碼字<br> | |||
9.1 CJK漢字編碼範圍<br> | |||
9.2 編輯器<br> | |||
9.3 快速尋找unicode的方法<br> | |||
10 有助於增加特字處理效率的工具與方法<br> | |||
11 SVG造字<br> | |||
11.1 參閱<br> | |||
11.2 安裝<br> | |||
11.3 inkscape造字操作法<br> | |||
11.4 illustrator造字操作法<br> | |||
11.5 參考範例<br> | |||
12 參考資源<br> | |||
==標逗== | |||
===書名=== | |||
1. 書名 的 標符樣 式: 《》<br> | |||
2. 書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。<br> | |||
===結尾署語=== | |||
Q : 結尾署語<closer>中的文字是否 標 逗?<br> | |||
A : 原則 上 開放 標 點 , 適度添加 , 方便閱讀。但結束可不加句號 。<br> | |||
例如:<br> | |||
元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記<br> | |||
加上標逗:<br> | |||
< | 元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記<br> | ||
Q:closer後仍有文 字 的情況,如何標記?<br> | |||
A : 例如,於g053p247「康熙五年七月二十九日給」後 ,有 「立碑東廊」小 字 。<br> | |||
由於「立碑東廊」不屬closer的內容 , 因此在closer結束後將「立碑東廊」標註為note;<br> | |||
為了讓 文字 靠右,所以又標了一個靠右 對 齊的p。(單獨note無法靠右)<br> | |||
標 法: | |||
<xml code> | |||
<closer>康熙五年七月二十九日給</closer><note><p rend="font-size:small;text-align:right">立碑東廊</p></note></div> | |||
</xml> | |||
===詩篇名=== | |||
詩篇名 標 符樣式 : 〈〉 | |||
===偈頌=== | |||
標法:<l> 詩句<caesura/> 詩句</l><br> | |||
範例:<br> | |||
<lg><br> | |||
<l> 稽首觀音<caesura/> 大悲之主</l><br> | |||
<l> 我今說偈<caesura/> 畧讚所以</l><br> | |||
<l> 所以者何<caesura/> 所謂三摩</l><br> | |||
<l> 菩薩證入<caesura/> 常住寶陀</l><br> | |||
<lg/><br> | |||
*偈頌 中 不使用標點符號 , 詩句中 的 分隔 ,以 <caesura/> 標 示 。<br> | |||
===底本有黑點(•)白點( 。 )=== | |||
有些 寺志 底本中有黑點 ( •)白點 ( 。 ) ,這是 個 不錯的標逗參考 , 但可不必完全依照 。 標逗以文意暢達為要 。<br> | |||
例 : 江西彭澤許止淨•高慕淨•二居士•《禮觀世 音 菩薩疏》文曰 。 (g009_11_p589 )<br> | |||
可改為 : 江西彭澤許止淨、高慕淨二居士 , 《禮觀世 音 菩薩疏》文曰 :<br> | |||
==中文數 字「 零 」== | |||
中文數 字「 零 」 ,請統一用這個 「 〇 」 (unicode編碼u+3007)<br> | |||
Ps. 其餘 「 非數 字」的 圓圈符號,仍可用 「 ○ 」 。(這個○跟 上 面的〇不同)<br> | |||
==巳=已 的處理== | |||
文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方 式 :<br> | |||
在「巳=已」 的 條件下 , 一志只在第一次出現的「巳」 字 做特字標記及 註 (如下),而後出現的「巳」則直接取代為「已」。<br> | |||
<xml> | |||
第一次出現的「巳」 字 標記: | |||
<choice><orig>巳</orig><reg resp="dila.da">已</reg> | |||
<note resp="dila.da">書中「已」 字 多作「巳」,不煩標註。</note></choice> | |||
</xml> | |||
=format重整文件= | |||
*執行format.py程式,可清除多餘空格及重整元素折行設定。<br> | |||
*電腦條件:電腦中要安裝有python-3.3.0以上版本的程式<br> | |||
程式放置路徑:Z:\數位典藏組\python<br> | |||
*執行步驟:<br> | |||
1. 在(TortoiseGit)\bin\下開啟dos視窗<br> | |||
2. 在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter<br> | |||
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾<br> | |||
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)<br> | |||
5.用main檔驗證一下,若是validation,即成。<br> | |||
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。<br> | |||
(小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)<br> | |||
==如何解救亂了格式的文件?== | |||
(不小心按到Oxygen工具列的縮排按鈕時用)<br> | |||
1.<b>先將所有自動折行 的 頁碼接起來</b><br> | |||
在亂了格式的檔案下<br> | |||
→ Ctrl+F | |||
→尋找:<pb <br> | |||
facs=<br> | |||
→取代為:<pb facs=<br> | |||
→Replace All<br> | |||
→Close<br> | |||
2.<b>再將所有自動折行的lb 接 起來</b><br> | |||
在亂了格式的 檔 案下<br> | |||
→Ctrl+F<br> | |||
→尋找:<lb <br> | |||
n=<br> | |||
→取代:<lb n=<br> | |||
→Replace All<br> | |||
→Close<br> | |||
3.<b>吃掉所有tag間 的 空格</b><br> | |||
在亂了格式 的 檔案下<br> | |||
→Ctrl+F<br> | |||
→尋找:>[ \n]*<<br> | |||
→取代:><<br> | |||
→Replace All<br> | |||
→Close<br> | |||
4.<b> 檢查 文件</b><br> | |||
看看還有沒有不正常的空白。<br> | |||
5.<b>在Dos下執行git bin下的format.py</b><br> | |||
6. 在git下的output資料夾中取得檔案,看看是否可用。<br> | |||
< | =標記問答= | ||
Q:格式問題:是否照書編排?<br> | |||
A:數位文本不必全照書編排。<br> | |||
Q:敬格的情況,有空一格,有另起一行。<br> | |||
A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的標記困擾,決定不遵照底本格式。<br> | |||
即「敬格」統一都不須空格或另起一行。<br> | |||
Q:並列的文字。<br> | |||
A:不作並列標記。可 標 記縮小字<seg rend="font-size:small"> 。<br> | |||
Q : 若 印 刷錯誤, 文字 內容重複時。<br> | |||
A :可用[註]標示 。 但若有跨頁 , 頁碼要放在note的外面。<br> | |||
Q:文本若超出可處理 的 範圍,如 元 朝蒙語譯 文 。<br> | |||
A : 可不標句讀,但須於檔頭<teiHeader> 作說明。<br> | |||
Q:雙關語的 標記( 人地混雜 )<br> | |||
A:依字面 標記 元素 ,以 註解說明喻意 。<br> | |||
例1:g077p0293<br> | |||
淳氣日凋薄,<placeName key="PL000000021567"> 鄒</placeName><placeName key="PL000000021513"> 魯</placeName><note resp="dila.da">此 處「鄒魯」代指「孔孟」 。 鄒魯乃孔子和孟子 的 誕生地 。</note> 亡眞承 。<br> | |||
例2:g017p0194<br> | |||
笙歌日日娛<persName key="A008915"> 西子</persName><note resp="dila.da"> 此處 「 西子 」 代指 「 西湖 」。</note> 為愛幽閒到玉岑<br> | |||
Q :oXygen xml文件 中 ,如何取消元素 的 定義提示?<br> | |||
oXygen xml 文 件中,當將鼠標停留在TEI元素上 時,會 自動pop up出一個解釋該元素定義的小視窗;<br> | |||
這個 小 視窗有時會遮擋到文件中正要處理 的 文 字 ,造成作業的困擾。<br> | |||
A: 取消元素定義提 示的 設定步驟:<br> | |||
oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip( 不 要勾選)<br> | |||
== | =[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97PDF%E7%89%88 佛寺志PDF版]= | ||
1 凡例備忘<br> | |||
1. | 2 圖檔<br> | ||
2.1 構想<br> | |||
2.2 各志景點<br> | |||
3 佛寺志PDF版面<br> | |||
3.1 開本<br> | |||
3.2 邊界<br> | |||
3.3 行距<br> | |||
3.4 字型<br> | |||
3.5 字體大小<br> | |||
4 佛寺志PDF校訂規則<br> | |||
4.1 目錄<br> | |||
4.1.1 擷取層級<br> | |||
4.1.2 符 號 樣式<br> | |||
4.2 內文<br> | |||
4.2.1 樣式 符 號<br> | |||
4.2.2 段落 樣式<br> | |||
4.2.3 標題<br> | |||
4.2.4 人名<br> | |||
4.2.5 地名<br> | |||
4.2.6 時間<br> | |||
4.2.7 特字<br> | |||
4.2.7.1 勘誤字(底本中的錯字)<br> | |||
4.2.7.2 從缺字(易辨識,卻打不出來)<br> | |||
4.2.7.3 罕見字(難以辨識的罕見字)<br> | |||
4.2.7.4 特字的註解<br> | |||
4.2.8 註腳<br> | |||
4.2.9 詩偈<br> | |||
4.2.10 小字<br> | |||
4.2.11 補字<br> | |||
4.2.12 印章<br> | |||
4.2.13 書名<br> | |||
4.2.14 備忘<br> | |||
4.3 人名索引<br> | |||
4.4 地名索引<br> | |||
5 討論區<br> | |||
=[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%9786%E5%BF%97%E7%B2%97%E6%A8%99 佛寺志粗標]= | |||
3. | 1 電校<br> | ||
2 切檔<br> | |||
2.1 分檔方式<br> | |||
2.2 書名頁的納入<br> | |||
2.3 卷前的標記<br> | |||
2.4 書名頁 ( 出版社的 ) 的標法<br> | |||
2.5 題名頁 ( 原刻板的 ) 的標法<br> | |||
3 粗標<br> | |||
3.1 段落標記<br> | |||
3.2 行號問題<br> | |||
3.3 跨頁的表格頁碼<br> | |||
3.4 補字標記修訂 : 加resp屬性(2013.05.20)<br> | |||
3.5 「取代標記 , 但 不 取代文字」 的 正規表示式語法(in oXygen)<br> | |||
3.6 自加標題標記修訂:加supplied元素(2013.05.20)<br> | |||
3.7 隱藏的自加標題標記修訂<br> | |||
3.8 地名標題下的詩偈 , 不用標<head>(標<p>及<lg> )<br> | |||
3.9 詞的上下闕標記法<br> | |||
3.10 法語中 , 如有「 上 堂」法語 , 可分段 。<br> | |||
3.11 尾註的標法<br> | |||
3.12 印章的標法、位置<br> | |||
3.13 圖內的文字<br> | |||
4 特字處理<br> | |||
5 特殊問題<br> | |||
5.1 稿本有大量塗改的情形 , 如何標記?<br> | |||
5.2 新訂標題的原則<br> | |||
5.3 作者位置 經 標記人員移動時的註解說明<br> | |||
5.4 以程式標記詩偈<br> | |||
5.5 「全段縮排」可取代「小字」<br> | |||
5.6 長行裡的詩偈 , 目前可暫不標詩行<br> | |||
5.7 不縮排的詩行<br> | |||
5.8 錯位移正後要處理行號嗎?<br> | |||
5.9 xml文件中的「&」<br> | |||
6 標點符號問題<br> |
於 2021年4月27日 (二) 09:56 的最新修訂
回《中國佛寺史志》數位典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual)
《中國佛寺志》標記作業
另可參考:遵循 TEI 的佛學數位化 XML 標記
工作準備
1. 參考資料: 進行寺志標記前,應先找好該志的相關參考資料,例如:白話本、點校本等。 2. 檔案管理: 本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。 目前檔案資料夾分為三部份: 1)xml(已完成細標的檔案。細標是指有人名、地名、時間的標記) 2)xml-basic-g(明丹本) 3)xml-basic-y(廣陵本) 3. 作業軟體oXygen(19版)的環境設定 1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose 2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾) 3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排) 4) 呼叫結構樹 outline:window→Show View→outline (結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。) 4. 作業技巧:凡具規則性、大量性之機械式作業,應尋求以程式批次處理,避免人工重複作業。 5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。 「意義標記」著重在付予文字意義,例如:persName(人名),p(段落)。 「樣式標記」著重在樣貌的呈現,即編輯樣式,例如:lb(折行),p rend=""(段落格式)。 本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。
檔案架構
《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。
(例:重修普陀山志,代碼g008)
每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
及數個分檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。
主檔內含有版本資訊(teiHeader)、掃描圖資訊(tei:facsimile)及分檔的鍊結(text xi:include)。
分檔內則是各卷的內容。
●切檔命名規則
志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名頁等)
志碼_00:卷首(題名頁之後的內容,如:序文、目錄、山圖等)
志碼_01:卷一
志碼_02:卷二(以下依卷次類推)
志碼_back:附錄、補編等
志碼_back1:附錄、補編有多卷時,可加序號。例如附編卷一
志碼_back2:附錄、補編有多卷時,可加序號。例如附編卷二
●特殊例子的切檔
例:
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷題情勢做適當的調整)。
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6
g087_03-1,g087_03-2
加facs碼
1.執行git中的facs.py程式,為內文中的pb加上facs
例:原<pb n="0041"/>
執行程式後變成<pb facs="1B017P108.jpg" n="0041"/>
2.請網路工程師(阿賢)為main檔加facsimile
將加好pb facs的檔案,連同main檔,一併交給工程師。工程師會在main檔加入如下的標記:
<xml code>
<tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0"> <tei:graphic url="1B017P108.jpg"/> <tei:graphic url="1B017P109.jpg"/>
...... ...... </xml>
注意事項:卷內的pb facs要與main中的facsimile url同步
各卷內的頁碼有時會有錯誤,當修改pb facs碼時,請順便也要一併修改main中的facsimile url,這樣文件才會完整。
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/>
Y141_main <tei:graphic url="4B100P005.jpg"/>
文件宣告
1各卷文件宣告列,請一致用:
<?xml version="1.0" encoding="UTF-8"?>(雙引號,大寫UTF)
2缺字在檔頭宣告,其流程:
<xml code>
1)開啟main檔
2)在</fileDesc>之後加上以下的群組標記
<encodingDesc>
<charDecl> <char xml:id="Z0001"> <charName>DILA CHARACTER Z0001</charName> <charProp> <localName>CBETA</localName> (若無可省略) <value>CB30005</value> </charProp> <charProp> <localName>composition</localName> <value>[宀/廣]</value> </charProp> </char> </charDecl>
</encodingDesc> 3)在當志中,用「<g ref="#」搜尋出所有缺字。 4)逐一將缺字碼放在「DILA 難檢字庫」中檢索,將缺字資料填補入缺字宣告中。 (從缺的項目可省略)
例:g069_main </fileDesc> <encodingDesc>
<charDecl> <char xml:id="Z0393"> <charName>DILA CHARACTER Z0393</charName> <charProp> <localName>composition</localName> <value>[山*克]</value> </charProp> </char> <char xml:id="Z0523"> <charName>DILA CHARACTER Z0523</charName> <charProp> <localName>composition</localName> <value>[風*丘]</value> </charProp> </char> <char xml:id="Z0522"> <charName>DILA CHARACTER Z0522</charName> <charProp> <localName>composition</localName> <value>[山*右]</value> </charProp> </char> </charDecl>
</encodingDesc> </teiHeader> </xml>
段落形式
標題
1標題的標法
● <head>標題</head>
● <head>標題</head><byline><persName>作者</persName></byline>
● <head>標題<seg rend="font-size:small">副標題</seg></head>
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg>
● 標題小字要折行:<seg rend="font-size:small;display:block">縮小的字</seg>
● 標題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩
2自訂標題
1.全自加
<head><supplied resp="dila.da">自訂標題</supplied></head>
例:〔劉仁本題跋〕
2.半自加
<head>原標題<supplied resp="dila.da">自訂標題</supplied></head>
例:雞足山志序〔二〕
3.隱藏自加的標題
<head rend="display:none"><supplied resp="dila.da">自訂標題</supplied></head>
例:志名頁
ps. rend="display:none" 隱藏元素格式(不留白)
rend="visibility:hidden" 保留元素格式(留白)
3說明
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。
另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。
段落句首折作標題與否示例(以g074雲居山志 為例) (一)直接折作標題 原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。 範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來--- 標題:自寳禪師 內文:上堂。總恁麽風恬浪靜,那裏得來--- 範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲--- 標題:宗杲大慧禪師 內文:時圜悟詔住雲居,師往省覲--- 範例3:p82 晦山顯禪師 師在廬山歸宗寺受請,辛卯十二月廿一甲子進院--- 標題:晦山顯禪師 內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院--- 範例4:p105 復合神鐘 寺有巨鐘,明中葉院圮--- 標題:復合神鐘 內文:寺有巨鐘,明中葉院圮--- (二)依句頭另作標題[ ] 原則:若段落首句的文法成份是屬於「主詞」或「前置受詞」的,則應留作內文句頭,而另訂標題。 範例1:p65 道齊禪師 本州金氏子,徧歷禪會--- 標題:[道齊禪師] 內文:道齊禪師(主詞),本州金氏子,徧歷禪會--- 範例2:p70 克勤佛果禪師 建炎丁未歲十一月初六日,奉敕住雲居--- 標題:[克勤佛果禪師] 內文:克勤佛果禪師(主詞),建炎丁未歲十一月初六日,奉敕住雲居--- 範例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居--- 標題:[燕雷鵬禪師] 內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居--- 範例4:p103 佛印禪師 周茂叔謁見,問曰--- 標題:[佛印禪師] 內文:佛印禪師(前置受詞),周茂叔謁見,問曰--- 範例5:p106 寺左三塔 沉埋土中多年--- 標題:[寺左三塔] 內文:寺左三塔(主詞)沉埋土中多年--- ○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。
(2)標題後的副標題,可以<seg>(隨機分割)標記之。
.例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
.<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。
(3)若底本格式為「作者在標題之前」,且編輯分類是以「作者」為主時,則作者亦可作標題。
例:g028p458 厲鶚
4長詩題的另訂 關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂標題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對的理由。
5標點符號
(1)標題亦可加新式標點符號,惟結尾不用句點。
段落樣式
樣式語法
◎全段縮小字
<p rend="font-size:small">全段縮小字</p>
範例:g009p0427
◎全段縮排一個字
<p rend="margin-top:1ex;text-indent:0">縮排的段落</p>
範例:g009p0593
◎全段縮排一個字,但第一行凸排一個字
<p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落</p>
範例:g009p0023
ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。
◎第一行不縮排。(通常用在詩文夾雜的長行段落)
<p rend="text-indent:0">詩偈後接續的長行<p>
範例:g062p0104
◎靠右對齊
<p rend="text-align:right">
◎全段並排小字,有時可以調整為大字
例:g079 p.004崇眞萬壽宮
序、跋、按語之格式
1. 小序、小引
1)「詩」(詩行)前小序、小引,做一般段落,並依底本之大小字體編輯之。
例:g023卷六p371(雲林看雨圖題句小引)
2)「文」(長行)前小序、小引,全段縮排3格。
例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)
2. 跋、識(獨立的段落)
1)跋文本身無標題:全段縮排3格。
例1:g016p362( - - - 慧荃跋closer)
例2:g023p363( - - - 魏成憲并識)
2)跋文本身有標題(或添加標題):作一般段落,不縮排。
例1:g028p445(--- 大掄敬識)
例2:g016p1374(李流芳題跋)
3. 按語(獨立的段落)
全段縮排3格,並依底本之大小字體編輯之。
例1:g016p378按寺舊志云觀松在香積......
例2:y105p54按范浦之水來自五雲諸山......
[註] 在不影響版面之識別效果下,上開底本之小字體可以改大。
ps.以上規則僅是個大原則,若遇有特殊情況,得依當志之特性而做適切之調整。
表格
表格的標記元素:
<table>:以表格形式呈現、包含在直行橫列中的文字內容
<row>:包含表格中的一列
<cell>:包含表格中的一個儲存格
<cell rows="列數">:表格合併列
<cell cols="欄數">:表格合併欄
實例:請參見中國佛寺志 g089p0254
詩詞歌賦偈
元素
- <lg>(行組, Line Group)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
- <l>(詩行)包含詩文的一行,也許是不完整的詩行。
- <caesura/> 標記韻律詩行可能被截斷的位置。
範例
詩文的呈現方式有二:1.作詩行。2.做長行。
1. 詩行格式通常不用標點,同行兩句間標<caesure/>,如g007p.887。
<p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作序
師具表奏謝仍進頌曰:
<lg><l>古佛與今佛<caesura/>同一廣長舌</l>
<l>於無途轍中<caesura/>為物啟途轍</l>
<l>撥開千嶂雲<caesura/>放出一輪月</l>
<l>普令大地人<caesura/>言下悉照徹</l>
<l>覺亦無可圎<caesura/>幻亦無可滅</l>
<l>只此無亦無<caesura/>紅爐一點雪</l>
<l>稽首佛與佛<caesura/>字字無異說</l></lg>
既經乙夜之覽皇情大悅</p>
※p內可包lg(已可通過validate驗證)
2. 文章中夾有詩文,若做詩行格式,則不用引號。若必須用,則改用長行,並加標點,如g038p.174。
<p>張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池,
獻詩曰:賊寇臨京口,王師出海邊。四方喧動地,萬姓共瞻天。
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p>
標點
按語的標點規則:
1. 作「據查」解
g049編按:産西門寨石之「鞏州」,爲今甘肅之隴西縣 。
g049按:華嚴寺,馮守誦《華嚴經》,感玉女饋餐......
g049謹按:師,生於上川 。
2. 作「依據」解
g49按《莊子》,瞿君字鵲子。
g049按大師此語,凡在峨眉遊居者,皆當......
g049按《益部方物略》:「海棠,有數種。
g077按志中,前代諸鉅公經此境者,其唯......
3. 作「依照 、查看」解
g049按新圖,稽舊聞,亦數月而竣事。
g049故只按舊志及諸經傳而爲證訂。
g077按之九華碑版亦然。
詩偈的小字
1.詩偈中,解釋上句(或同行)的註解性質的小字,可標<seg rend="font-size:small">。
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面、</lg>前面)
(由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l>同行。
TEI語法的規則,seg無法標在<l></l>外面。)
3.詩偈中,總釋前幾首詩的註解性質的小字,可標<p><note rend="font-size:small"></note></p>。
注意事項
- <lg>與<p>是平行的結構,故<lg>與<p>不可互包。應結束</p>後,再標<lg>。
- 當詩詞跨頁時,照書換頁,不用顧及排版問題。
- 詩偈不用標逗,詩句中間的間隔,以<caesura/>標示。
一頁多欄
例如:g003p0273
標記元素
1 頁碼
2 人名
2.1 人名規範資料的建置
2.2 人名標記標法
2.3 人名標記凡例
2.4 人名規範資料建檔注意事項
2.5 人名標記規則
3 地名
3.1 地名規範資料的建置
3.2 地名標記
3.3 地名標記凡例
3.4 地名規範資料建檔注意事項
3.5 地名標記規則
3.6 地名問答
4 時間
4.1 時間規範資料的查詢
4.2 時間標記
4.3 時間標記凡例
4.4 時間規範資料建檔注意事項
4.5 時間標記規則
4.6 民國年
4.6.1 時間為民國年的注意事項
4.6.2 時間為民國年的查法
4.6.3 時間屬性的變更(2011.01.20)
4.6.4 時間問答
4.7 知識備忘
4.8 朝代code
5 代名詞
5.1 標法
5.2 標記時機
6 註解(底本本身)
7 註解(dila.da)
8 空格
9 訛字處理
10 漏字處理
10.1 缺漏字
10.2 補字
11 重複字
12 底本本身的刪塗、訂正字
13 印章
14 上標字及頁註
14.1 上標字
14.2 頁註
15 圖檔
15.1 圖檔標記
15.2 特殊圖表製圖流程(Odg轉svg)
16 標籤label
字元層次
佛寺志專案 特字處理
1 作業環境
2 特字處理方式及工具
3 特字處理原則
3.1 有 unicode 編碼的字
3.1.1 易於辨識
3.1.2 不易辨識
3.2 無 unicode 編碼的字
3.2.1 易於辨識
3.2.2 不易辨識, 有通用字
3.2.3 不易辨識, 無通用字
4 特字處理新規則
5 如何統一各志間特字處理方式
6 難檢字庫缺字建檔
7 難檢字庫缺字圖檔製作
7.1 原則
7.2 製圖步驟
8 缺字呈現
9 unicode 編碼字
9.1 CJK漢字編碼範圍
9.2 編輯器
9.3 快速尋找unicode的方法
10 有助於增加特字處理效率的工具與方法
11 SVG造字
11.1 參閱
11.2 安裝
11.3 inkscape造字操作法
11.4 illustrator造字操作法
11.5 參考範例
12 參考資源
標逗
書名
1.書名的標符樣式:《》
2.書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。
結尾署語
Q:結尾署語<closer>中的文字是否標逗?
A:原則上開放標點,適度添加,方便閱讀。但結束可不加句號。
例如:
元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記
加上標逗:
元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記
Q:closer後仍有文字的情況,如何標記?
A:例如,於g053p247「康熙五年七月二十九日給」後,有「立碑東廊」小字。
由於「立碑東廊」不屬closer的內容,因此在closer結束後將「立碑東廊」標註為note;
為了讓文字靠右,所以又標了一個靠右對齊的p。(單獨note無法靠右)
標法:
<xml code>
<closer>康熙五年七月二十九日給</closer><note>
立碑東廊
</note>
</xml>
詩篇名
詩篇名標符樣式:〈〉
偈頌
標法:<l>詩句<caesura/>詩句</l>
範例:
<lg>
<l>稽首觀音<caesura/>大悲之主</l>
<l>我今說偈<caesura/>畧讚所以</l>
<l>所以者何<caesura/>所謂三摩</l>
<l>菩薩證入<caesura/>常住寶陀</l>
<lg/>
*偈頌中不使用標點符號,詩句中的分隔,以 <caesura/> 標示。
底本有黑點(•)白點(。)
有些寺志底本中有黑點(•)白點(。),這是個不錯的標逗參考,但可不必完全依照。標逗以文意暢達為要。
例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)
可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰:
中文數字「零」
中文數字「零」,請統一用這個「〇」(unicode編碼u+3007)
Ps. 其餘「非數字」的圓圈符號,仍可用「○」。(這個○跟上面的〇不同)
巳=已 的處理
文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方式:
在「巳=已」的條件下,一志只在第一次出現的「巳」字做特字標記及註(如下),而後出現的「巳」則直接取代為「已」。
<xml>
第一次出現的「巳」字標記:
<choice><orig>巳</orig><reg resp="dila.da">已</reg>
<note resp="dila.da">書中「已」字多作「巳」,不煩標註。</note></choice>
</xml>
format重整文件
*執行format.py程式,可清除多餘空格及重整元素折行設定。
*電腦條件:電腦中要安裝有python-3.3.0以上版本的程式
程式放置路徑:Z:\數位典藏組\python
*執行步驟:
1.在(TortoiseGit)\bin\下開啟dos視窗
2.在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)
5.用main檔驗證一下,若是validation,即成。
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。
(小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)
如何解救亂了格式的文件?
(不小心按到Oxygen工具列的縮排按鈕時用)
1.先將所有自動折行的頁碼接起來
在亂了格式的檔案下
→ Ctrl+F
→尋找:<pb
facs=
→取代為:<pb facs=
→Replace All
→Close
2.再將所有自動折行的lb接起來
在亂了格式的檔案下
→Ctrl+F
→尋找:<lb
n=
→取代:<lb n=
→Replace All
→Close
3.吃掉所有tag間的空格
在亂了格式的檔案下
→Ctrl+F
→尋找:>[ \n]*<
→取代:><
→Replace All
→Close
4.檢查文件
看看還有沒有不正常的空白。
5.在Dos下執行git bin下的format.py
6.在git下的output資料夾中取得檔案,看看是否可用。
標記問答
Q:格式問題:是否照書編排?
A:數位文本不必全照書編排。
Q:敬格的情況,有空一格,有另起一行。
A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的標記困擾,決定不遵照底本格式。
即「敬格」統一都不須空格或另起一行。
Q:並列的文字。
A:不作並列標記。可標記縮小字<seg rend="font-size:small">。
Q:若印刷錯誤,文字內容重複時。
A:可用[註]標示。但若有跨頁,頁碼要放在note的外面。
Q:文本若超出可處理的範圍,如元朝蒙語譯文。
A:可不標句讀,但須於檔頭<teiHeader>作說明。
Q:雙關語的標記(人地混雜)
A:依字面標記元素,以註解說明喻意。
例1:g077p0293
淳氣日凋薄,<placeName key="PL000000021567">鄒</placeName><placeName key="PL000000021513">魯</placeName><note resp="dila.da">此處「鄒魯」代指「孔孟」。鄒魯乃孔子和孟子的誕生地。</note>亡眞承。
例2:g017p0194
笙歌日日娛<persName key="A008915">西子</persName><note resp="dila.da">此處「西子」代指「西湖」。</note> 為愛幽閒到玉岑
Q:oXygen xml文件中,如何取消元素的定義提示?
oXygen xml文件中,當將鼠標停留在TEI元素上時,會自動pop up出一個解釋該元素定義的小視窗;
這個小視窗有時會遮擋到文件中正要處理的文字,造成作業的困擾。
A:取消元素定義提示的設定步驟:
oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip(不要勾選)
佛寺志PDF版
1 凡例備忘
2 圖檔
2.1 構想
2.2 各志景點
3 佛寺志PDF版面
3.1 開本
3.2 邊界
3.3 行距
3.4 字型
3.5 字體大小
4 佛寺志PDF校訂規則
4.1 目錄
4.1.1 擷取層級
4.1.2 符號樣式
4.2 內文
4.2.1 樣式符號
4.2.2 段落樣式
4.2.3 標題
4.2.4 人名
4.2.5 地名
4.2.6 時間
4.2.7 特字
4.2.7.1 勘誤字(底本中的錯字)
4.2.7.2 從缺字(易辨識,卻打不出來)
4.2.7.3 罕見字(難以辨識的罕見字)
4.2.7.4 特字的註解
4.2.8 註腳
4.2.9 詩偈
4.2.10 小字
4.2.11 補字
4.2.12 印章
4.2.13 書名
4.2.14 備忘
4.3 人名索引
4.4 地名索引
5 討論區
佛寺志粗標
1 電校
2 切檔
2.1 分檔方式
2.2 書名頁的納入
2.3 卷前的標記
2.4 書名頁(出版社的)的標法
2.5 題名頁(原刻板的)的標法
3 粗標
3.1 段落標記
3.2 行號問題
3.3 跨頁的表格頁碼
3.4 補字標記修訂:加resp屬性(2013.05.20)
3.5 「取代標記,但不取代文字」的正規表示式語法(in oXygen)
3.6 自加標題標記修訂:加supplied元素(2013.05.20)
3.7 隱藏的自加標題標記修訂
3.8 地名標題下的詩偈,不用標<head>(標
及<lg>)
3.9 詞的上下闕標記法
3.10 法語中,如有「上堂」法語,可分段。
3.11 尾註的標法
3.12 印章的標法、位置
3.13 圖內的文字
4 特字處理
5 特殊問題
5.1 稿本有大量塗改的情形,如何標記?
5.2 新訂標題的原則
5.3 作者位置經標記人員移動時的註解說明
5.4 以程式標記詩偈
5.5 「全段縮排」可取代「小字」
5.6 長行裡的詩偈,目前可暫不標詩行
5.7 不縮排的詩行
5.8 錯位移正後要處理行號嗎?
5.9 xml文件中的「&」
6 標點符號問題