「《中國佛寺史志》標記作業」:修訂間差異
imported>Miaomiao |
imported>Miaomiao (→特字) |
||
行 1,015: | 行 1,015: | ||
=字元層次= | =字元層次= | ||
== | ==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%9786%E5%BF%97%E7%B2%97%E6%A8%99 佛寺志專案 特字處理]== | ||
1 作業環境<br> | |||
2 特字處理方式及工具<br> | |||
3 特字處理原則<br> | |||
3.1 有 unicode 編碼的字<br> | |||
3.1.1 易於辨識<br> | |||
3.1.2 不易辨識<br> | |||
3.2 無 unicode 編碼的字<br> | |||
3.2.1 易於辨識<br> | |||
3.2.2 不易辨識, 有通用 字<br> | |||
3.2.3 不易辨識, 無通用字<br> | |||
4 特字處理新規則<br> | |||
5 如何 統一 各志間特字處理方式<br> | |||
6 難檢字庫缺字建檔<br> | |||
7 難檢字庫缺字圖檔製作<br> | |||
7.1 原則<br> | |||
7.2 製圖步驟<br> | |||
8 缺字呈現<br> | |||
9 unicode 編碼字<br> | |||
9.1 CJK漢字編碼範圍<br> | |||
9.2 編 輯器<br> | |||
9.3 快速尋找unicode的方法<br> | |||
10 有助於增加特字處理效率的工具與方法<br> | |||
11 SVG造字<br> | |||
11.1 參閱<br> | |||
11.2 安裝<br> | |||
11.3 inkscape造字操作法<br> | |||
11.4 illustrator造字操作法<br> | |||
11.5 參考範例<br> | |||
12 參考資源<br> | |||
==標逗== | ==標逗== |
於 2019年5月5日 (日) 14:26 的修訂
回《中國佛寺史志》數位典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual)
《中國佛寺志》標記作業
工作準備
1. 參考資料: 進行寺志標記前,應先找好該志的相關參考資料,例如:白話本、點校本等。 2. 檔案管理: 本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。 目前檔案資料夾分為三部份: 1)xml(已完成細標的檔案。細標是指有人名、地名、時間的標記) 2)xml-basic-g(明丹本) 3)xml-basic-y(廣陵本) 3. 作業軟體oXygen(19版)的環境設定 1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose 2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾) 3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排) 4) 呼叫結構樹 outline:window→Show View→outline (結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。) 4. 作業技巧:凡具規則性、大量性之機械式作業,應尋求以程式批次處理,避免人工重複作業。 5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。 「意義標記」著重在付予文字意義,例如:persName(人名),p(段落)。 「樣式標記」著重在樣貌的呈現,即編輯樣式,例如:lb(折行),p rend=""(段落格式)。 本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。
檔案架構
《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。
(例:重修普陀山志,代碼g008)
每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
及數個分檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。
主檔內含有版本資訊(teiHeader)、掃描圖資訊(tei:facsimile)及分檔的鍊結(text xi:include)。
分檔內則是各卷的內容。
●切檔命名規則
志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名頁等)
志碼_00:卷首(題名頁之後的內容,如:序文、目錄、山圖等)
志碼_01:卷一
志碼_02:卷二(以下依卷次類推)
志碼_back:附錄、補編等
志碼_back1:附錄、補編有多卷時,可加序號。例如附編卷一
志碼_back2:附錄、補編有多卷時,可加序號。例如附編卷二
●特殊例子的切檔
例:
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷題情勢做適當的調整)。
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6
g087_03-1,g087_03-2
加facs碼
1.執行git中的facs.py程式,為內文中的pb加上facs
例:原<pb n="0041"/>
執行程式後變成<pb facs="1B017P108.jpg" n="0041"/>
2.請網路工程師(阿賢)為main檔加facsimile
將加好pb facs的檔案,連同main檔,一併交給工程師。工程師會在main檔加入如下的標記:
<xml code>
<tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0"> <tei:graphic url="1B017P108.jpg"/> <tei:graphic url="1B017P109.jpg"/>
...... ...... </xml>
注意事項:卷內的pb facs要與main中的facsimile url同步
各卷內的頁碼有時會有錯誤,當修改pb facs碼時,請順便也要一併修改main中的facsimile url,這樣文件才會完整。
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/>
Y141_main <tei:graphic url="4B100P005.jpg"/>
文件宣告
1各卷文件宣告列,請一致用:
<?xml version="1.0" encoding="UTF-8"?>(雙引號,大寫UTF)
2缺字在檔頭宣告,其流程:
<xml code>
1)開啟main檔
2)在</fileDesc>之後加上以下的群組標記
<encodingDesc>
<charDecl> <char xml:id="Z0001"> <charName>DDBC CHARACTER Z0001</charName> <charProp> <localName>CBETA</localName> (若無可省略) <value>CB30005</value> </charProp> <charProp> <localName>composition</localName> <value>[宀/廣]</value> </charProp> </char> </charDecl>
</encodingDesc> 3)在當志中,用「<g ref="#」搜尋出所有缺字。 4)逐一將缺字碼放在「DDBC 難檢字庫」中檢索,將缺字資料填補入缺字宣告中。 (從缺的項目可省略)
例:g069_main </fileDesc> <encodingDesc>
<charDecl> <char xml:id="Z0393"> <charName>DDBC CHARACTER Z0393</charName> <charProp> <localName>composition</localName> <value>[山*克]</value> </charProp> </char> <char xml:id="Z0523"> <charName>DDBC CHARACTER Z0523</charName> <charProp> <localName>composition</localName> <value>[風*丘]</value> </charProp> </char> <char xml:id="Z0522"> <charName>DDBC CHARACTER Z0522</charName> <charProp> <localName>composition</localName> <value>[山*右]</value> </charProp> </char> </charDecl>
</encodingDesc> </teiHeader> </xml>
段落形式
標題
1標題的標法
● <head>標題</head>
● <head>標題</head><byline><persName>作者</persName></byline>
● <head>標題<seg rend="font-size:small">副標題</seg></head>
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg>
● 標題小字要折行:<seg rend="font-size:small;display:block">縮小的字</seg>
● 標題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩
2自訂標題
1.全自加
<head><supplied resp="ddbc.da">自訂標題</supplied></head>
例:〔劉仁本題跋〕
2.半自加
<head>原標題<supplied resp="ddbc.da">自訂標題</supplied></head>
例:雞足山志序〔二〕
3.隱藏自加的標題
<head rend="display:none"><supplied resp="ddbc.da">自訂標題</supplied></head>
例:志名頁
ps. rend="display:none" 隱藏元素格式(不留白)
rend="visibility:hidden" 保留元素格式(留白)
3說明
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。
另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。
段落句首折作標題與否示例(以g074雲居山志 為例) (一)直接折作標題 原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。 範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來--- 標題:自寳禪師 內文:上堂。總恁麽風恬浪靜,那裏得來--- 範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲--- 標題:宗杲大慧禪師 內文:時圜悟詔住雲居,師往省覲--- 範例3:p82 晦山顯禪師 師在廬山歸宗寺受請,辛卯十二月廿一甲子進院--- 標題:晦山顯禪師 內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院--- 範例4:p105 復合神鐘 寺有巨鐘,明中葉院圮--- 標題:復合神鐘 內文:寺有巨鐘,明中葉院圮--- (二)依句頭另作標題[ ] 原則:若段落首句的文法成份是屬於「主詞」或「前置受詞」的,則應留作內文句頭,而另訂標題。 範例1:p65 道齊禪師 本州金氏子,徧歷禪會--- 標題:[道齊禪師] 內文:道齊禪師(主詞),本州金氏子,徧歷禪會--- 範例2:p70 克勤佛果禪師 建炎丁未歲十一月初六日,奉敕住雲居--- 標題:[克勤佛果禪師] 內文:克勤佛果禪師(主詞),建炎丁未歲十一月初六日,奉敕住雲居--- 範例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居--- 標題:[燕雷鵬禪師] 內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居--- 範例4:p103 佛印禪師 周茂叔謁見,問曰--- 標題:[佛印禪師] 內文:佛印禪師(前置受詞),周茂叔謁見,問曰--- 範例5:p106 寺左三塔 沉埋土中多年--- 標題:[寺左三塔] 內文:寺左三塔(主詞)沉埋土中多年--- ○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。
(2)標題後的副標題,可以<seg>(隨機分割)標記之。
.例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
.<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。
(3)若底本格式為「作者在標題之前」,且編輯分類是以「作者」為主時,則作者亦可作標題。
例:g028p458 厲鶚
4長詩題的另訂 關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂標題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對的理由。
5標點符號
(1)標題亦可加新式標點符號,惟結尾不用句點。
段落樣式
樣式語法
◎全段縮小字
<p rend="font-size:small">全段縮小字</p>
範例:g009p0427
◎全段縮排一個字
<p rend="margin-top:1ex;text-indent:0">縮排的段落</p>
範例:g009p0593
◎全段縮排一個字,但第一行凸排一個字
<p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落</p>
範例:g009p0023
ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。
◎第一行不縮排。(通常用在詩文夾雜的長行段落)
<p rend="text-indent:0">詩偈後接續的長行<p>
範例:g062p0104
◎靠右對齊
<p rend="text-align:right">
◎全段並排小字,有時可以調整為大字
例:g079 p.004崇眞萬壽宮
序、跋、按語之格式
1. 小序、小引
1)「詩」(詩行)前小序、小引,做一般段落,並依底本之大小字體編輯之。
例:g023卷六p371(雲林看雨圖題句小引)
2)「文」(長行)前小序、小引,全段縮排3格。
例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)
2. 跋、識(獨立的段落)
1)跋文本身無標題:全段縮排3格。
例1:g016p362( - - - 慧荃跋closer)
例2:g023p363( - - - 魏成憲并識)
2)跋文本身有標題(或添加標題):作一般段落,不縮排。
例1:g028p445(--- 大掄敬識)
例2:g016p1374(李流芳題跋)
3. 按語(獨立的段落)
全段縮排3格,並依底本之大小字體編輯之。
例1:g016p378按寺舊志云觀松在香積......
例2:y105p54按范浦之水來自五雲諸山......
[註] 在不影響版面之識別效果下,上開底本之小字體可以改大。
ps.以上規則僅是個大原則,若遇有特殊情況,得依當志之特性而做適切之調整。
表格
表格的標記元素:
<table>:以表格形式呈現、包含在直行橫列中的文字內容
<row>:包含表格中的一列
<cell>:包含表格中的一個儲存格
<cell rows="列數">:表格合併列
<cell cols="欄數">:表格合併欄
實例:請參見中國佛寺志 g089p0254
詩詞歌賦偈
元素
- <lg>(行組, Line Group)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
- <l>(詩行)包含詩文的一行,也許是不完整的詩行。
- <caesura/> 標記韻律詩行可能被截斷的位置。
範例
詩文的呈現方式有二:1.作詩行。2.做長行。
1. 詩行格式通常不用標點,同行兩句間標<caesure/>,如g007p.887。
<p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作序
師具表奏謝仍進頌曰:
<lg><l>古佛與今佛<caesura/>同一廣長舌</l>
<l>於無途轍中<caesura/>為物啟途轍</l>
<l>撥開千嶂雲<caesura/>放出一輪月</l>
<l>普令大地人<caesura/>言下悉照徹</l>
<l>覺亦無可圎<caesura/>幻亦無可滅</l>
<l>只此無亦無<caesura/>紅爐一點雪</l>
<l>稽首佛與佛<caesura/>字字無異說</l></lg>
既經乙夜之覽皇情大悅</p>
※p內可包lg(已可通過validate驗證)
2. 文章中夾有詩文,若做詩行格式,則不用引號。若必須用,則改用長行,並加標點,如g038p.174。
<p>張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池,
獻詩曰:賊寇臨京口,王師出海邊。四方喧動地,萬姓共瞻天。
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p>
標點
按語的標點規則:
1. 作「據查」解
g049編按:産西門寨石之「鞏州」,爲今甘肅之隴西縣 。
g049按:華嚴寺,馮守誦《華嚴經》,感玉女饋餐......
g049謹按:師,生於上川 。
2. 作「依據」解
g49按《莊子》,瞿君字鵲子。
g049按大師此語,凡在峨眉遊居者,皆當......
g049按《益部方物略》:「海棠,有數種。
g077按志中,前代諸鉅公經此境者,其唯......
3. 作「依照 、查看」解
g049按新圖,稽舊聞,亦數月而竣事。
g049故只按舊志及諸經傳而爲證訂。
g077按之九華碑版亦然。
詩偈的小字
1.詩偈中,解釋上句(或同行)的註解性質的小字,可標<seg rend="font-size:small">。
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面、</lg>前面)
(由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l>同行。
TEI語法的規則,seg無法標在<l></l>外面。)
3.詩偈中,總釋前幾首詩的註解性質的小字,可標<p><note rend="font-size:small"></note></p>。
注意事項
- <lg>與<p>是平行的結構,故<lg>與<p>不可互包。應結束</p>後,再標<lg>。
- 當詩詞跨頁時,照書換頁,不用顧及排版問題。
- 詩偈不用標逗,詩句中間的間隔,以<caesura/>標示。
一頁多欄
例如:g003p0273
標記元素
頁碼
1頁碼放置的位置:置於<div>與<head>之間。
例1:<div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0">
<pb facs="1B009P003.jpg" n="0000a"/>
<head resp="ddbc.da">普陀山志卷前</head>
例2:<div>
<pb facs="1B009P022.jpg" n="0003"/>
<head>重修普陀志叙</head>
2版本說明頁的頁碼、卷之前無頁碼的頁碼
格式:第一頁0000a,第二頁0000b,第三頁0000c
例:<div>
<pb facs="1B009P003.jpg" n="0000a"/>
<head resp="ddbc.da">版本說明</head>
ps.由於卷首需要一個頁碼,因此「版本說明」的頁碼會被挪移到當卷第一個<head>之前。
(見頁碼放置的位置例1)
3插圖頁的頁碼
格式:插圖前頁頁碼+a
例:<pb facs="xBxxxPxxx n="0123a""/>
4空白頁
需標上當頁頁碼
例:<pb facs="1B009P043.jpg" n="0024"/>
5內文頁碼
<pb facs="1B009P294.jpg" n="0275"/>
人名
人名規範資料的建置
(若欲建檔,請先以帳號密碼登入)
● 人名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/person/
● 人名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 編輯「人名規範資料庫」
● 人名規範資料的問題討論,請參閱「佛學規範資料庫」答客問
人名標記標法
●<persName key="Axxxxxx">某某某</persName>
●<persName key="unknown">未知身份的人名</persName>
●<persName key="Gxxxxxx">人名群組</persName>
●<roleName>稱謂</roleName>(須包在<persName>內)
●<roleName type="honorific">尊稱</roleName>(須包在<persName>內)
●<name>族姓</name>
人名標記凡例
persName的定義:姓,名,字,號,諡號,慣稱。
roleName的定義:上述persName之外的名稱。
稱謂型態 | 凡例 | 標記 |
---|---|---|
官稱 |
|
|
地名當人名 |
|
|
連名 |
|
|
子 |
|
|
兒 |
|
|
公 |
|
|
氏 |
|
|
師、本師 |
|
|
大士、菩薩 |
|
|
山人 |
|
|
上人 |
|
|
老 |
|
|
老人 |
|
|
翁 |
|
|
先生 |
|
|
夫人 |
|
|
諡號 |
|
|
皇帝(皇后) |
|
|
帥 |
|
|
君 |
|
|
諱 |
|
|
人名規範資料建檔注意事項
(1) 名字:
a) 常名、別名請冠上姓氏,以便利檢索。
b) 每一語系中,應有一常名,餘則為別名。
(2) 特別字:人名中有打不出的字時,人名欄位以通用字表示。
(3) 朝代:以此人的卒年為依。
(4) 籍貫:其地名以此人的生年朝代為依。
(5) 生卒年
a) 生年的計算:生年=卒年-歲壽+1
b) 生卒年的取捨:若資料來源有干支年及西元年,以取干支年或中曆年為準。
例:重顯(980~1052),宋代雲門宗僧。於皇祐四年入寂。
建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),
而不用1052年(1052-01-01~1052-12-31)。
(6) 是否為歷史人物:若非歷史人物,則在此欄位勾「否」。
(7) 註解:
a) 以120個字為限(阿拉伯數字不算字數,標點符號算字數),並請使用全形標點符號。
b) 若此人查不到生卒年,則應在註解欄的資料中盡可能節錄相關人事物的時間參考點。
c) 僧人註解資料的基本要件:師承、師兄弟、著作、法嗣、事件時間。
d) 引用資料,盡量以紙本、藏經或佛學辭典為優先。
使用網路資料時,應注意留存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。
e) 引用資料時須註明資料來源。出處的作用:1).說明資料來源 2).幫助使用者搜尋(Finding Aid)
f)「佛學規範資料庫」對於經常引用的參考工具書編有「簡稱」,引用這些參考書時請以這些「簡稱」為依。
g) Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。
(8) 若是查詢不到任何資料的人名,請不用收錄至規範資料庫。(文本上標 key="unknown" 即可)
人名標記規則
1 文本中出現的人名,皆應標記。(例外:書名號內的人名,不標記。)
但對於文意不確定是否為人名者,則不標記。寧缺勿濫。
2 標題後的人名是「作者」時的標法
<head>標題</head><byline><persName key="Axxxxxx">作者名</persname></byline>
(<byline>:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
3 遇人名不確定是否為某人時,可加屬性值標示。
例:<persName key="A001606" cert="70%">
cert是表示標記者認為的正確度,是相對值,非絕對的。
4 非人,非人界皆要標記。(2011/1/27回函決議)
5 關於「姓氏」的類型(需配合前後文意定位),大致分為三類。
<xml code>
1. 特指某人、某女性(隱名,或無名,以姓代稱)
例:盛熙明氏、能仁氏、吳氏、母王氏、菊潭氏、葛周氏
標記:<persName key="">盛熙明<roleName type="honorific">氏</roleName></persName>
<persName key="">能仁<roleName type="honorific">氏</roleName></persName>
<persName key="">吳<roleName type="honorific">氏</roleName></persName>
母<persName key="">王<roleName type="honorific">氏</roleName></persName>
網頁呈現:姓畫底線,氏畫虛線(Excel中無法呈現虛線,暫以雙底線代),
紅字+底線(表示有人名資料連結)
2. 族姓。 例:張氏子、姓周氏 標記:<name>張</name>氏子 姓<name>周</name>氏 網頁呈現:姓畫底線,黑字(表示無人名資料連結)
3. 指教派、學說、職稱。 例:儒氏、佛氏、釋氏、浮屠氏、老氏、職方氏、野史氏、師氏、母氏、舅氏 標記:不標記人名 網頁呈現:同一般內文格式,黑字。 </xml>
6 代名詞標記
代名詞類別:
1.指示代名詞(此、彼、其、之)
2.人稱代名詞(吾、汝)
3.稱謂代名詞(省略人名所得的:氏、先生、皇帝)
4.借稱代名詞(轉變來的:鄒魯、侍御、善人)
一般印刷品的做法:
1.2.3.都不處理(無底線),4.可以用註解(類似典故之註)或標<ref>。
地名
地名規範資料的建置
(若欲建檔,請先以帳號密碼登入)
● 地名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/place/
● 地名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 編輯「地名規範資料庫」
● 地名規範資料的問題討論,請參閱「佛學規範資料庫」答客問
地名標記
● <placeName key="xxxxxxxxxxxxxx">地名</placeName>
● <placeName key="unknown">未知位置的地名</placeName>
● <placeName key="xxxxxxxxxGxxxx">地名群組</placeName></xml>
地名標記凡例
型態 | 凡例 | 標記 | |
---|---|---|---|
單純行政區地名 | 杭州 | <placeName key="CN0330103Z19AA">杭州</placeName>
(需配合文意而選擇朝代別) | |
單純自然區地名 | 普陀山 | <placeName key="CN0330903M01AA">普陀山</placeName> | |
連名 | 四川峨眉縣 | <placeName key="CN0511181Z02AA">四川峨眉縣</placeName>
(以連名的最小地點為其ID) | |
地名中含人名 | 遂賜額曰「天花尊者開巖院」 | <placeName key="CN0331023T57AA"><persName key="unknown">天花尊者</persName>開巖院</placeName> | |
寺內建築:一般 | 大雄寶殿、放生池 | 文本不標,資料庫不建 | |
寺內建築:具特殊意義 | 阿育王寺舍利塔殿 | 文本應標,資料庫應建 | |
地名群組 | 五嶽 | <placeName key="CN0000000G07AA">五嶽</placeName> |
地名規範資料建檔注意事項
(1)地名尾碼非AA碼者,不可重新編碼,因為會牽涉到相同主碼的其他地名。
(2)Google map與衛星圖的經緯度有落差,在標經緯度時以衛星圖為主。
(3)地名的建置,註解欄注意事項請參閱4人名規範資料建檔注意事項內有關註解的條目。
地名標記規則
● 文本中出現的地名,皆應標記。
● 非人界、傳說中的地名,不用標記、建檔。
地名問答
●Q:開元寺志中有許多建築(例:紫雲大殿、法堂等),皆有精確經緯度,是否標記地名?
A:同其他志的規則,建築不用標記。
時間
時間規範資料的查詢
(若欲查詢,請先以帳號密碼登入)
● 時間規範資料庫網頁 http://dev.ddbc.edu.tw/authority/time/
● 時間規範資料的問題討論,請參閱「佛學規範資料庫」答客問
時間標記
● <date key="j+(起始時間碼)+(結尾時間碼)" notBefore-iso="起始西元年-月-日" notAfter-iso="結尾西元年-月-日">區段性的某時間</date>
● <date key="j+(開始時間碼)+(結束時間碼)" from-iso="開始西元年-月-日" to-iso="結束西元年月日">事件持續進行的時間</date>
● <date key="j+(當日時間碼)+(當日時間碼)" when-iso="西元年-月-日">時間點</date>
● <date key="unknown">未知的時間</date>
*ISO標準:由於DDBC時間資料庫是依照ISO_8601-2004_E所發佈的標準,採用格里曆曆法推算的時間,所以時間屬性使用when-iso,notBefore-iso,notAfter-iso。
時間標記凡例
時間型態 | 凡例 | 標記 |
---|---|---|
區段性的某時間 | 余以光緒己卯游天台 | <date key="j24073722407755" notBefore-iso="1879-01-22" notAfter-iso="1880-02-09">光緒己卯< /date>
說明:a)key2407372:光緒己卯年正月一日ID |
明確日期 | 萬曆庚戌年五月十六日 | <date key="j23092772309277" when-iso="1610-06-26">萬曆庚戌年五月十六日</date> |
時間規範資料建檔注意事項
(1)佛寺志專案使用Julian day number時間系統,請確認介面是否選用此項。
(2)若未「登入」時間規範資料庫,查詢結果將不會自動計算「初年」、「末年」等較詳細之資訊。
(3)時間的查詢有多種管道:中國年(朝代、帝號、年號、年干支),西元年(三種方式),ID碼。
時間標記規則
1 有明確年號、年代、或月日等的時間,皆應標記;
無法證知(從前後文或其他資料皆無法得知)的時間,則可標記<date key="unknown">未知年的時間</date>。
2 初年,末年時間的擷取原則
取當朝(或當年號)的最前1/4為其「初」,最後1/4為其「末」。(程式自動計算)
民國年
時間為民國年的注意事項
- 民國十三年 → 用西曆
- 民國十三年冬 → 標示西曆民國十三年12月~民國十四年2月 (西曆:春3-5月,夏6-8月,秋9-11月,冬12-2月)
- 民國十三年甲子 → 用農曆民國甲子年
- 民國十三年甲子冬 → 用農曆民國甲子年10~12月
時間為民國年的查法
登入網頁「兩千年中西曆轉換」http://sinocal.sinica.edu.tw/, 兌換出相對應的西元時間,再到時間規範資料庫換算ID碼即可。
例:民國壬寅年,兌換出為西元1962年2月5日~1963年1月24日
再到時間規範資料庫以西元年查詢為 5949266~5949619
即 <date key="d59492665949619" notBefore="1962-02-05" notAfter="1963-01-24">
時間屬性的變更(2011.01.20)
notBefore,notAfter,from,to,when,全要加上-iso(計算0年)
如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso
例:<date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13">哀帝元壽間</date>
時間問答
1 萬 丙子秋(=萬曆丙子秋)
例:<date>萬 丙子秋</date>(照標時間,空格不再處理。)
2 屬性key,notBefore,notAfter的先後順序不一,不會影響驗證或呈現。
例:<date key="j22968992296986" notBefore-iso="1576-08-05" notAfter-iso="1576-10-31">萬曆丙子秋</date>
=<date notAfter-iso="1576-10-31" notBefore-iso="1576-08-05" key="j22968992296986">萬曆丙子秋</date>
3 當時間同時有年次、歲次時,可全包入時間,但中間不用逗號。
例:時<date key="j24192292419229" when-iso="1911-07-11">宣統三年歲在辛亥六月旣望</date>,長洲葉昌熾謹記
4 時間名詞+初、初年、末、末年、年:包進時間。
時間名詞+中、間、年間:包進時間。
* 初年、末年,西元日期只擷取「年」即可,「月、日」不取。
例1:<date key="j22956292299967" notBefore-iso="1573" notAfter-iso="1584">萬曆初</date>
例2:<date>萬曆三年</date>
例3:<date>萬曆年間</date>
5 清光緒末年的時間計算問題(德宗&恭宗皆以光緒為年號)
a)光緒末年,指德宗+恭宗的年代的末1/4。
b)若有數個,可取最長的那一個末年,如上則取德宗光緒的末年即可。
6 因文本錯誤找不到ID
有些時間因文本錯誤以致無法找到id,可用note註解。
例:當穆王五十三年壬申二月十五子夜,入般涅槃。
<date key="unknown">穆王五十三年壬申二月十五</date>子夜
<note resp="ddbc.da">據《中國史厯日和中西厯日對照表》(方詩銘、方小芬編著,上海人民出版社2007)編載,周穆王只行到四十一戊戌年(-983)。</note>
知識備忘
(1)春=農曆1-3月,夏=農曆4-6月,秋=農曆7-9月,冬=農曆10-12月
(2)農曆月份的別名
一月:孟春、元春、開歲、端月、嘉月、正月。
二月:仲春、杏月、麗月、如月、花月。
三月:季春、晚春、暮春、季月、蠶月、桃月、桐月。
四月:孟夏、麥月、陰月、梅月、純陽。
五月:仲夏、榴月、蒲月、皋月、毒月。
六月:季夏、暑月、焦月、荷月、荔月。
七月:孟秋、新秋、蘭秋、蘭月、瓜月、巧月。
八月:仲秋、竹春、桂月、壯月。
九月:季秋、暮商、菊月、朽月、陽月、季秋。
十月:孟冬、初冬、開冬、露月、良月、陽月。
十一月:仲冬、辜月、葭月、龍潛月、冬月。
十二月:季冬、殘冬、臘月、冰月、嚴月。
朝代code
夏:<date key="j09902101152377" notBefore-iso="-2001-01-01" notAfter-iso="-1558-12-31">
商:<date key="j11461691337951" notBefore-iso="-1574-01-01" notAfter-iso="-1049-01-31">
周:<date key="j13339031628288" notBefore-iso="-1060-01-01" notAfter-iso="-0255-12-31">
東周:<date key="j14398241627923" notBefore-iso="-0770-01-01" notAfter-iso="-0256-12-31">
秦:<date key="j16410251646133" notBefore-iso="-0220-11-14" notAfter-iso="-0206-11-09">
漢:<date key="j16477011801742" notBefore-iso="-0201-02-24" notAfter-iso="0220-11-25">
西漢:<date key="j16477011723283" notBefore-iso="-0201-02-24" notAfter-iso="0006-02-01">
新:<date key="j17243601729737" notBefore-iso="0009-01-15" notAfter-iso="0023-10-06">
東漢:<date key="j17304061801742" notBefore-iso="0025-08-03" notAfter-iso="0220-11-25">
三國:<date key="j18017581823479" notBefore-iso="0220-12-11" notAfter-iso="0280-05-31">
曹魏:<date key="j18017581818249" notBefore-iso="0220-12-11" notAfter-iso="0266-02-04">
蜀漢:<date key="j18019131817499" notBefore-iso="0221-05-15" notAfter-iso="0264-01-16">
孫吳:<date key="j18048431823479" notBefore-iso="0229-05-23" notAfter-iso="0280-05-31">
晉:<date key="j18182531874651" notBefore-iso="0266-02-08" notAfter-iso="0420-07-08">
西晉:<date key="j18182531836822" notBefore-iso="0266-02-08" notAfter-iso="0316-12-12">
東晉:<date key="j18369381874651" notBefore-iso="0317-04-07" notAfter-iso="0420-07-08">
南朝宋:<date key="j18746541896160" notBefore-iso="0420-07-11" notAfter-iso="0479-05-29">
南朝齊:<date key="j18961611904523" notBefore-iso="0479-05-30" notAfter-iso="0502-04-22">
南朝梁:<date key="j19045331924818" notBefore-iso="0502-05-02" notAfter-iso="0557-11-14">
南朝陳:<date key="j19248221936231" notBefore-iso="0557-11-18" notAfter-iso="0589-02-12">
北魏:<date key="j18620951916335" notBefore-iso="0386-02-20" notAfter-iso="0534-08-22">
北周:<date key="j19245481933331" notBefore-iso="0557-02-15" notAfter-iso="0581-03-04">
北齊:<date key="j19221051931862" notBefore-iso="0550-06-09" notAfter-iso="0577-02-24">
隋:<date key="j19333311946884" notBefore-iso="0581-03-06" notAfter-iso="0618-04-15">
唐:<date key="j19469512052491" notBefore-iso="0618-06-21" notAfter-iso="0907-06-06">
武周:<date key="j19730671978610" notAfter-iso="0705-02-24" notBefore-iso="0689-12-21">
五代:<date key="j20524952071731" notBefore-iso="0907-06-10" notAfter-iso="0960-02-08">
後梁:<date key="j20524952058505" notBefore-iso="0907-06-10" notAfter-iso="0923-11-23">
後唐:<date key="j20583162063308" notBefore-iso="0923-05-13 " notAfter-iso="0937-01-11">
後晉:<date key="j20632642066960" notBefore-iso="0936-11-28" notAfter-iso="0947-01-11">
後漢:<date key="j20670182068412" notBefore-iso="0947-03-10" notAfter-iso="0951-01-02">
後周:<date key="j20684542071731" notBefore-iso="0951-02-13" notAfter-iso="0960-02-03">
宋:<date key="j20717322188290" notBefore-iso="0960-02-09" notAfter-iso="1279-03-26">
北宋:<date key="j20717322132773" notBefore-iso="0960-02-09" notAfter-iso="1127-03-27">
南宋:<date key="j21328572188290" notBefore-iso="1127-06-19" notAfter-iso="1279-03-26">
元:<date key="j21856422220977" notBefore-iso="1271-12-25" notAfter-iso="1368-09-22">
明:<date key="j22207422321634" notBefore-iso="1368-01-31" notAfter-iso="1644-04-25">
清:<date key="j23218222419402" notBefore-iso="1644-10-30" notAfter-iso="1911-12-31">
代名詞
標法
<ref key="Axxxxxx">人名代名詞</ref>
例:<ref key="A003672">其</ref>
<ref key="xxxxxxxxxxxxxx">地名代名詞</ref>
標記時機
當詞意不明顯時才須標
註解(底本本身)
對於註解性質的小字,可以如下標示:
1)<note>字體大小不變的註解</note>
2)<note rend="font-size:small">不折行的小字註</note>
3)<note rend="font-size:small;display:block">折行的小字註</note>
註解(ddbc.da)
1.註解內無超連結 標法:<note resp="ddbc.da">註解文字</note> 例:梁視<note resp="ddbc.da">視,疑爲「祖」字。</note>普通三年
2.註解內有超連結 標法:<note resp="ddbc.da">註解文字(<ptr target="網址"/>,日期)</note> 例:應案<note resp="ddbc.da">「案」字,萬福禪寺網站此處作「索」。 (<ptr target="http://www.huangboshan.com/zisusifu.htm"/>,2010.05.04)</note>屐而自潸。(g010p0445)
※網址中的「&」: 「&」在xml中有特殊意義,xml文件中網址內若含有該符號即驗證無法通過,若要在xml中表達「&」,需將「&」替換成「&」。
3.註解引用自CBETA資料時 標法:<note resp="ddbc.da">CBETA經文(CBETA預設的引用格式)</note> 例:著作郎<persName key="A010335">顧允祖</persName><note resp="ddbc.da"> 《集神州三寶感通錄》卷1:「著作郎顧胤祖」(CBETA, T52, no. 2106, p. 405, a17)</note>
4.夾註小字 標法:<seg rend="font-size:small">夾註小字</seg> 例:禪心風動後,空腹樹焚餘<seg rend="font-size:small">寺中銀杏樹自焚</seg>。片石文難得,東林社已虛。
其他規則: (1)標題內的註解,請置於<head>內。 例:<head>于黃檗丈室堂第三代隱元隆琦國師 上堂九則 機緣三則<note resp="ddbc.da"> 按:標題為上堂法語九則,機緣三則;內文實則收錄上堂法語八則,機緣五則。</note></head>
空格
<space quantity="1" unit="cjk_char"/> 一個全形空格
<space quantity="1" unit="lat_char"/> 一個半形空格
<space quantity="1" unit="cjk_char" resp="ddbc.da"/>自加的一個全形空格
訛字處理
文本中的錯字,包含看似錯誤但仍照實轉錄的字,則加以修訂。
標法:
<choice><sic>底本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
範例:
一切殿宇皆頹<choice><sic>圯</sic><corr resp="ddbc.da">圮</corr></choice>剝落
呈現方式:
網頁呈現:一切殿宇皆頹圯[>圮]剝落 g010p0264
PDF呈現:(內文)一切殿宇皆頹圮剝落 (註腳)「圮」為底本「圯」的勘誤
漏字處理
文本中的缺漏字,或模糊不清的字,或難以認識的字,則以 <gap>標記之。
缺漏字
標法1:<gap extent="1" unit="cjk_char" reason="lost"/>(漏字)
標法2:<gap extent="1" unit="cjk_char" reason="unclear"/>(模糊不清的字,例如印刷不清)
標法3:<gap extent="1" unit="cjk_char" reason="illegible"/>(無法辨認的,例如草書)
標法4:<gap extent="unknown" unit="cjk_char" reason="lost"/>(缺漏一段文字)
標法5:<gap extent="1" unit="cjk_char" reason="taboo-char"/>(避諱)
註:unit 屬性是單位,extent 屬性是單位數量,本例中 unit="cjk_char",extent="1" 便表示有1個字。
範例1:地屬三寶<gap extent="2" unit="cjk_char" reason="lost"/>鬼神護訶。
範例2:有侵佔者,身墮地獄,<gap extent="1" unit="cjk_char" reason="unclear"/>及子孫。
範例3:<gap extent="2" unit="cjk_char" reason="illegible"/>諸寺
範例4:余曰:「盍行乎?」<gap extent="unknown" reason="cjk_char" unit="chars"/>迄于今甲子周,而事始稍稍竣也。
範例5:明萬<gap extent="1" unit="cjk_char" reason="taboo-char"/>甲寅,泰和郭孔太E恭詣育王謁舍利。
呈現方式:以一個空白方框代表一個缺漏字。
網頁呈現1:地屬三寶□□鬼神護訶。g043p0072 網頁呈現2:有侵佔者,身墮地獄,□及子孫。g043p0072 網頁呈現3:□□諸寺 g081p0013 網頁呈現4:余曰:「盍行乎?」□...□迄于今甲子周,而事始稍稍竣也。g086p0286 網頁呈現5:明萬□甲寅,泰和郭孔太恭詣育王謁舍利。g010p0328
PDF呈現:(內文)與網頁呈現相同
補字
文本原無此字,在他版本找到該處可填某字的根據。(若一文補入多處,則於第一個補處做註。)
標法:
<supplied reason="lost">闕漏字</supplied><note resp="ddbc.da">參考來源</note>
範例:g043p0069
<supplied reason="lost">木鐸徇于道路,《周官》所以警其頑</supplied>
<note resp="ddbc.da">「木鐸徇于道路周官所以警其頑」十三字底本闕漏,茲依卷一
p. 54〈明,唐寅:姑蘇寒山寺化鐘疏〉一文補入。以下本文之補刊字,參考來源皆同此。</note>
愚;銅鍾司其<supplied reason="lost">晨昬</supplied>,釋氏所以覺夫靈性。
呈現方式:
網頁呈現:[[木鐸徇于道路,《周官》所以警其頑]][註]愚;銅鍾司其[[晨昬]],釋氏所以覺夫靈性。
PDF呈現:(內文)[[木鐸徇于道路,《周官》所以警其頑]][註]愚;銅鍾司其[[晨昬]],釋氏所以覺夫靈性。
(註腳)[註]「木鐸徇于道路周官所以警其頑」十三字底本闕漏,茲依卷一
p. 54〈明,唐寅:姑蘇寒山寺化鐘疏〉一文補入。以下本文之補刊字,參考來源皆同此。
備註:
1.底本之模糊字或殘缺字,若能辨識,則自動打入,不用標記<supplied>。
2.補入的闕漏字,亦可於其中加上標點符號,以利閱讀,但非他版原有。
重複字
<choice><orig><g ref="#bty117000301"/><備註組字式拆法!--[?]--></orig><reg(這裏中間要空1格)resp="ddbc.da">重複的字</reg></choice>
底本本身的刪塗、訂正字
訂正字
<del>刪塗字</del>
<add>原著(編)者訂正字</add>
例:(g094p0206)
<del>行</del>
<add>存</add>
呈現方式:
<del>行</del>(劃一橫線表示刪去)
{存}(加上大括弧表示原著(編)者訂正字)
若刪除的字辨識不清時,reason用 "cancelled":
<del><gap extent="2" unit="chars" reason="cancelled"/></del>
印章
標法:<stamp>印章上的文字</stamp>
例1:乾隆御覽之寶<stamp>清乾隆玉璽</stamp>
例2:<closer>萬曆丁未孟夏,賜進士第定海令椘潛樊王家撰<stamp>樊王家印</stamp></closer>(這是個印章)
*文章結尾署語的用印,可包在<closer>裡。
上標字及頁註
上標字
1.標法:<seg rend="vertical-align:super">上標字</seg>
例:藏外佛經<seg rend="vertical-align:super">1</seg>
2.目前打字時用以表示上標字的記號:@上標字/@(須使用全形記號以避免和內文混淆)
例:藏外佛經@1/@
頁註
1.有兩種標法:
標法一:
<body>被註內文<ptr n="f001"/>其他內文</body>
<back>其他頁尾的文字<note xml:id="f001">被註內文在頁尾的註文</note> 其他頁尾的文字</back>
標法二:
被註內文<note place="foot" n="1">被註內文的註文</note>其他內文
(所以標法二的註文是因為有 place="foot" n="1"會自己出現在頁尾)
2.目前打字時用以表示頁註的記號:以全形#單獨一行,將內文與頁註格開
圖檔
圖檔標記
<xml code> 一、自成段落的圖表,如山圖、畫像、照片等,其標法: <figure> <head>圖的標題</head> <figDesc>圖說</figDesc> <graphic url="檔案名稱.jpg"/> (or <graphic url="檔案名稱.svg"/>← 特殊的文字圖表以此方式處理) </figure>
二、行中小圖(不標figure,純標graphic),其標法: <graphic url="檔案名稱.gif"/>
例:y066p10 十心表法 <graphic url="image-y066-p0010-1.gif.gif"/>
三、圖檔命名規則:image-志碼-頁碼-流水序號.檔案格式 (例) image-g008-p0070.jpg image-y014-p0051.svg image-y066-p0010-1.gif(行中小圖,表第10頁第1個小圖) image-y066-p0010-2.gif(行中小圖,表第10頁第2個小圖) </xml>
特殊圖表製圖流程(Odg轉svg)
1.以OpenOffice Draw軟體繪製圖表(作法類似在word製作圖表)
2.製作好圖表後,點檔案→匯出→存檔類型:SVG→圖檔命名:(例)image-y014-p0051.svg
圖檔命名規則說明:上面圖檔代表廣陵本第14志第51頁(若有跨頁者以第一頁命名)
3.圖檔存放路徑:P:\2008佛寺志\02主資料庫\05底本中的圖檔\底本中的切圖\
svg格式的成品,放在figure資料夾中;odg格式的前製圖,放在odg資料夾中。
標籤label
<xml code> 一、常用於跟隨在單詩句後的作者名 例1.<lg><l>牛山信宿尚多情<caesura/>曉向花巖更問程<note rend="font-size:small">應登</note></l><l>下界日<lb n="4"/>光疑世隔<caesura/>半天雲氣近天行<note rend="font-size:small">沂</note></l><l>自憐病骨緣崖<lb n="5"/>怯<caesura/>轉覺秋懷入寺淸<note rend="font-size:small">璘</note></l><l>共起題詩滿巖石<caesura/>摩挲<lb n="6"/>寧獨感三生<note rend="font-size:small">穆</note></l></lg>
例2.<lg><l>此疾懷來沒量時<caesura/>尋醫求卜過多師</l><l>濃煎一服通神<lb n="4"/>散<caesura/>血汗滂流徹四肢<label rend="font-size:small">保寧勇</label></l></lg>(g061p332)
二、用於詩、文末隨附的小題名 例1.<lg><l>靑山亦好藏<caesura/>環繞自成位</l><l>藉問倦遊人<caesura/>誰知普照寺</l><label rend="font-size:small;display:block">(普照寺)</label></lg>
例2.
對戸交疏<seg rend="font-size:small">疏何作窗</seg>徒無比也<seg rend="font-size:small">徒當从各本作從</seg><label rend="font-size:small">胡統寺</label>
(g002p263)
</xml>
字元層次
佛寺志專案 特字處理
1 作業環境
2 特字處理方式及工具
3 特字處理原則
3.1 有 unicode 編碼的字
3.1.1 易於辨識
3.1.2 不易辨識
3.2 無 unicode 編碼的字
3.2.1 易於辨識
3.2.2 不易辨識, 有通用字
3.2.3 不易辨識, 無通用字
4 特字處理新規則
5 如何統一各志間特字處理方式
6 難檢字庫缺字建檔
7 難檢字庫缺字圖檔製作
7.1 原則
7.2 製圖步驟
8 缺字呈現
9 unicode 編碼字
9.1 CJK漢字編碼範圍
9.2 編輯器
9.3 快速尋找unicode的方法
10 有助於增加特字處理效率的工具與方法
11 SVG造字
11.1 參閱
11.2 安裝
11.3 inkscape造字操作法
11.4 illustrator造字操作法
11.5 參考範例
12 參考資源
標逗
書名
1.書名的標符樣式:《》
2.書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。
結尾署語
Q:結尾署語<closer>中的文字是否標逗?
A:原則上開放標點,適度添加,方便閱讀。但結束可不加句號。
例如:
元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記
加上標逗:
元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記
Q:closer後仍有文字的情況,如何標記?
A:例如,於g053p247「康熙五年七月二十九日給」後,有「立碑東廊」小字。
由於「立碑東廊」不屬closer的內容,因此在closer結束後將「立碑東廊」標註為note;
為了讓文字靠右,所以又標了一個靠右對齊的p。(單獨note無法靠右)
標法:
<xml code>
<closer>康熙五年七月二十九日給</closer><note>
立碑東廊
</note>
</xml>
詩篇名
詩篇名標符樣式:〈〉
偈頌
標法:<l>詩句<caesura/>詩句</l>
範例:
<lg>
<l>稽首觀音<caesura/>大悲之主</l>
<l>我今說偈<caesura/>畧讚所以</l>
<l>所以者何<caesura/>所謂三摩</l>
<l>菩薩證入<caesura/>常住寶陀</l>
<lg/>
*偈頌中不使用標點符號,詩句中的分隔,以 <caesura/> 標示。
底本有黑點(•)白點(。)
有些寺志底本中有黑點(•)白點(。),這是個不錯的標逗參考,但可不必完全依照。標逗以文意暢達為要。
例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)
可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰:
中文數字「零」
中文數字「零」,請統一用這個「〇」(unicode編碼u+3007)
Ps. 其餘「非數字」的圓圈符號,仍可用「○」。(這個○跟上面的〇不同)
巳=已 的處理
文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方式:
在「巳=已」的條件下,一志只在第一次出現的「巳」字做特字標記及註(如下),而後出現的「巳」則直接取代為「已」。
<xml>
第一次出現的「巳」字標記:
<choice><orig>巳</orig><reg resp="ddbc.da">已</reg>
<note resp="ddbc.da">書中「已」字多作「巳」,不煩標註。</note></choice>
</xml>
format重整文件
*執行format.py程式,可清除多餘空格及重整元素折行設定。
*電腦條件:電腦中要安裝有python-3.3.0以上版本的程式
程式放置路徑:Z:\數位典藏組\python
*執行步驟:
1.在(TortoiseGit)\bin\下開啟dos視窗
2.在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)
5.用main檔驗證一下,若是validation,即成。
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。
(小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)
如何解救亂了格式的文件?
(不小心按到Oxygen工具列的縮排按鈕時用)
1.先將所有自動折行的頁碼接起來
在亂了格式的檔案下
→ Ctrl+F
→尋找:<pb
facs=
→取代為:<pb facs=
→Replace All
→Close
2.再將所有自動折行的lb接起來
在亂了格式的檔案下
→Ctrl+F
→尋找:<lb
n=
→取代:<lb n=
→Replace All
→Close
3.吃掉所有tag間的空格
在亂了格式的檔案下
→Ctrl+F
→尋找:>[ \n]*<
→取代:><
→Replace All
→Close
4.檢查文件
看看還有沒有不正常的空白。
5.在Dos下執行git bin下的format.py
6.在git下的output資料夾中取得檔案,看看是否可用。
標記問答
Q:格式問題:是否照書編排?
A:數位文本不必全照書編排。
Q:敬格的情況,有空一格,有另起一行。
A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的標記困擾,決定不遵照底本格式。
即「敬格」統一都不須空格或另起一行。
Q:並列的文字。
A:不作並列標記。可標記縮小字<seg rend="font-size:small">。
Q:若印刷錯誤,文字內容重複時。
A:可用[註]標示。但若有跨頁,頁碼要放在note的外面。
Q:文本若超出可處理的範圍,如元朝蒙語譯文。
A:可不標句讀,但須於檔頭<teiHeader>作說明。
Q:雙關語的標記(人地混雜)
A:依字面標記元素,以註解說明喻意。
例1:g077p0293
淳氣日凋薄,<placeName key="PL000000021567">鄒</placeName><placeName key="PL000000021513">魯</placeName><note resp="ddbc.da">此處「鄒魯」代指「孔孟」。鄒魯乃孔子和孟子的誕生地。</note>亡眞承。
例2:g017p0194
笙歌日日娛<persName key="A008915">西子</persName><note resp="ddbc.da">此處「西子」代指「西湖」。</note> 為愛幽閒到玉岑
Q:oXygen xml文件中,如何取消元素的定義提示?
oXygen xml文件中,當將鼠標停留在TEI元素上時,會自動pop up出一個解釋該元素定義的小視窗;
這個小視窗有時會遮擋到文件中正要處理的文字,造成作業的困擾。
A:取消元素定義提示的設定步驟:
oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip(不要勾選)
佛寺志PDF版
1 凡例備忘
2 圖檔
2.1 構想
2.2 各志景點
3 佛寺志PDF版面
3.1 開本
3.2 邊界
3.3 行距
3.4 字型
3.5 字體大小
4 佛寺志PDF校訂規則
4.1 目錄
4.1.1 擷取層級
4.1.2 符號樣式
4.2 內文
4.2.1 樣式符號
4.2.2 段落樣式
4.2.3 標題
4.2.4 人名
4.2.5 地名
4.2.6 時間
4.2.7 特字
4.2.7.1 勘誤字(底本中的錯字)
4.2.7.2 從缺字(易辨識,卻打不出來)
4.2.7.3 罕見字(難以辨識的罕見字)
4.2.7.4 特字的註解
4.2.8 註腳
4.2.9 詩偈
4.2.10 小字
4.2.11 補字
4.2.12 印章
4.2.13 書名
4.2.14 備忘
4.3 人名索引
4.4 地名索引
5 討論區
佛寺志86志粗標
1 電校
2 切檔
2.1 分檔方式
2.2 書名頁的納入
2.3 卷前的標記
2.4 書名頁(出版社的)的標法
2.5 題名頁(原刻板的)的標法
3 粗標
3.1 段落標記
3.2 行號問題
3.3 跨頁的表格頁碼
3.4 補字標記修訂:加resp屬性(2013.05.20)
3.5 「取代標記,但不取代文字」的正規表示式語法(in oXygen)
3.6 自加標題標記修訂:加supplied元素(2013.05.20)
3.7 隱藏的自加標題標記修訂
3.8 地名標題下的詩偈,不用標<head>(標
及<lg>)
3.9 詞的上下闕標記法
3.10 法語中,如有「上堂」法語,可分段。
3.11 尾註的標法
3.12 印章的標法、位置
3.13 圖內的文字
4 特字處理
5 特殊問題
5.1 稿本有大量塗改的情形,如何標記?
5.2 新訂標題的原則
5.3 作者位置經標記人員移動時的註解說明
5.4 以程式標記詩偈
5.5 「全段縮排」可取代「小字」
5.6 長行裡的詩偈,目前可暫不標詩行
5.7 不縮排的詩行
5.8 錯位移正後要處理行號嗎?
5.9 xml文件中的「&」
6 標點符號問題