「《中國佛寺史志》標記作業」:修訂間差異

出自DILA Wiki
imported>Miaomiao
imported>Jiayu.xu
無編輯摘要
 
(未顯示由 9 位使用者於中間所作的 656 次修訂)
行 1: 行 1:
==標記作業==
[http://wiki.dila.edu.tw/pages/%E5%90%8D%E5%B1%B1%E5%8F%A4%E5%89%8E-%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%95%B8%E4%BD%8D%E5%85%B8%E8%97%8F 回《 國佛寺史志》 數位 典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual ]
===標記總說===
<syntaxhighlight lang="XML">
1. 本專案將以TEI-XML格式進行作業,對於文本 的人名、地名、時間皆加以標記及建置資料庫,
  旨在提供高質量的 數位 化全文。
2.數位化的文本也將加入新式標點符號。
3.文本中的難檢字將採用Unicode字符,
  若於Unicode字庫中尚未收錄的字,則將改以同義異體字代替,或者建立缺字檔。
4.TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。
  「意義標記」著重在付予文字意義,例如:<persName>人名。
  「樣式標記」著重在呈現的樣貌,例如:<lb/>(折行
  TEI-XML標記著重於「意義標記」,而文本呈現的樣貌則多操縱於XSLT。
</syntaxhighlight>


===檔案架構===
《中國佛寺志》 標記作業<br>
  《中國佛寺 志》 以「志」為單位,每一部志皆有一代碼(例:重修普陀山志代碼g008)。
另可參考 [http://wiki.dila.edu.tw/pages/%E9%81%B5%E5%BE%AA_TEI_%E7%9A%84%E4%BD%9B%E5%AD%B8%E6%95%B8%E4%BD%8D%E5%8C%96_XML_%E6%A8%99%E8%A8%98 遵循 TEI  佛學 數位 化 XML 標記]
 每一志皆由一個主檔(例 重修普陀山志 主檔g008_main)
 及 個小檔(以卷為單 ,例:重修普陀山志卷一g008_01)組成。
 主檔內寫有版本資訊及小檔的鍊結,小檔內則是各卷的內容。


=== 標記 明===
= 工作準備=
1. 參考資料:
   進行寺志標記前,應先找好該志的相關參考資料,例如:白話本、點校本等。
2. 檔案管理:
 本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。
 目前檔案資料夾分為三部份:
  1)xml(已完成細標的檔案。細標是指有人名、地名、時間的 標記
  2)xml-basic-g( 丹本)
  3)xml-basic-y(廣陵本)
 
3. 作業軟體oXygen(19版)的環境設定
  1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose
  2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾)
  3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排)
  4) 呼叫結構樹 outline:window→Show View→outline
   (結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。)
4. 作業技巧:凡具規則性、大量性之機械式作業,應尋求以程式批次處理,避免人工重複作業。
5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。 
  「意義標記」著重在付予文字意義,例如:persName(人名),p(段落)。
  「樣式標記」著重在樣貌的呈現,即編輯樣式,例如:lb(折行),p rend=""(段落格式)。
   本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。


====頁碼====
= 檔案架構=
<syntaxhighlight lang="XML">
   《中國佛寺史志》以「志」為單位,每一部志皆有一代 碼。<br>
  1 頁 放置的位置:置於<div>與<head>之間
 (例 :重修普陀 ,代碼g008)<br>
  例1:<div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0">
    <pb facs="1B009P003.jpg" n="0000a"/>
    <head resp="ddbc.da">普陀山志卷前</head>
  例2 <div>
    <pb facs="1B009P022.jpg" n="0003"/>
    <head> 重修普陀志 </head>


  2 版本說明頁的頁碼、卷之前無頁碼的頁碼
   每一志皆由 個主檔( 例: 重修普陀山志的主檔g008_main)<br>
  格式:第 頁0000a,第二頁0000b,第三頁0000c
 及數個分檔(以 為單位 例:重修普陀山志 一g008_01)組成。<br>
   例:<div>
    <pb facs="1B009P003.jpg" n="0000a"/>
    <head resp="ddbc.da">版本說明</head>
  ps.由於 首需要一個頁碼 因此「版本說明」的頁碼會被挪移到當 第一個<head> 之前。
   (見頁碼放置的位置例1)


  3 插 頁碼
   主檔內含有版本資訊(teiHeader)、掃描 資訊(tei:facsimile)及分檔 鍊結(text xi:include)。<br>
  格式:插圖前頁頁碼+a
 分檔內則是各卷的內容。<br>
  例:<pb facs="xBxxxPxxx n="0123a""/>


  空白
  ●切檔命名規則<br>
  需標上當 頁碼
  志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名 等)<br>
   例:<pb facs="1B009P043.jpg" n="0024"/>
志碼_00:卷首(題名 之後的內容,如:序文、目錄、山圖等)<br>
志碼_01:卷一<br>
志碼_02:卷二(以下依卷次類推)<br>
志碼_back:附錄、補編等<br>
志碼_back1:附錄、補編有多卷時,可加序號。 如附編卷一<br>
志碼_back2 附錄、補編有多卷時,可加序號。例如附編卷二<br>


</syntaxhighlight>


====標題====
●特殊例子的切檔<br>
<syntaxhighlight lang="XML">
  例:<br>
  1 標題的標法
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷 情勢做適當的調整)。<br>
 ● <head>標題</head>
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6<br>
 ● <head>標 題</head><byline><persName>作者</persName></byline>
g087_03-1,g087_03-2<br>
 ● <head resp="ddbc.da">自加標題</head>
 ● <head>標題<seg rend="font-size:small">副標題</seg></head>


2 說明
=加facs碼=
(1)若篇章缺乏標題者,可「自訂標題」。
<b>1.執行git中的facs.py 程式, 內文中 的pb加上facs</b><br>
  自加的標題將會出現在網頁左欄的樹狀目錄結構上,並 程式 會自動加上括弧
 例 <pb n="0041"/><br>
  以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的 內文中
   執行程 後變成<pb facs="1B017P108.jpg" n="0041"/><br>
  文本標記的格式 :<head resp="ddbc.da"> 自加的標題</head>
  網頁樹狀目錄所呈現的樣 :(自加的標題)


  (2)標題後 副標題 可以<seg>(隨機分割) 標記 之。
<b>2.請網路工程師(阿賢)為main檔加facsimile</b><br>
   例 :<div><head> 大安禪師<seg rend="font-size:small"> 上堂一則 機緣二則</seg></head>
   將加好pb facs 檔案,連同main檔 一併交給工程師。工程師會在main檔加入如下的 標記:<br>
   #<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。
<xml code>
  <tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0">
  <tei:graphic url="1B017P108.jpg"/>
  <tei:graphic url="1B017P109.jpg"/>
 ......
 ......
</xml>


    標題亦可加新式標點符號。
<b>注意事項:卷內的pb facs要與main中的facsimile url同步</b><br>
各卷內的頁碼有時會有錯誤,當修改pb facs碼時,請順便也要一併修改main中的facsimile url,這樣文件才會完整。<br>
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/><br>
    Y141_main <tei:graphic url="4B100P005.jpg"/><br>


</syntaxhighlight>
=文件宣告=
1各卷文件宣告列,請一致用:<br>
<?xml version="1.0" encoding="UTF-8"?>(雙引號,大寫UTF)


====人名====
  2缺字在 頭宣告 其流程:<br>
人名規範資料的建置(若欲建 檔, 請先 帳號密碼登入)
<xml code>
   ● 人名規範資料 網頁 http://dev.ddbc.edu.tw/authority/person/
1)開啟main檔
   ● 人名規範資料建檔方 ,請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯 人名規範資料庫 ]
2)在</fileDesc>之後加上 下的群組標記
   ● 人名規範 資料的 問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]
<encodingDesc>
  <charDecl>
   <char xml:id="Z0001"> <!-- Z0001為DILA難檢字 ID -->
    <charName>DILA CHARACTER Z0001</charName>
    <charProp>
     <localName>CBETA</localName> <!-- CB碼 -->(若無可省略)
     <value>CB30005</value>
    </charProp>
    <charProp>
     <localName>composition</localName> <!-- 組字 -->
     <value>[ 宀/廣]</value>
    </charProp>
   </char>
  </charDecl>
</encodingDesc>
3)在當志中,用 <g ref="# 搜尋出所有缺字。
4)逐一將缺字碼放在「DILA 難檢字庫」中檢索,將缺字 資料 填補入缺字宣告中。
(從缺 項目可省略)


  2 人名標記
  例:g069_main
<xml code> 標法:
</fileDesc>
   <persName key="Axxxxxx"> 某某某</persName>
<encodingDesc>
   <persName key="unknown"> 未知的人名</persName>
  <charDecl>
   <persName key="Gxxxxxx"> 人名群組</persName>
   <char xml:id="Z0393">
   <roleName> 稱謂</roleName> (須包在<persName> 內)
    <charName>DILA CHARACTER Z0393</charName>
   <roleName type="honorific"> 尊稱</roleName> (須包在<persName> 內)
    <charProp>
   <name> 族姓</name>
     <localName>composition</localName>
     <value>[山*克]</value>
    </charProp>
   </char>
   <char xml:id="Z0523">
    <charName>DILA CHARACTER Z0523</charName>
    <charProp>
     <localName>composition</localName>
     <value>[風*丘]</value>
    </charProp>
   </char>
   <char xml:id="Z0522">
    <charName>DILA CHARACTER Z0522</charName>
    <charProp>
     <localName>composition</localName>
     <value>[山*右]</value>
    </charProp>
   </char>
  </charDecl>
</encodingDesc>
</teiHeader>
</xml>
</xml>


3 人名標記凡例
=段落形式=
{| style="color:green;background-color:#ffffcc;" cellpadding="2" cellspacing="0" border="1"
== 標題==
!稱謂型態
 
! 凡例
1標題的 <br>
! 
● &lt;head> 標題&lt;/head><br>
|-
● &lt;head> 標題&lt;/head>&lt;byline>&lt;persName> 作者&lt;/persName>&lt;/byline><br>
|官稱
● &lt;head> 標題&lt;seg rend="font-size:small"> 副標題&lt;/seg>&lt;/head><br>
|<ul><li>韋左司</li><li>韋應物左司</li><li>杜副校長正民</li></ul>
● 標題小字不折行 程式預設 <seg rend="font-size:small"> 標題中的縮小字</seg><br>
|<ul><li><persName>韋<roleName>左司<roleName></persName></li>
● 標題小字要折行:<seg rend="font-size:small;display:block"> 縮小的字</seg><br>
<li><persName>韋應物<roleName>左司</roleName></persName></li>
●  題中含作者 時的 標法   題=作者:題名 作者名後加冒 號) 例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩<br>
<li><persName> 杜<roleName>副校長</roleName>正民</persName></li></ul>
|-
|地名當人名
|<ul><li>韋蘇州</li><li>塩官國師</li><li>臨濟</li><li>天童圓悟大師</li></ul>
|<ul><li><persName>韋<placeName>蘇州</placeName></persName>(指韋應物)</li>
<li><persName><placeName>塩官</placeName><roleName>國師</roleName></persName></li>
<li><persName><placeName>臨濟</placeName></persName></li>
<li><persName><placeName>天童</placeName>圓悟<roleName>大師</roleName></persName></li></ul>
|-
|連名
|<ul><li>大鶴居士鄭文焯</li><li>花之寺僧羅聘</li><li>華陽眞人陶貞白先生宏景</li></ul>
|<ul><li><persName>大鶴<roleName>居士</roleName>鄭文焯</persName></li>
<li><persName>花之寺僧羅聘</persName> 不加roleName )</li>
<li><persName><placeName>華陽</placeName><roleName>眞人</roleName>陶貞白<roleName>先生</roleName>宏景</persName></li></ul>
|-
|子
|<ul><li>寒山子</li><li>殳子山夫</li><li>朱氏子</li></ul>
|<ul><li><persName>寒山<roleName type= ”honorific”>子</roleName></persName></li>
<li><persName>孔<roleName type=”honorific”>子</roleName></persName></li>
<li><persName>殳<roleName type=”honorific”>子</roleName>山夫</persName></li>
<li>寂窓照禪師,俗姓<persName>鄧</persName>。(鄧,在此指其本姓)</li>
<li>如堂,寂光寺僧,澂江<name>楊</name>氏子(楊,在此指其族姓)</li></ul>
|-
|兒
|<ul><li>陵兒</li></ul>
|<ul><li><persName>陵<roleName>兒</roleName></persName></li></ul>
|-
|公
|<ul><li>歐陽文忠公</li><li>忠定公燮元</li></ul>
|<ul><li><persName>歐陽文忠<roleName type=honorific>公</roleName></persName></li>
<li><persName>忠定<roleName type=honorific>公</roleName>燮元</persName></li></ul>
|-
|氏
|<ul><li>大雄氏(指佛)</li><li>孔雀氏(指阿育王)</li><li> 俞氏</li></ul>
|<ul><li><persName>俞氏</persName>(皆直標persName,不用標roleName)</li></ul>
|-
|師、本師
|<ul><li>本師阿彌陀如來(「非人」名稱只單純 <persName>)</li></ul>
|<ul><li><persName>本師阿彌陀如來</persName></li>
<li><persName>阿彌陀佛</persName></li>
<li><persName>阿彌陀佛</persName>如來本地</li></ul>
|-
|大士、菩薩
|<ul><li>觀音大士</li><li>普賢菩薩(「非人」 稱只單純 <persName>)</li></ul>
|<ul><li><persName>觀音大士</persName></li>
<li><persName>普賢菩薩</persName></li></ul>
|-
|山人
|<ul><li>漁洋山人</li></ul>
|<ul><li><persName>漁洋山人</persName></li></ul>
|-
|上人
|<ul><li>悟上人</li></ul>
|<ul><li><persName>悟<roleName type=honorific>上人</roleName></persName></li></ul>
|-
|老
|<ul><li>印老 師</li><li>南亭老和尚</li></ul>
|<ul><li><persName>印<roleName type=honorific>老</roleName><roleName>法師</roleName></persName></li>
<li><persName>南亭<roleName type=honorific>老和尚</roleName></persName></li></ul>
|-
|老人
|<ul><li>南極老人</li><li>無著老人</li></ul>
|<ul><li><persName>南極老人</persName></li>
<li>惟我先師<persName>無著<roleName type=honorific>老人</roleName></persName>(一般稱謂、敬稱, 示<roleName>)</li>
<li>別號<persName>無著老人</persName> 專稱、別 ,直用<persName> )</li></ul>
|-
|翁
|<ul><li>壑翁相國(賈秋壑)</li></ul>
|<ul><li><persName>壑<roleName type=honorific>翁</roleName><roleName>相國</roleName></persName></li></ul>
|-
|先生
|<ul><li>半農先生</li></ul>
|<ul><li><persName>半農<roleName type=honorific>先生</roleName></persName></li></ul>
|-
|夫人
|<ul><li>許夫人</li><li>秦國夫人計氏</li></ul>
|<ul><li><persName><roleName>秦國夫人</roleName>計氏</persName></li></ul>
|-
|諡號
|<ul><li>謚「大悟禪師」</li><li>賜號「廣慧妙悟智寶宏教禪師」</li></ul>
|<ul><li><persName>大悟<roleName>禪師</roleName></persName></li>
<li><persName>廣慧妙悟智寶宏教<roleName>禪師</roleName></persName></li></ul>
|-
|皇帝(皇后)
|<ul><li>世宗憲皇帝</li><li>梁皇</li><li>慈寧皇太后</li></ul>
|<ul><li><persName>世宗憲<roleName>皇帝</roleName></persName></li>
<li><persName>慈寧<roleName>皇太后</roleName></persName></li></ul>
|-
|帥
|<ul><li>筱帥</li></ul>
|<ul><li><persName>筱<roleName>帥</roleName></persName></li></ul>
|-
|君
|<ul><li>須直君</li><li>葛君</li></ul>
|<ul><li><persName>葛<roleName type=honorific>君</roleName></persName></li></ul>
|-
|諱
|<ul><li>王諱舉(王舉)</li></ul>
|<ul><li><persName>王</persName>諱<persName>舉</persName></li></ul>
|-
|}


  人名規範資料建檔注意事項
  2自訂標題<br>
  (1)名字
   1.全自加<br>
   a)常名、別名請冠上姓氏,以便利檢索。
  &lt;head>&lt;supplied resp="dila.da">自訂標題&lt;/supplied>&lt;/head><br>
   b)每一語系中,應有一常名,餘則為別名。
    例 [http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0309 〔劉仁本題跋〕]<br>
  (2)缺字 人名中有缺字時,人名欄位以通用字表示。
 2.半自加<br>
  (3)朝代:以此人的卒年為依。
  &lt;head>原標題&lt;supplied resp="dila.da">自訂標題&lt;/supplied>&lt;/head><br>
  (4)籍貫:其地名朝代以此人 生年為依。
    例 [http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g084&cpage=0005 雞足山志序〔二〕]<br>
  (5)生卒年
   3.隱藏自加 標題<br>
   a)生年的計算:生年= 卒年-歲壽+1
    &lt;head rend="display:none">&lt;supplied resp="dila.da">自訂標題&lt;/supplied>&lt;/head><br>
   b)生卒年的取捨:若資料來源有干支年及西元年,以取干支年為準。
   例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0001 志名頁]<br>
    例: 重顯(980~1052),宋代雲門宗僧。於皇祐四年入寂。
    ps. rend="display:none" 隱藏元素格式 (不留 <br>
     建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。
      rend="visibility:hidden"  保留元素格式(留白 <br>
  (6)是否為歷史人物:若非歷史人物,則在此欄位勾「否」。
  (7)註解:
   a)以120個字為限 阿拉伯數字不算字數,標點符號算字數),並請使用全形標點符號。
   b)若此人查 到生卒年,則應在註解欄的資料中盡可能節錄相關人事物的時間參考點。
   c)僧人註解資料的基本要件:師承、師兄弟、著作、法嗣、事件時間。
   d)引用資料,盡量以紙本、藏經或佛學辭典為優先。
    使用網路資料時,應注意 存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。
   e)引用資料時須註明資料來源。出處的作用:1).說明資料來源 2).幫助使用者搜尋(Finding Aid
   f)「佛學規範資料庫」對於經常引用的參考工具書編有「簡稱」,引用這些參考書時請以這些「簡稱」為依。
   g)Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。
  (8)若是查詢不到任何資料的人名,請不用收錄至規範資料庫。(文本上標 key="unknown" 即可


  5 人名標記規則
  3說明<br>
(1)文 本中出現的人名 皆應 (包括書名號內的人名)
(1) 若基於結構的需要, 章缺乏標題者 可「另訂 題」 <br>
  
    另訂的 標題 將會出現在網頁左欄 樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有 的標 題區分。但自加的 標題 不會呈現在網頁全文化的內文中。<br>
  (2) 標題 人名是「作者」時 的標
 段落句首折 標題與否示例(以g074雲居山志 為例)
   <head> 標題</head><byline><persName key="Axxxxxx">作 者名</persname></byline>
  一)直接折作標題
   <byline> 包含 主要責任陳述 出現在題名頁或作品開頭或結尾處即署名之意
    原則 凡段落句首不屬於內文首句文法成份的,則可直接折用 標題。同一卷中,各段落折用 情況不統一亦無妨 以實義為判
  
 
  (3)遇人名不確定是否為某人時 可加屬性值 示。
    範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜 那裏得來---
   例 <persName key="A001606" cert="70%">
       題:自寳禪師
   cert是表示標記者認為的正確度,是相對值 非絕對的。
       內文 上堂。總恁麽風恬浪靜 那裏得來---
  
  
  (4) 非人,非人界皆要 標記。(2011/1/27回函決議)
    範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲---
       標題:宗杲大慧禪師
       內文:時圜悟詔住雲居,師往省覲---
    範例3:p82 晦山顯禪師  師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
       標題:晦山顯禪師
       內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
    範例4:p105 復合神鐘  寺有巨鐘,明中葉院圮---
       標題:復合神鐘
       內文:寺有巨鐘,明中葉院圮---
 
 (二)依句頭另作標題[ ]
    原則:若段落首句的文法成份是屬於「主詞」或「前置受詞」的,則應留作內文句頭,而另訂標題。
    範例1:p65 道齊禪師 本州金氏子,徧歷禪會---
       標題:[道齊禪師]
       內文:道齊禪師(主詞),本州金氏子,徧歷禪會---
    範例2:p70 克勤佛果禪師 建炎丁未歲十一月初六日,奉敕住雲居---
       標題:[克勤佛果禪師]
       內文:克勤佛果禪師(主詞),建炎丁未歲十一月初六日,奉敕住雲居---
    範例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居---
       標題:[燕雷鵬禪師]
       內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居---
    範例4:p103 佛印禪師 周茂叔謁見,問曰---
       標題:[佛印禪師]
       內文:佛印禪師(前置受詞),周茂叔謁見,問曰---
    範例5:p106 寺左三塔 沉埋土中多年---
       標題:[寺左三塔]
       內文:寺左三塔(主詞)沉埋土中多年---
 ○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。
(2)標題後的副標題,可以&lt;seg>(隨機分割)標記 <br>
.例:&lt;div>&lt;head>大安禪師&lt;seg rend="font-size:small">上堂一則 機緣二則&lt;/seg>&lt;/head><br>
.&lt;seg>( 隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。<br>
(3)若底本格式為「作者在標題之前」,且編輯分類是以「作者」為主時,則作者亦可作標題。<br>
例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g028&cpage=0458 g028p458 厲鶚]<br>


[[#三、人名|返三、人名]]
4長詩題的另訂
關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂標題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對的理由。


====地名====
  5標點符 <br>
地名規範資料的建置(若欲建檔,請先以帳 密碼登入)
(1)標題亦可加新 標點符號 惟結尾不用句點。<br>
  ● 地名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/place/
  ● 地名規範資料建檔方 式, 請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「地名規範資料庫」]
  ● 地名規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]


2 地名標記
==段落樣式==
<xml code>標
===樣式語 ===
   <placeName key="xxxxxxxxxxxxxx">地名</placeName>
◎全段縮小字<br>
   <placeName key="unknown"> 未知的地名</placeName>
 &lt;p rend="font-size:small"> 全段縮小字&lt;/p><br>
   <placeName key="xxxxxxxxxGxxxx"> 地名群組</placeName></xml>
 範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0427 g009p0427]<br>


  3 地名標記凡例
  ◎全段縮排一個字<br
{| border="1" cellpadding="0" cellspacing="0"
   &lt;p rend="margin-top:1ex;text-indent:0"> 縮排的段落&lt;/p><br>
|+
   範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0593 g009p0593]<br>
! 型態
! 凡例
! 標記
|-
|單純行政區地名
|杭州
|<placeName key="CN0330103Z19AA">杭州</placeName>
  (需配合文意而選擇朝代別)
|-
|單純自然區地名
|普陀山
|<placeName key="CN0330903M01AA"> 普陀山</placeName>
|-
|連名
|四川峨眉縣
|<placeName key="CN0511181Z02AA"> 四川峨眉縣</placeName>
  (以連名的最小地點為其ID)
|-
|地名中含人名
|遂賜額曰「天花尊者開巖院」
|<placeName key="CN0331023T57AA"><persName key="unknown">天花尊者</persName>開巖院</placeName>
|-
|寺內建築:一般
|大雄寶殿、放生池
|文本不標,資料庫不建
|-
|寺內建築:具特殊意義
|阿育王寺舍利塔殿
|文本應標,資料庫應建
|-
|地名群組
|五嶽
|<placeName key="CN0000000G07AA">五嶽</placeName>
|
|}


  4 地名規範資料建檔注意事項
  ◎全段縮排一個字 但第一行凸排一個字<br>
(1)地名尾碼非AA碼者,不可重新編碼 因為會牽涉到相同主碼的其他地名。
   &lt;p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排 &lt;/p><br>
  (2)Google map與衛星圖 經緯度有 差,在標經緯度時以衛星圖為主。
   範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0023 g009p0023]<br>
  (3)地名的建置,註解欄注意事項請參閱[[4人名規範資料建檔注意事項]]內 關註解的
 ps.底本若 有條 列式段落符號,以符號「―」表示,而不用「一」


  地名標記規則
  ◎第一行不縮排。(通常用在詩文夾雜的長行段落)<br>
 ● 文本中出現的地名,皆應標記,但除了(小地名不標外)。
   &lt;p rend="text-indent:0">詩偈後接續的長行&lt;p><br>
   範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g062&cpage=0104 g062p0104]<br>


◎靠右對齊<br>
 &lt;p rend="text-align:right"><br>


[[#四、地名|返四、地名]]
◎全段並排小字,有時可以調整為大字<br>
 例:g079 p.004崇眞萬壽宮<br>


====時間====
=== 序、跋、按語之格式===
  時間規範資料的查詢 若欲查詢 請先以帳號密碼登入
1. 小序、小引<br>
  ● 時間規範資料庫網頁 http://dev.ddbc.edu.tw/authority/time/
    1)「詩」 詩行)前小序、小引,做一般段落 並依底本之大小字體編輯之。<br>
  ● 時間規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]
   例:g023卷六p371(雲林看雨圖題句小引 <br>
    2)「文」(長行)前小序、小引,全段縮排3格。<br>
     例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)<br>


  2 時間標記
2. 跋、識(獨立的段落)<br>
<syntaxhighlight lang="XML">
    1)跋文本身無 縮排3格。<br>
  ● 
      例1:g016p362( - - - 慧荃跋closer)<br>
<date key="j+(起始時間碼)+(結尾時間碼)" notBefore-iso="起始西元年-月-日" notAfter-iso="結尾西元年-月-日">區 性的某時間</date>
      例2:g023p363( - - -  魏成憲并識)<br>
  <date key="j+(開始時間碼)+(結束時間碼)" from-iso="開始西元年- - 日" to-iso="結束西元年月日">事件持續進行的時間</date>
  <date key="j+(當日時間碼)+(當日時間碼)" when-iso="西元年- - 日">時間點</date>
  <date key="unknown">未知的時間</date>
</syntaxhighlight>


  3 時間 記凡例
    2)跋文本身有 題(或添加 題):作一般 落,不縮排。<br>
{|border="1" cellpadding="0" cellspacing="0"
    例1:g028p445(--- 大掄敬識)<br>
|-
    例2:g016p1374(李流芳題跋)<br>
!時間型態
!凡例
!
|-
|區 性的某時間
|余以光緒己卯游天台
|<date key="j24073722407755" notBefore-iso="1879-01-22" notAfter-iso="1880-02-09">光緒己卯</date>
 說明:a)key2407372:光緒己卯年正月一日ID
    b)key2407755:光緒己卯年正月三十日
    c)notBefore-iso:光緒己卯年正月一日ID
    d)notAfter-iso:光緒己卯年正月三十日
|-
|明確日期
|萬曆庚戌年五月十六日
|<date key="j23092772309277" when-iso="1610-06-26"> 萬曆庚戌年五月十六日</date>
|}


3. 按語(獨立的段落)<br>
  全段縮排3格,並依底本之大小字體編輯之。<br>
  例1:g016p378按寺舊志云觀松在香積......<br>
  例2:y105p54按范浦之水來自五雲諸山......<br>


  時間規範資料建檔注意事項
    [註] 在不影響版 之識別效果下 上開底本 小字體可以改大 <br>
(1)佛寺志專案使用Julian day number時間系統,請確認介 是否選用此項。
(2)若未「登入」時間規範資料庫 查詢結果將不會自動計算「初年」、「末年」等較詳細 資訊。
(3)時間的查詢有多種管道:中國年(朝代、帝號、年號、年干支),西元年(三種方式),ID碼


  5 時間標記 規則
    ps.以上 規則 僅是個大原則,若遇有特殊情況 ,得 依當志之特性而做適切之調整。<br>
(1)可查知的時間 皆應標記;無法證知(從前後文或其他資料皆無法 知)的時間,
  則可標記<date key="unknown">未知年的時間</date>


  (2)有些時間因 本錯誤以致無法找到id,可用note註解,
==表格==
  例 當穆王五十三年壬申二月十五子夜,入般涅槃
表格的標記元素:<br>
  <date key="unknown"> 穆王五十三年壬申二月十五子夜</date>
   &lt;table>:以表格形式呈現、包含在直行橫列中的 字內容<br>
  <note resp="ddbc.da"> 據《 中國 史厯日和中西厯日對照表》(方詩銘、方小芬編著,上海人民出版社2007)編載,周穆王只行到四十一戊戌年(-983)。</note>
 &lt;row> 包含表格中的一列<br>
 &lt;cell>:包含表格中的一個儲存格<br>
 &lt;cell rows=" 列數"> :表格合併列<br>
 &lt;cell cols=" 欄數"> :表格合併欄<br>
 實例:請參見 中國 佛寺志 g089p0254<br>


(3)初年,末年時間的擷取原則
==詩詞歌賦偈==
  取當朝、當年號、當年的前1/4為其初年,末1/4為其末年。


(4)時間 民國年 查法:
===元素===
  登入網頁「兩千年中西曆轉換」http://sinocal.sinica.edu.tw/
*&lt;lg>(行組, Line Group)包含形式上視 一組 詩行,例如詩節、疊句、韻文段落等。
  兌換出相對應 西元時間 再到時間規範資料庫換算ID碼即可
*&lt;l>(詩行)包含詩文 一行 也許是不完整的詩行
  例:民國壬寅年
*&lt;caesura/> 標記韻律詩行可能被截斷的位置。
  兌換出為西元1962年2月5日~1963年1月24日
  再到時間規範資料庫以西元年查詢為5949266~5949619
  即<date key="d59492665949619"
    notBefore="1962-02-05" notAfter="1963-01-24">


  (5)時間屬性 變更:(2011.01.20)
===範例===
   notBefore,notAfter,from,to,when,全要加上-iso(計算0年)
  詩文 呈現方式有二:1. 作詩行。2. 做長行。<br>
   如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso
   例:<date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13">哀帝元壽間</date>


  (6)萬 丙子秋(=萬曆丙子秋)
1. 詩行格式通常不用標點,同行兩句間標<caesure/>,如g007p.887。<br>
   例:<date>   丙子秋</date> (照標時間,空格不 處理。)
<syntaxhighlight lang="XML">
 
 <p> 別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後 出峽住保寧金山雪竇
  (7)屬性key,notBefore,notAfter的先後順 不一,不會影響驗證或呈現。
  及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作
   例 :<date key="j22968992296986" notBefore-iso="1576-08-05" notAfter-iso="1576-10-31"> 萬曆丙子秋</date>
師具表奏謝仍進頌曰
   =<date notAfter-iso="1576-10-31" notBefore-iso="1576-08-05" key="j22968992296986"> 萬曆丙子秋</date>
<lg><l>古佛與今佛<caesura/> 同一廣長舌</l>
 
  <l>於無途轍中<caesura/> 為物啟途轍</l>
  (8)當時間同時有年次、歲次時,可只標較詳細的歲次時間。
    <l>撥開千嶂雲<caesura/> 放出一輪 月</l>
   例:時宣統三年,歲在<date key="j24192292419229" when-iso="1911-07-11"> 辛亥六 旣望</date> ,長洲葉昌熾謹記
    <l> 普令大地人<caesura/> 言下悉照徹</l>
 
  <l> 覺亦無可圎<caesura/> 幻亦 無可 滅</l>
  (9)時間名詞+初、末:包進時間。
    <l>只此無亦無<caesura/>紅爐 點雪</l>
   例:<date key="j22956292299967" notBefore-iso="1573-02-12" notAfter-iso="1584-12-29"> 萬曆初</date>
    <l> 稽首佛與佛<caesura/> 字字無異說</l></lg>
   時間名詞+初年、末年:包進時間。
  既經乙夜之覽皇情大悅</p>
   例:<date key="j22956292299967" notBefore-iso="1573-02-12" notAfter-iso="1584-12-29">萬曆初年</date>
  ※p內可包lg(已可通過validate驗證)
   時間名詞+中、間、年間:不包進時間。
</syntaxhighlight>
   例:<date key="j22956292312983" notBefore-iso="1573-02-12" notAfter-iso="1620-08-18"> 萬曆</date> 年間
 
(10)清光緒末年的時間計算問題(德宗&恭宗皆以光緒為年號)
  a)光緒末年,指德宗+恭宗的年代的末1/4。
   阿賢: 法用程式計算,請各位自己計算。
  b)志偉的意見:若有數個,則取最長的那一個末年,如上則取德宗光緒的末年即
 
    知識備忘
(1)春=農曆1-3月,夏=農曆4-6月,秋=農曆7-9月,冬=農曆11-12月
(2)農曆月份的別名
   一月:孟春、元春、開歲、端月、嘉月、正月。
   二月:仲春、杏月、麗月、如月、花月。
   三月:季春、晚春、暮春、季月、蠶月、桃月、桐月。
   四月:孟夏、麥月、陰月、梅月、純陽。
   五月:仲夏、榴月、蒲月、皋月、毒月。
   六月:季夏、暑月、焦月、荷月、荔月。
   七月:孟秋、新秋、蘭秋、蘭月、瓜月、巧月。
   八月:仲秋、竹春、桂月、壯月。
   九月:季秋、暮商、菊月、朽月、陽月、季秋。
   十月:孟冬、初冬、開冬、露月、良月、陽月。
   十 月:仲冬、辜月、葭月、龍潛月、冬月。
   十二月:季冬、殘冬、臘月、冰月、嚴月。
 
[[#五、時間|返五、時間]]
 
====代名詞==== 
<syntaxhighlight lang="XML"
  1標法:
<ref key="Axxxxxx"> 人名代名詞</ref>
 例:<ref key="A003940"> </ref> (余指徐時泰)
  
  <ref key="xxxxxxxxxxxxxx">地名代名詞</ref>
 例:待補
 
2標記時機:當詞意不明顯時才須標


2. 文章中夾有詩文,若做詩行格式,則不用引號。若必須用,則改用長行,並加標點,如g038p.174。<br>
<syntaxhighlight lang="XML">
<p>張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池,
獻詩曰:賊寇臨京口,王師出海邊。四方喧動地,萬姓共瞻天。
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p>
</syntaxhighlight>
</syntaxhighlight>
[[#《中國佛寺史志》數位典藏工作手冊|返目錄]]


====註解(ddbc.da)====
=== 標點===
<syntaxhighlight lang="XML"
<b>按語的標點規則:</b><br>
1. 內無超連結
1. 作「據查」 <br>
  標法 :<note resp="ddbc.da">註解文字</note>
 g049編按 産西門寨石之「鞏州」,爲今甘肅之隴西縣 。<br>
  例 梁視<note resp="ddbc.da">視 疑爲「祖」字 。</note> 普通三年
 g049按:華嚴寺,馮守誦《華嚴經》,感玉女饋餐......<br>
 g049謹按 生於上川  。<br>


2. 內有超連結
2. 作「依據」 解<br>
  標法:<note resp="ddbc.da"> 註解文 <ptr target="網址"/>, 日期)</note>
 g49按《莊子》,瞿君 鵲子。<br>
  例 應案<note resp="ddbc.da"> 「案」字 萬福禪寺網站 處作「索」。
 g049按大師此語 凡在峨眉遊居者,皆當......<br>
 (<ptr target="http://www.huangboshan.com/zisusifu.htm"/>,2010.05.04)</note> 屐而自潸。(g010p0445)
 g049按《益部方物略》 「海棠,有數種。<br>
 g077按志中 前代諸鉅公經 境者,其唯......<br>


3. 引用自CBETA資料時
3. 作「依照 、查看」 解<br>
  標法:<note resp="ddbc.da">CBETA經文(CBETA預設的引用格式)</note>
 g049按新圖,稽舊聞,亦數月而竣事。<br>
  例:著作郎<persName key="A010335">顧允祖</persName><note resp="ddbc.da">
 g049故只按舊志及諸經傳而爲證訂。<br>
  《集神州三寶感通錄》卷1:「著作郎顧胤祖」(CBETA, T52, no. 2106, p. 405, a17)</note>
 g077按之九華碑版亦然。<br>


其他規則:
===詩偈的小字===
(1)標題內 的註解, 請置於<head>
1.詩偈中,解釋上句(或同行) 的註解 性質的小字 可標<seg rend="font-size:small">。<br>
  例:<head> 于黃檗丈室堂第三代隱元隆琦國師 上堂九則 機緣三則<note resp="ddbc.da">
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面、</lg>前面)<br>
  按:標題為上堂 語九則 機緣三則;內文實則收錄 法語 八則,機緣五 則。</note></head>
 (由於css語 的關係 在頁面呈現 ,note會自動折行,無 與<l></l>同行。<br>
</syntaxhighlight>
  TEI 法的規 ,seg無法標在<l></l>外面 <br>
3.詩偈中,總釋前幾首詩的註解性質的小字,可標&lt;p>&lt;note rend="font-size:small">&lt;/note>&lt;/p> <br>


====特字處理====
=== 注意事項===
<syntaxhighlight lang="XML">
#&lt;lg>與&lt;p>是平行的結構,故&lt;lg>與&lt;p>不可互包。應結束&lt;/p>後,再標&lt;lg>
● 缺字 定義:編碼表(Unicode)未收錄的字
#當詩詞跨頁時,照書換頁,不用顧及排版問題。
#詩偈不用標逗,詩句中間 間隔,以&lt;caesura/>標示


● 特字處理原則:
== 頁多欄==
  特殊字的處理,第 優先是尋查有無unicode編碼字(包含Ext. C),
 例如:g003p0273
  接著再根據文字本身或搭配前後文做判斷,大致分為兩大類別。
  一、若此字易於辨識者(不會產生懷疑的,不管是否為unicode編碼字),則不做任何標記。
  二、若此字不易於辨識者(不易讀懂,罕用字,異體字,古體字),則:
   (1)有unicode編碼字,亦有通用字時,則標記<choice>。
   (2)無unicode編碼字,有通用字時,則標記<reg>。
   (3)無unicode編碼字,亦無通用字,則標<g>,並建立缺字檔。


  漢字處理流程
=[http://wiki.dila.edu.tw/pages/%E6%A8%99%E8%A8%98%E5%85%83%E7%B4%A0 標記元素]=
 1至unicode網站查找,若有則直接複製貼上。
1 頁碼<br>
  若在Oxygen編輯器下無 直接貼上, 先以Notepad++開啟此檔並於內貼上此字、存檔,
2 人名<br>
  然後再轉接以Oxygen繼續作業。此時經過Notepad++轉化 此缺字,將在Oxygen以□的形式呈顯。
 2.1 人名規範資料的建置<br>
  如果缺字在介面仍無法顯現,請安裝Undicode擴充字型
 2.2 人名標記標 <br>
  Y:\Projects\fosizhi\work\tools\字型\unicode字型\HAN NOM B(A).ttf
 2.3 人名標記凡例<br>
 
 2.4 人名規範資料建檔注意事項<br>
  ●●判斷缺字原
 2.5 人名標記規 <br>
  1)以utf字符號碼判斷
3 地名<br>
  Unihan網站:http://www.unicode.org/charts/unihanrsindex.html
 3.1 地名規範資料 建置<br>
  * utf-32:U+20000- U+2A6DF:中日韓統一表意文字擴展B區
 3.2 地名標記<br>
  * utf-32:U+2A700-U+2B73F:中日韓統一表意文字擴展C區
 3.3 地名標記凡例<br>
  * utf-32:U+2B740- U+2B81F:中日韓統一表 文字擴展D區
 3.4 地名規範資料建檔注意事項<br>
  * Decimal:131072以上
 3.5 地名標記規 <br>
   (以上皆屬Extension 擴展字,可直接貼在文本。 ) 
 3.6 地名問答<br>
  
4 時間<br>
  2)人工判斷
 4.1 時間規範資料的查詢<br>
  
 4.2 時間標記<br>
  
 4.3 時間標記凡例<br>
 2若查找的 非uniword,則可借助其他 書工具查找其通用 ,再視情況而標記&lt;reg> 或&lt;choice>
 4.4 時間規範資料建檔注意事項<br>
  ( 書工具:如CBETA漢 資料庫,教育部異體 網站等)
 4.5 時間標記規則<br>
  1)
 4.6 民國年<br>
   例:
  4.6.1 時間為民國年的注 事項<br>
  2)
  4.6.2 時間為民國年的查法<br>
   例:
    4.6.3 時間屬性 變更(2011.01.20 <br>
  4.6.4 時間問答<br>
   4.7 知識備忘<br>
 4.8 朝代code<br>
5 代名詞<br>
 5.1 標法<br>
 5.2 標記時機<br>
6 註解(底本本身)<br>
7 註解(dila.da)<br>
8 空格<br>
9 訛 處理<br>
10 漏 處理<br>
 10.1 缺漏 <br>
 10.2 補字<br>
11 重複 <br>
12 底本本身的刪塗、訂正 <br>
13 印章<br>
14 上標 及頁註<br>
 14.1 上標字<br>
 14.2 頁註<br>
15 圖檔<br>
 15.1 圖檔標記<br>
 15.2 特殊圖表製圖流程(Odg轉svg)<br>
16 標籤label<br>


 3若查找的 非uniword,亦無通用字,則作標記&lt;g ref="#圖檔檔名"/>,並建立缺字檔。
= 元層次=
  例:


  ●●缺字標記:&lt;g ref="#btgzzzppppnn"/>
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 佛寺 專案 特 處理]==
  字圖檔命名原則:#btg+ 碼3碼+頁碼4碼+序碼2碼(序碼:此頁第幾個缺 )


  ●●缺 圖檔 處理
1 作業環境<br>
  (1) unicode 網站如果 圖檔,請第一優先download 圖。
2 特字處理方式及工具<br>
  (2) 教育部異體 圖檔。
3 特 字處理 原則<br>
  (3) 若此 非uniword, 用Gimp工具,裁切文本掃描原始檔(.tif)作為字圖。(作法如下)
3.1 有 unicode 編碼的字<br>
  
 3.1.1 易於辨識<br>
  ●●利用Gimp軟體 處理缺字 【98.01.19 Erica】
 3.1.2 不易辨識<br>
  *裁切掃瞄檔 缺字 步驟
3.2 無 unicode 編碼的字<br>
  (1)開啟Gimp功能表「檔案」.
 3.2.1 易於辨識<br>
  (2)點選「開啟」.
 3.2.2 不易辨識,  用字<br>
  (3)選擇掃瞄檔案ex:2Book022(路徑:Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff)中 缺字 碼.
 3.2.3 易辨識, 無通 用字<br>
  (4)放大圖片以利裁切:點選「顯示」選擇「縮放1:1(100﹪)」.
4 處理新規 <br>
  (5)點選「工具」選擇「變換工具」中 「剪裁」圖形cut(形狀類似一支筆).
5 如何統一各志間特字 處理 方式<br>
  (6)將「剪裁」圖形移至缺 字體,確認位置後在選取 的字 框內點選滑鼠左鍵2次,即出現裁切之缺 圖檔.
6 難檢字庫 缺字 <br>
  (7)設定圖片尺寸:點選「影像」選擇「縮放影像」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
7 難檢字庫 缺字 圖檔製作<br>
  (8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成
 7.1 原則<br>
 7.2 製圖步驟<br>
缺字 呈現<br>
9 unicode 編 字<br>
 9.1 CJK漢字編碼範圍<br>
 9.2 編輯器<br>
 9.3 快速尋找unicode 方法<br>
10 有助於增加特 處理效率 工具與方法<br>
11 SVG造 <br>
 11.1 參閱<br>
 11.2 安裝<br>
 11.3 inkscape造 操作法<br>
 11.4 illustrator造字操作法<br>
   11.5 參考範例<br>
12 參考資源<br>


  ●●針對已下載缺字圖片設定尺寸之轉檔步驟
== 逗==
  (1)開啟Gimp功能表「檔案」
=== 書名===
  (2)點選「開啟」(路徑:先前已下載的缺字圖檔ex:btg×××××××××.jpg之資料夾)
1. 書名的 符樣式:《》<br>
  (3)設定圖片尺寸--點選「圖片」選擇「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
2. 書名中的人名 地名 標記 若書名中 人名具重要 性或 特殊意義, 於書名 以<note>的 式註記 <br>
  (4)點選「檔案」選擇「另存新檔」並提供檔名ex:btg×××××××××.gif再點選下方「Gif影像檔」按「儲存」後,即出現另一視窗請不要勾選任何選項按「儲存」即完成.
  ●●建立缺字檔
  佛寺志缺字庫網頁http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq
(1)缺字id編碼原則: btg086(志名)0327(頁碼) 01(第幾個缺字)。目錄缺字id:btgcal(目錄)XXXX(頁碼)XX(第幾個)
(2)登入缺字網頁[http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020]
(3)取碼目的:取得缺字碼<g ref="#btg086001701"/> 記內文及建置缺字組
(4)建置步驟說明:
  (a)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (b)產生缺字id後,即可輸入缺字資訊(如e).
(5)完成後,按「更新資料庫」.
(6)輸入缺字資訊須知,說明如下:
  (a)<glyph xml:id="btg086033701">: 為缺字id碼。
  (b)<glyphName>: 為unicode編碼。
    ●到 [http://www.unicode.org/charts/unihanrsindex.html unicode網站 ]找cjk(Decimal)之下方編碼,例如:CJK IDEOGRAPH 15181
    ●其cjk(Decimal)之編碼=<mapping type="unicode">15181</mapping>
    ●若查無unicode編碼資料,請點選「Non Unicode Character」即可.
  (c)<charProp>:  <value> 發音。
    ●到 [http://www.iq-t.com/SYSCOM/pingying2.asp 漢語拚音字典 ]找漢語拼語,一律小寫,第幾聲用數字表示(一聲 二聲、三聲、四聲、輕聲 = 1、2、3、4、5), 知發音者以問號表示
    ●<charProp>表示字 、表達方法。比如說注音、發音。
  (d)<mapping type="cbeta">: 為組字式。
    ●組字方式均由 CBETA maha 統一組字,請參閱 [http://dict.cbeta.org/word2/search.php CBETA漢字庫 ]打通用字 組字式以獲得組字式與CB碼。
  (e)<mapping type="cbetaNo"> : 為cbeta的CB碼。
    ●若查無CB碼資料,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入 maha 字樣即 .再以一志為單位,統一由程式人員:小花 處理.
    ●若 CBETA maha 回覆不收錄至CBETA漢字庫時,請登錄至「更新資料庫」上方之「add a note」按鍵點選 ,輸入<不收錄至CBETA 漢字資料庫>字樣即可.
  (f)<mapping type="unicode"> : 為unicode編碼。
    ●Mapping說明:<mapping/>可 用另一個系統來表示這個字的方法,比如說cb碼、組字式、unicode碼。cjk與Unicode(id=decimal)的關係猶如cjk=一年甲班,Unicode=10號。
  (g)<mapping type="MoEvariant"> : 為教育部異體字編碼。
    ●到 [http://dict.variants.moe.edu.tw/suo.htm 教育部異體字網頁 ]找編碼。例如:b02420-001
    ●注意:沒有Undicode的字才要登錄教育部異體字編碼。
  (h)<add a note>: 為註記資訊用
    ●輸入 maha 字樣 : 申請缺字收錄至CBETA 漢字資料庫。目 :索取CB碼及組字
    ●maha回覆訊息後,提供 註記 「不收錄至CBETA漢字庫」或「這是BIG5系統字「丱」資訊用
(5)完成後,按「更新資料庫」.


  ●●缺字給 CBETA Maha製作流程
===結尾署語===
(1)請Maha幫忙製作缺 無CB碼、無組字式 者
Q:結尾署語<closer>中的文 是否標逗?<br>
(2)須製作(1)的二 資訊者 於缺字介面note註明maha
A:原則上開放標 點, 適度添加,方便閱讀。但結束 不加句號。<br>
(3)小花再以note註明的maha 彙整送給maha
(4)缺字資訊的note寫法 參考缺字介面的(8)<add a note>: 為註記資訊用


  ●●缺字上傳
  例如:<br>
  (1) FTP informations:
  元祐三年八月二十有八日朝散大夫提舉洞霄宮 護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記<br>
    session:fosizhi
    host name:10.10.0.49
    user name:april  
    password:m4tjp
  (2)上傳位置 
    從 Y:\Projects\fosizhi\images\gword\
    到 0:/fosizhi/public_html/gword/
  
  (3)從dev 到informatics 傳時間為一週
  ●●缺字再佛寺志網頁的呈現順序
   1.uniword
   2.通用字(異體字)
   3.組字式
   4.字圖


  *缺字 標記 對應處理表
  加上 逗:<br>
元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡 <br>


*通用字參照標記:
  1有uniword、有通用字
  標法:<choice><orig>文本原字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig>(原文格式)標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
  <reg>(一般化)標誌一般化或規格化處理過的文字。
  例:<choice><orig>銕</orig><reg resp="ddbc.da">鐵</reg></choice>


  2無uniword、 通用
Q:closer後仍 的情況,如何 記?<br>
  法:<reg> 通用 字</reg>
A:例如,於g053p247「康熙五年七月二十九日給」後,有「立碑東廊」小 <br>
  例:<reg> </reg> ([耳*力]打不出)
由於「立碑東廊」不屬closer的內容,因此在closer結束後將「立碑東廊」標註為note;<br>
  
為了讓文字靠右,所以又標了一個靠右對齊的p。(單獨note無法靠右)<br>
  註:<reg> 選字原則:1.義同、字形接近。2.部首接近。3.筆畫接近。
   標法:
   例:[王*尒]:<reg> </reg> 珠色(珍珠色)
<xml code>
     [穴/ 怱]:<reg> </reg> 子(窗子)
<closer>康熙五年七月二十九日給</closer><note><p rend="font-size:small;text-align:right"> 立碑東廊</p></note></div>
</xml>


  3無uniword、無通用字
===詩篇 ===
  標法:<g ref="#圖檔檔 "/>
詩篇名標符樣式 〈〉
  例 <g ref="#btg008020804"/>([火*咢])


===偈頌===
標法:<l>詩句<caesura/>詩句</l><br>
範例:<br>
<lg><br>
 <l>稽首觀音<caesura/>大悲之主</l><br>
 <l>我今說偈<caesura/>畧讚所以</l><br>
 <l>所以者何<caesura/>所謂三摩</l><br>
 <l>菩薩證入<caesura/>常住寶陀</l><br>
<lg/><br>


  *台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
  *偈頌中不使用標點符號,詩句中的分隔,以 &lt;caesura/> 標示。<br>
  *別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml


</syntaxhighlight>
===底本有黑點(•)白點(。)===
有些寺志底本中有黑點(•)白點(。),這是個不錯的標逗參考,但可不必完全依照。標逗以文意暢達為要。<br>
例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)<br>
  可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰:<br>


====勘 字====
== 中文數 「零」==
<syntaxhighlight lang="XML">
  「零」,請統一用這個「〇」(unicode編碼u+3007)<br>
  *訛字修訂標記:
Ps. 其餘「非數字」 圓圈符號, 可用「○」 (這個○跟上面 〇不同)<br>
  <choice><sic> 本的 字</sic><corr resp="ddbc.da">修訂後 字</corr></choice>
  <sic>:包含看似錯誤但 照實轉錄的文本
  <corr>:(更正)包含文本中看似錯誤並加以更正過後 文字。
  例:<choice><sic>圯</sic><corr resp="ddbc.da">圮</corr></choice>


</syntaxhighlight>
==巳=已 的處理==
文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方式:<br>
在「巳=已」的條件下,一志只在第一次出現的「巳」字做特字標記及註(如下),而後出現的「巳」則直接取代為「已」。<br>
<xml>
第一次出現的「巳」字標記:
<choice><orig>巳</orig><reg resp="dila.da">已</reg>
<note resp="dila.da">書中「已」字多作「巳」,不煩標註。</note></choice>
</xml>


====漏字====
=format重整文件=
<syntaxhighlight lang="XML">
*執行format.py程式,可清除多餘空格及重整元素折行設定。<br>
  *漏字標記
  *電腦條件 電腦中要安裝有python-3.3.0以上版本的程式<br>
  <gap extent="1" unit="chars" reason="lost"/>( extent:文字量
 程式放置路徑:Z:\數位典藏組\python<br>
  <gap extent="1" unit="chars" reason="unclear"/>
  *執行步驟:<br>
1.在(TortoiseGit)\bin\下開啟dos視窗<br>
2.在bin\後游標閃動處,打上format.py g0xx 要執行的志碼),然後按Enter<br>
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾<br>
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋 <br>
5.用main檔驗證一下,若是validation,即成。<br>
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。<br>
   (小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)<br>


  *書法草書字體無法辨認
==如何解救亂了格式的文件?==
  <gap extent="1" unit="chars" reason="illegible"/>
  (不小心按到Oxygen工具列的縮排按鈕 用)<br>
  
1.<b>先將所有自動折行的頁碼接起來</b><br>
  * 漏段標記
 在亂了格式的檔案下<br>
  <gap extent="unknown" unit="chars" reason="lost"/>
 → Ctrl+F
</syntaxhighlight>
 →尋找:<pb <br>
facs=<br>
   →取代為:<pb facs=<br>
 →Replace All<br>
 →Close<br>
2.<b>再將所有自動折行的lb接起來</b><br>
 在亂了格式的檔案下<br>
 →Ctrl+F<br>
 →尋找:<lb <br>
n=<br>
 →取代:<lb n=<br>
 →Replace All<br>
 →Close<br>
3.<b>吃掉所有tag間的空格</b><br>
 在亂了格式的檔案下<br>
   →Ctrl+F<br>
   →尋找:>[ \n]*<<br>
 →取代 ><<br>
   →Replace All<br>
 →Close<br>
4.<b>檢查文件</b><br>
 看看還有沒有不正常的空白。<br>
5.<b>在Dos下執行git bin下的format.py</b><br>
6.在git下的output資料夾中取得檔案,看看是否可用。<br>


====空 ====
= 標記問答=
<syntaxhighlight lang="XML">
Q: 式問題:是否照書編排?<br>
1)<space quantity="1" unit="eng_chars"/>(一個英文半形空格)
A:數位 本不必 照書編排。<br>
2)<space quantity="1" unit="chi_chars"/>(一個中 文全 形空格)
  註:quantity內可填空格字數
</syntaxhighlight>


====印章====
  Q:敬格的情況,有空一格,有另起一行。<br>
  <syntaxhighlight lang="XML">
  A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的 標記 困擾,決定不遵照底本格式。<br>
  *印章 標記 <stamp> 包含 個字詞,描述 個印記或是類似圖案
  即「敬格」統 都不須空格或另起 。<br>
  例:乾隆御覽之寶<stamp>清乾隆玉璽</stamp>


</syntaxhighlight>
Q:並列的文字。<br>
A:不作並列標記。可標記縮小字&lt;seg rend="font-size:small">。<br>


====表格====
  若印刷錯誤,文字內容重複時。<br>
<syntaxhighlight lang="XML">
可用[註]標示。但若有跨頁,頁碼要放在note的外面。<br>
  *表格
  表格標記元素:<table>、<row>、<cell>
  表格合併列 :<cell rows="列數">
  表格合併欄 :<cell cols="欄數">


  *例1(g089p0254)
  Q:文本若超出可處 的範圍,如元朝蒙語譯文。<br>
<table>
A:可不標 讀,但須於檔頭&lt;teiHeader> 作說明。<br>
<row><cell rows="2">一、約部義</cell><cell>前四時</cell><cell>筌罤</cell></row>
<row><cell>今法華</cell><cell>魚兔</cell></row>
<row><cell rows="2">二、約教義</cell><cell>前三教</cell><cell>筌罤</cell></row>
<row><cell>今圓教</cell><cell>魚兔</cell></row>
<row><cell rows="2">三、約解義</cell><cell>言說教</cell><cell>筌罤</cell></row>
<row><cell>契妙 理</cell><cell>魚兔</cell></row>
<row><cell rows="2">四、約行義</cell><cell>玄 開解</cell><cell>筌罤</cell></row>
<row><cell>止觀立行</cell><cell>魚兔</cell></row>
<row><cell rows="2">五、約玄義</cell><cell>釋名宗用教</cell><cell>筌罤</cell></row>
<row><cell>諸部經體</cell><cell>魚兔</cell></row></table>


  *例2(g089p0254
  Q:雙關語的標記(人地混雜 )<br>
<table>
A:依字面標記元素 以註解說明喻意 。<br>
<row><cell>一、漸中開四</cell><cell cols="4">如破他宗 不識教體之妨,謂法華是漸圓,華嚴是頓圓 。</cell></row>
例1:g077p0293<br>
<row><cell>二、方等中四</cell><cell cols="4">四教並談曰方,四機普被曰等。</cell></row>
淳氣日凋薄 ,<placeName key="PL000000021567"> </placeName><placeName key="PL000000021513"> </placeName><note resp="dila.da"> 此處「鄒魯」代指「孔孟」 鄒魯乃孔子和孟子的誕生地 。</note> 亡眞承 。<br>
<row><cell rows="4">三、別教𥪡<!--[竪]-->入四</cell><cell>十信</cell><cell rows="4">修</cell><cell>生滅四諦</cell><cell>藏</cell></row>
<row><cell>十住</cell><cell>修無生四諦</cell><cell>通</cell></row>
<row><cell>十行</cell><cell>修無量四諦</cell><cell>別</cell></row>
<row><cell>十向</cell><cell>修無作四諦</cell><cell>圓</cell></row>
<row><cell>四、十行橫學四</cell><cell cols="4">別教十行化他心切 橫出四四一十六門。</cell></row>
<row><cell rows="4">五、涅槃追泯四</cell><cell cols="3">生生不可說</cell><cell>藏</cell></row>
<row><cell cols="3">生不生不可說</cell><cell>通</cell></row>
<row><cell cols="3"> 不生生不可說</cell><cell>別</cell></row>
<row><cell cols="3"> 不生不生不可說</cell><cell>圓</cell></row>
<pb facs="3B008P275.jpg" n="0254"/>
<row><cell> 六、涅槃追說四</cell><cell cols="4">有因緣故亦可得說,四句如前,但義同施權,卻更分別前四教也 </cell></row>
<row><cell>七、法華施出四</cell><cell cols="4">從法華實理施四時三教,權理明無量義,從一清淨道施出二三四 。</cell></row>
<row><cell>八、法華開顯四</cell><cell cols="4">開四時三教,歸今法華,收多歸一也 。</cell></row></table>


</syntaxhighlight>
例2:g017p0194<br>
笙歌日日娛<persName key="A008915">西子</persName><note resp="dila.da">此處「西子」代指「西湖」。</note>  為愛幽閒到玉岑<br>


====詩偈====
Q:oXygen xml文件中,如何取消元素的定義提示?<br>
<syntaxhighlight lang="XML">
  oXygen xml文件中,當將鼠標停留在TEI元素上時,會自動pop up出一個解釋該元素定義的小視窗;<br>
 ● <lg><l>的 注意事項
  這個小視窗有時會遮擋到文件中正要處理 文字 造成作業的困擾。<br>
  <lg>與<p>是對等地位 故巢狀結構<lg> <p>不 可互包。應結束</p>後,再標<lg>
A:取消元素定義提示的設定步驟:<br>
  oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip( 要勾選)<br>


 ● 當詩詞跨頁 時, 換頁,不用顧及排版問題。
=[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97PDF%E7%89%88 佛寺志PDF版]=
1 凡例備忘<br>
2 圖檔<br>
 2.1 構想<br>
 2.2 各志景點<br>
3 佛寺志PDF版面<br>
 3.1 開本<br>
 3.2 邊界<br>
 3.3 行距<br>
 3.4 字型<br>
 3.5 字體大小<br>
4 佛寺志PDF校訂規則<br>
 4.1 目錄<br>
  4.1.1 擷取層級<br>
  4.1.2 符號樣式<br>
 4.2 內文<br>
  4.2.1 樣式符號<br>
  4.2.2 段落樣式<br>
  4.2.3 標題<br>
  4.2.4 人名<br>
  4.2.5 地名<br>
  4.2.6 間<br>
  4.2.7 特字<br>
   4.2.7.1 勘誤字(底本中的錯字)<br>
   4.2.7.2 從缺字(易辨識 卻打不出來)<br>
   4.2.7.3 罕見字(難以辨識的罕見字)<br>
   4.2.7.4 特字的註解<br>
  4.2.8 註腳<br>
  4.2.9 詩偈<br>
  4.2.10 小字<br>
  4.2.11 補字<br>
  4.2.12 印章<br>
  4.2.13  名<br>
  4.2.14 備忘<br>
 4.3 人名索引<br>
 4.4 地名索引<br>
5 討論區<br>


 ● <caesura> 記韻律詩行可能被截斷的位置。
=[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%9786%E5%BF%97%E7%B2%97%E6%A8%99 佛寺志粗 ]=
</syntaxhighlight>


====標記問答====
1 電校<br>
 Q:格 問題:是否照書編排?
2 切檔<br>
 A:數位文本不必全照 編排。
 2.1 分檔方 <br>
  
 2.2  名頁的納入<br>
 Q:敬格 情況,有空一格,有另起一行。
   2.3 卷前的標記<br>
 A:"敬格"統一都不須空格或另起一行。
 2.4 書名頁(出版社的) 標法<br>
  
   2.5 題名頁(原刻板的) 標法<br>
 Q:並列 文字。
3 粗 <br>
 A:不作並列 記。可 標記 縮小字<seg rend="font-size:small"> 及加括弧以區別之。
 3.1 段落 標記<br>
  
 3.2 行號問題<br>
 Q :文 章中所有小 字的
   3.3 跨頁的表格頁碼<br>
 A :<seg rend="font-size:small"> (縮小 字)</seg>
 3.4 補字標記修訂 加resp屬性(2013.05.20)<br>
   ps. <seg>的標法, 是著重在 樣式 (小字)上的呈顯 而非「意義」上的表示
 3.5 「取代標記,但不取代 文字 正規表示式語 (in oXygen)<br>
  
 3.6 自加標題標記修訂 加supplied元素(2013.05.20)<br>
 Q:若 刷錯誤, 文字 內容重複時。
 3.7 隱藏 自加標題標記修訂<br>
 A:可用[註] 示。
 3.8 地名標題下的詩偈,不用標<head> (標<p>及<lg>)<br>
 例:<note resp="ddbc.da"> 重複 文本重複的文 字」</note>
 3.9 詞 上下闕 記法<br>
   但若有跨頁,頁碼要放在note的外面。
 3.10  語中 如有 上堂 法語 可分段 <br>
  
   3.11 尾註的標法<br>
 Q:文本若超出可處理 範圍 如元朝蒙語譯文。
 3.12  章的標法、位置<br>
 A: 可不標 句讀,但須於檔頭<teiHeader> 作說明。
 3.13 圖內的 文字<br>
  
4 特字處理<br>
 Q:
5 特殊問題<br>
 A:
 5.1 稿本有大量塗改的情形,如何標記?<br>
 5.2 新訂 題的原則<br>
 5.3 作者位置經標記人員移動時的註解說明<br>
 5.4 以程式標記詩偈<br>
 5.5 「全 縮排」可取代 字」<br>
   5.6 長行裡 詩偈 目前 不標 詩行<br>
 5.7 不縮排的詩行<br>
   5.8 錯位移正後要處理行號嗎?<br>
 5.9 xml文件中的「&」<br>
6 標點符號問題<br>

於 2021年4月27日 (二) 09:56 的最新修訂

回《中國佛寺史志》數位典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual)

《中國佛寺志》標記作業
另可參考:遵循 TEI 的佛學數位化 XML 標記

工作準備

1. 參考資料:
   進行寺志標記前,應先找好該志的相關參考資料,例如:白話本、點校本等。

2. 檔案管理:
本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。
目前檔案資料夾分為三部份:
 1)xml(已完成細標的檔案。細標是指有人名、地名、時間的標記)
 2)xml-basic-g(明丹本)
 3)xml-basic-y(廣陵本)
  
3. 作業軟體oXygen(19版)的環境設定
 1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose
 2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾)
 3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排)
 4) 呼叫結構樹 outline:window→Show View→outline
   (結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。)

4. 作業技巧:凡具規則性、大量性之機械式作業,應尋求以程式批次處理,避免人工重複作業。

5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。  
  「意義標記」著重在付予文字意義,例如:persName(人名),p(段落)。
  「樣式標記」著重在樣貌的呈現,即編輯樣式,例如:lb(折行),p rend=""(段落格式)。
    本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。

檔案架構

 《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。
 (例:重修普陀山志,代碼g008)

 每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
 及數個分檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。

 主檔內含有版本資訊(teiHeader)、掃描圖資訊(tei:facsimile)及分檔的鍊結(text xi:include)。
 分檔內則是各卷的內容。

●切檔命名規則
志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名頁等)
志碼_00:卷首(題名頁之後的內容,如:序文、目錄、山圖等)
志碼_01:卷一
志碼_02:卷二(以下依卷次類推)
志碼_back:附錄、補編等
志碼_back1:附錄、補編有多卷時,可加序號。例如附編卷一
志碼_back2:附錄、補編有多卷時,可加序號。例如附編卷二


●特殊例子的切檔
例:
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷題情勢做適當的調整)。
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6
g087_03-1,g087_03-2

加facs碼

1.執行git中的facs.py程式,為內文中的pb加上facs
 例:原<pb n="0041"/>
   執行程式後變成<pb facs="1B017P108.jpg" n="0041"/>

2.請網路工程師(阿賢)為main檔加facsimile
 將加好pb facs的檔案,連同main檔,一併交給工程師。工程師會在main檔加入如下的標記:
<xml code>

 <tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0">
 <tei:graphic url="1B017P108.jpg"/>
 <tei:graphic url="1B017P109.jpg"/>

 ......  ...... </xml>

注意事項:卷內的pb facs要與main中的facsimile url同步
各卷內的頁碼有時會有錯誤,當修改pb facs碼時,請順便也要一併修改main中的facsimile url,這樣文件才會完整。
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/>
  Y141_main <tei:graphic url="4B100P005.jpg"/>

文件宣告

1各卷文件宣告列,請一致用:
<?xml version="1.0" encoding="UTF-8"?>(雙引號,大寫UTF)

2缺字在檔頭宣告,其流程:
<xml code> 1)開啟main檔 2)在</fileDesc>之後加上以下的群組標記 <encodingDesc>

 <charDecl>
   <char xml:id="Z0001"> 
     <charName>DILA CHARACTER Z0001</charName>
     <charProp>
       <localName>CBETA</localName> (若無可省略)
       <value>CB30005</value>
     </charProp>
     <charProp>
       <localName>composition</localName> 
       <value>[宀/廣]</value>
     </charProp>
   </char>
 </charDecl>

</encodingDesc> 3)在當志中,用「<g ref="#」搜尋出所有缺字。 4)逐一將缺字碼放在「DILA 難檢字庫」中檢索,將缺字資料填補入缺字宣告中。 (從缺的項目可省略)

例:g069_main </fileDesc> <encodingDesc>

 <charDecl>
   <char xml:id="Z0393">
     <charName>DILA CHARACTER Z0393</charName>
     <charProp>
       <localName>composition</localName>
       <value>[山*克]</value>
     </charProp>
   </char>
   <char xml:id="Z0523">
     <charName>DILA CHARACTER Z0523</charName>
     <charProp>
       <localName>composition</localName>
       <value>[風*丘]</value>
     </charProp>
   </char>
   <char xml:id="Z0522">
     <charName>DILA CHARACTER Z0522</charName>
     <charProp>
       <localName>composition</localName>
       <value>[山*右]</value>
     </charProp>
   </char>
 </charDecl>

</encodingDesc> </teiHeader> </xml>

段落形式

標題

1標題的標法
● <head>標題</head>
● <head>標題</head><byline><persName>作者</persName></byline>
● <head>標題<seg rend="font-size:small">副標題</seg></head>
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg>
● 標題小字要折行:<seg rend="font-size:small;display:block">縮小的字</seg>
● 標題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩

2自訂標題
 1.全自加
  <head><supplied resp="dila.da">自訂標題</supplied></head>
  例:〔劉仁本題跋〕
 2.半自加
  <head>原標題<supplied resp="dila.da">自訂標題</supplied></head>
  例:雞足山志序〔二〕
 3.隱藏自加的標題
  <head rend="display:none"><supplied resp="dila.da">自訂標題</supplied></head>
  例:志名頁
  ps. rend="display:none" 隱藏元素格式(不留白)
    rend="visibility:hidden" 保留元素格式(留白)

3說明
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。
  另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。

段落句首折作標題與否示例(以g074雲居山志 為例)
(一)直接折作標題
     原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。
 
     範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來---
           標題:自寳禪師
           內文:上堂。總恁麽風恬浪靜,那裏得來---

     範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲---
           標題:宗杲大慧禪師
           內文:時圜悟詔住雲居,師往省覲---

     範例3:p82 晦山顯禪師  師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
           標題:晦山顯禪師
           內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---

     範例4:p105 復合神鐘  寺有巨鐘,明中葉院圮---
           標題:復合神鐘
           內文:寺有巨鐘,明中葉院圮---
 
(二)依句頭另作標題[ ]
     原則:若段落首句的文法成份是屬於「主詞」或「前置受詞」的,則應留作內文句頭,而另訂標題。

     範例1:p65 道齊禪師 本州金氏子,徧歷禪會---
           標題:[道齊禪師]
           內文:道齊禪師(主詞),本州金氏子,徧歷禪會---

     範例2:p70 克勤佛果禪師 建炎丁未歲十一月初六日,奉敕住雲居---
           標題:[克勤佛果禪師]
           內文:克勤佛果禪師(主詞),建炎丁未歲十一月初六日,奉敕住雲居---

     範例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居---
           標題:[燕雷鵬禪師]
           內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居---

     範例4:p103 佛印禪師 周茂叔謁見,問曰---
           標題:[佛印禪師]
           內文:佛印禪師(前置受詞),周茂叔謁見,問曰---

     範例5:p106 寺左三塔 沉埋土中多年---
           標題:[寺左三塔]
           內文:寺左三塔(主詞)沉埋土中多年---

○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。

(2)標題後的副標題,可以<seg>(隨機分割)標記之。
.例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
.<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。

(3)若底本格式為「作者在標題之前」,且編輯分類是以「作者」為主時,則作者亦可作標題。
例:g028p458 厲鶚

4長詩題的另訂 關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂標題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對的理由。

5標點符號
(1)標題亦可加新式標點符號,惟結尾不用句點。

段落樣式

樣式語法

◎全段縮小字
 <p rend="font-size:small">全段縮小字</p>
 範例:g009p0427

◎全段縮排一個字
 <p rend="margin-top:1ex;text-indent:0">縮排的段落</p>
 範例:g009p0593

◎全段縮排一個字,但第一行凸排一個字
 <p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落</p>
 範例:g009p0023
 ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。

◎第一行不縮排。(通常用在詩文夾雜的長行段落)
 <p rend="text-indent:0">詩偈後接續的長行<p>
 範例:g062p0104

◎靠右對齊
 <p rend="text-align:right">

◎全段並排小字,有時可以調整為大字
 例:g079 p.004崇眞萬壽宮

序、跋、按語之格式

1. 小序、小引
  1)「詩」(詩行)前小序、小引,做一般段落,並依底本之大小字體編輯之。
   例:g023卷六p371(雲林看雨圖題句小引)
  2)「文」(長行)前小序、小引,全段縮排3格。
   例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)

2. 跋、識(獨立的段落)
  1)跋文本身無標題:全段縮排3格。
    例1:g016p362( - - - 慧荃跋closer)
    例2:g023p363( - - - 魏成憲并識)

  2)跋文本身有標題(或添加標題):作一般段落,不縮排。
    例1:g028p445(--- 大掄敬識)
    例2:g016p1374(李流芳題跋)

3. 按語(獨立的段落)
  全段縮排3格,並依底本之大小字體編輯之。
  例1:g016p378按寺舊志云觀松在香積......
  例2:y105p54按范浦之水來自五雲諸山......

  [註] 在不影響版面之識別效果下,上開底本之小字體可以改大。

  ps.以上規則僅是個大原則,若遇有特殊情況,得依當志之特性而做適切之調整。

表格

表格的標記元素:
 <table>:以表格形式呈現、包含在直行橫列中的文字內容
 <row>:包含表格中的一列
 <cell>:包含表格中的一個儲存格
 <cell rows="列數">:表格合併列
 <cell cols="欄數">:表格合併欄
 實例:請參見中國佛寺志 g089p0254

詩詞歌賦偈

元素

  • <lg>(行組, Line Group)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
  • <l>(詩行)包含詩文的一行,也許是不完整的詩行。
  • <caesura/> 標記韻律詩行可能被截斷的位置。

範例

詩文的呈現方式有二:1.作詩行。2.做長行。

1. 詩行格式通常不用標點,同行兩句間標<caesure/>,如g007p.887。

 <p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作序
師具表奏謝仍進頌曰:
<lg><l>古佛與今佛<caesura/>同一廣長舌</l>
  <l>於無途轍中<caesura/>為物啟途轍</l>
  <l>撥開千嶂雲<caesura/>放出一輪月</l>
  <l>普令大地人<caesura/>言下悉照徹</l>
  <l>覺亦無可圎<caesura/>幻亦無可滅</l>
  <l>只此無亦無<caesura/>紅爐一點雪</l>
  <l>稽首佛與佛<caesura/>字字無異說</l></lg>
既經乙夜之覽皇情大悅</p>
※p內可包lg(已可通過validate驗證)

2. 文章中夾有詩文,若做詩行格式,則不用引號。若必須用,則改用長行,並加標點,如g038p.174。

<p>張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池,
獻詩曰:賊寇臨京口,王師出海邊。四方喧動地,萬姓共瞻天。
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p>

標點

按語的標點規則:
1. 作「據查」解
 g049編按:産西門寨石之「鞏州」,爲今甘肅之隴西縣 。
 g049按:華嚴寺,馮守誦《華嚴經》,感玉女饋餐......
 g049謹按:師,生於上川 。

2. 作「依據」解
 g49按《莊子》,瞿君字鵲子。
 g049按大師此語,凡在峨眉遊居者,皆當......
 g049按《益部方物略》:「海棠,有數種。
 g077按志中,前代諸鉅公經此境者,其唯......

3. 作「依照 、查看」解
 g049按新圖,稽舊聞,亦數月而竣事。
 g049故只按舊志及諸經傳而爲證訂。
 g077按之九華碑版亦然。

詩偈的小字

1.詩偈中,解釋上句(或同行)的註解性質的小字,可標<seg rend="font-size:small">。
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面、</lg>前面)
 (由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l>同行。
  TEI語法的規則,seg無法標在<l></l>外面。)
3.詩偈中,總釋前幾首詩的註解性質的小字,可標<p><note rend="font-size:small"></note></p>。

注意事項

  1. <lg>與<p>是平行的結構,故<lg>與<p>不可互包。應結束</p>後,再標<lg>。
  2. 當詩詞跨頁時,照書換頁,不用顧及排版問題。
  3. 詩偈不用標逗,詩句中間的間隔,以<caesura/>標示。

一頁多欄

 例如:g003p0273

標記元素

1 頁碼
2 人名
 2.1 人名規範資料的建置
 2.2 人名標記標法
 2.3 人名標記凡例
 2.4 人名規範資料建檔注意事項
 2.5 人名標記規則
3 地名
 3.1 地名規範資料的建置
 3.2 地名標記
 3.3 地名標記凡例
 3.4 地名規範資料建檔注意事項
 3.5 地名標記規則
 3.6 地名問答
4 時間
 4.1 時間規範資料的查詢
 4.2 時間標記
 4.3 時間標記凡例
 4.4 時間規範資料建檔注意事項
 4.5 時間標記規則
 4.6 民國年
  4.6.1 時間為民國年的注意事項
  4.6.2 時間為民國年的查法
  4.6.3 時間屬性的變更(2011.01.20)
  4.6.4 時間問答
 4.7 知識備忘
 4.8 朝代code
5 代名詞
 5.1 標法
 5.2 標記時機
6 註解(底本本身)
7 註解(dila.da)
8 空格
9 訛字處理
10 漏字處理
 10.1 缺漏字
 10.2 補字
11 重複字
12 底本本身的刪塗、訂正字
13 印章
14 上標字及頁註
 14.1 上標字
 14.2 頁註
15 圖檔
 15.1 圖檔標記
 15.2 特殊圖表製圖流程(Odg轉svg)
16 標籤label

字元層次

佛寺志專案 特字處理

1 作業環境
2 特字處理方式及工具
3 特字處理原則
3.1 有 unicode 編碼的字
 3.1.1 易於辨識
 3.1.2 不易辨識
3.2 無 unicode 編碼的字
 3.2.1 易於辨識
 3.2.2 不易辨識, 有通用字
 3.2.3 不易辨識, 無通用字
4 特字處理新規則
5 如何統一各志間特字處理方式
6 難檢字庫缺字建檔
7 難檢字庫缺字圖檔製作
 7.1 原則
 7.2 製圖步驟
8 缺字呈現
9 unicode 編碼字
 9.1 CJK漢字編碼範圍
 9.2 編輯器
 9.3 快速尋找unicode的方法
10 有助於增加特字處理效率的工具與方法
11 SVG造字
 11.1 參閱
 11.2 安裝
 11.3 inkscape造字操作法
 11.4 illustrator造字操作法
 11.5 參考範例
12 參考資源

標逗

書名

1.書名的標符樣式:《》
2.書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。

結尾署語

Q:結尾署語<closer>中的文字是否標逗?
A:原則上開放標點,適度添加,方便閱讀。但結束可不加句號。

例如:
元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記

加上標逗:
元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記


Q:closer後仍有文字的情況,如何標記?
A:例如,於g053p247「康熙五年七月二十九日給」後,有「立碑東廊」小字。
由於「立碑東廊」不屬closer的內容,因此在closer結束後將「立碑東廊」標註為note;
為了讓文字靠右,所以又標了一個靠右對齊的p。(單獨note無法靠右)
 標法: <xml code>

<closer>康熙五年七月二十九日給</closer><note>

立碑東廊

</note>

</xml>

詩篇名

詩篇名標符樣式:〈〉

偈頌

標法:<l>詩句<caesura/>詩句</l>
範例:
<lg>
 <l>稽首觀音<caesura/>大悲之主</l>
 <l>我今說偈<caesura/>畧讚所以</l>
 <l>所以者何<caesura/>所謂三摩</l>
 <l>菩薩證入<caesura/>常住寶陀</l>
<lg/>

*偈頌中不使用標點符號,詩句中的分隔,以 <caesura/> 標示。

底本有黑點(•)白點(。)

有些寺志底本中有黑點(•)白點(。),這是個不錯的標逗參考,但可不必完全依照。標逗以文意暢達為要。
例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)
  可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰:

中文數字「零」

中文數字「零」,請統一用這個「〇」(unicode編碼u+3007)
Ps. 其餘「非數字」的圓圈符號,仍可用「○」。(這個○跟上面的〇不同)

巳=已 的處理

文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方式:
在「巳=已」的條件下,一志只在第一次出現的「巳」字做特字標記及註(如下),而後出現的「巳」則直接取代為「已」。
<xml> 第一次出現的「巳」字標記: <choice><orig>巳</orig><reg resp="dila.da">已</reg> <note resp="dila.da">書中「已」字多作「巳」,不煩標註。</note></choice> </xml>

format重整文件

*執行format.py程式,可清除多餘空格及重整元素折行設定。
*電腦條件:電腦中要安裝有python-3.3.0以上版本的程式
 程式放置路徑:Z:\數位典藏組\python
*執行步驟:
1.在(TortoiseGit)\bin\下開啟dos視窗
2.在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)
5.用main檔驗證一下,若是validation,即成。
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。
 (小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)

如何解救亂了格式的文件?

(不小心按到Oxygen工具列的縮排按鈕時用)
1.先將所有自動折行的頁碼接起來
 在亂了格式的檔案下
 → Ctrl+F  →尋找:<pb
facs=
 →取代為:<pb facs=
 →Replace All
 →Close
2.再將所有自動折行的lb接起來
 在亂了格式的檔案下
 →Ctrl+F
 →尋找:<lb
n=
 →取代:<lb n=
 →Replace All
 →Close
3.吃掉所有tag間的空格
 在亂了格式的檔案下
 →Ctrl+F
 →尋找:>[ \n]*<
 →取代:><
 →Replace All
 →Close
4.檢查文件
 看看還有沒有不正常的空白。
5.在Dos下執行git bin下的format.py
6.在git下的output資料夾中取得檔案,看看是否可用。

標記問答

Q:格式問題:是否照書編排?
A:數位文本不必全照書編排。

Q:敬格的情況,有空一格,有另起一行。
A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的標記困擾,決定不遵照底本格式。
  即「敬格」統一都不須空格或另起一行。

Q:並列的文字。
A:不作並列標記。可標記縮小字<seg rend="font-size:small">。

Q:若印刷錯誤,文字內容重複時。
A:可用[註]標示。但若有跨頁,頁碼要放在note的外面。

Q:文本若超出可處理的範圍,如元朝蒙語譯文。
A:可不標句讀,但須於檔頭<teiHeader>作說明。

Q:雙關語的標記(人地混雜)
A:依字面標記元素,以註解說明喻意。
例1:g077p0293
淳氣日凋薄,<placeName key="PL000000021567">鄒</placeName><placeName key="PL000000021513">魯</placeName><note resp="dila.da">此處「鄒魯」代指「孔孟」。鄒魯乃孔子和孟子的誕生地。</note>亡眞承。

例2:g017p0194
笙歌日日娛<persName key="A008915">西子</persName><note resp="dila.da">此處「西子」代指「西湖」。</note>  為愛幽閒到玉岑

Q:oXygen xml文件中,如何取消元素的定義提示?
  oXygen xml文件中,當將鼠標停留在TEI元素上時,會自動pop up出一個解釋該元素定義的小視窗;
  這個小視窗有時會遮擋到文件中正要處理的文字,造成作業的困擾。
A:取消元素定義提示的設定步驟:
  oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip(不要勾選)

佛寺志PDF版

1 凡例備忘
2 圖檔
 2.1 構想
 2.2 各志景點
3 佛寺志PDF版面
 3.1 開本
 3.2 邊界
 3.3 行距
 3.4 字型
 3.5 字體大小
4 佛寺志PDF校訂規則
 4.1 目錄
  4.1.1 擷取層級
  4.1.2 符號樣式
 4.2 內文
  4.2.1 樣式符號
  4.2.2 段落樣式
  4.2.3 標題
  4.2.4 人名
  4.2.5 地名
  4.2.6 時間
  4.2.7 特字
   4.2.7.1 勘誤字(底本中的錯字)
   4.2.7.2 從缺字(易辨識,卻打不出來)
   4.2.7.3 罕見字(難以辨識的罕見字)
   4.2.7.4 特字的註解
  4.2.8 註腳
  4.2.9 詩偈
  4.2.10 小字
  4.2.11 補字
  4.2.12 印章
  4.2.13 書名
  4.2.14 備忘
 4.3 人名索引
 4.4 地名索引
5 討論區

佛寺志粗標

1 電校
2 切檔
 2.1 分檔方式
 2.2 書名頁的納入
 2.3 卷前的標記
 2.4 書名頁(出版社的)的標法
 2.5 題名頁(原刻板的)的標法
3 粗標
 3.1 段落標記
 3.2 行號問題
 3.3 跨頁的表格頁碼
 3.4 補字標記修訂:加resp屬性(2013.05.20)
 3.5 「取代標記,但不取代文字」的正規表示式語法(in oXygen)
 3.6 自加標題標記修訂:加supplied元素(2013.05.20)
 3.7 隱藏的自加標題標記修訂

 3.8 地名標題下的詩偈,不用標<head>(標

及<lg>)
 3.9 詞的上下闕標記法
 3.10 法語中,如有「上堂」法語,可分段。
 3.11 尾註的標法
 3.12 印章的標法、位置
 3.13 圖內的文字
4 特字處理
5 特殊問題
 5.1 稿本有大量塗改的情形,如何標記?
 5.2 新訂標題的原則
 5.3 作者位置經標記人員移動時的註解說明
 5.4 以程式標記詩偈
 5.5 「全段縮排」可取代「小字」
 5.6 長行裡的詩偈,目前可暫不標詩行
 5.7 不縮排的詩行
 5.8 錯位移正後要處理行號嗎?
 5.9 xml文件中的「&」
6 標點符號問題