「《中國佛寺史志》標記作業」:修訂間差異

出自DILA Wiki
imported>Miaomiao
imported>Jiayu.xu
無編輯摘要
 
(未顯示由 7 位使用者於中間所作的 498 次修訂)
行 1: 行 1:
==標記總說==
[http://wiki.dila.edu.tw/pages/%E5%90%8D%E5%B1%B1%E5%8F%A4%E5%89%8E-%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%95%B8%E4%BD%8D%E5%85%B8%E8%97%8F 回《 國佛寺史志》 數位 典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual ]
1. 本專案將以TEI-XML格式進行作業,對於文本 的人名、地名、時間皆加以標記
  及建置資料庫,旨在提供高質量的 數位 化全文。
2.數位化的文本也將加入新式標點符號。
3.文本中的難檢字將採用Unicode字符,
  若於Unicode字庫中尚未收錄的字,則將改以同義異體字代替,或者建立缺字檔。
4.TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。
  「意義標記」著重在付予文字意義,例如:<persName>人名。
  「樣式標記」著重在呈現的樣貌,例如:<lb/>(折行
  TEI-XML標記著重於「意義標記」,而文本呈現的樣貌則多操縱於XSLT。


==檔案架構==
《中國佛寺志》 標記作業<br>
  《中國佛寺 志》 以「志」為單位,每一部志皆有一代碼。(例:重修普陀山志代碼g008)
另可參考 [http://wiki.dila.edu.tw/pages/%E9%81%B5%E5%BE%AA_TEI_%E7%9A%84%E4%BD%9B%E5%AD%B8%E6%95%B8%E4%BD%8D%E5%8C%96_XML_%E6%A8%99%E8%A8%98 遵循 TEI  佛學 數位 化 XML 標記]
 每一志皆由一個主檔(例 重修普陀山志 主檔g008_main)
 及 個小檔(以卷為單 ,例:重修普陀山志卷一g008_01)組成。
 主檔內寫有版本資訊及小檔的鍊結,小檔內則是各卷的內容。


==標記 說明==
= 工作準備=
 
1. 參考資料:
===頁碼===
   進行寺志 標記 前,應先找好該志的相關參考資料,例如:白話本、點校本等。
   1頁碼放置 位置:置於&lt;div>與&lt;head>之
  例1:&lt;div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0">
2. 檔案管理:
    &lt;pb facs="1B009P003.jpg" n="0000a"/>
 本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。
    &lt;head resp="ddbc.da">普陀山志卷前&lt;/head>
 目前檔案資料夾分為三部份:
  例2:&lt;div>
   1)xml(已完成細標 檔案。細標是指有人名、地名、時 的標記)
    &lt;pb facs="1B009P022.jpg" n="0003"/>
  2)xml-basic-g(明丹本)
    &lt;head>重修普陀志叙&lt;/head>
  3)xml-basic-y(廣陵本)
 
3. 作業軟體oXygen(19版)的環境設定
  1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose
  2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾)
  3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排)
  4) 呼叫結構樹 outline:window→Show View→outline
   (結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。)
  
  
 2版本說明頁的頁碼 前無頁碼的頁碼
4. 作業技巧:凡具規則性 大量性 機械 作業 應尋求以程式批次處理 避免人工重複作業
  格 :第一頁0000a 第二頁0000b 第三頁0000c
  例:&lt;div>
    &lt;pb facs="1B009P003.jpg" n="0000a"/>
    &lt;head resp="ddbc.da">版本說明&lt;/head>
  ps.由於卷首需要一個頁碼,因此「版本說明」的頁碼會被挪移到當卷第一個&lt;head>之前
   (見頁碼放置的位置例1)
 
 3插圖頁的頁碼
  格式:插圖前頁頁碼+a
  例:&lt;pb facs="xBxxxPxxx n="0123a""/>
  
  
 4空白頁
5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。 
    上當頁頁碼
    「意義 記」著重在付予文字意義,例如:persName(人名),p(段落)。
   例 :&lt;pb facs="1B009P043.jpg" n="0024"/>
    「樣式標記」著重在樣貌的呈現,即編輯樣式, 如:lb(折行),p rend="" (段落格式)。
   本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。
 
=檔案架構=
 《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。<br>
 (例:重修普陀山志,代碼g008)<br>
 
 每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)<br>
 及數個分檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。<br>
 
 主檔內含有版本資訊(teiHeader)、掃描圖資訊(tei:facsimile)及分檔的鍊結(text xi:include)。<br>
 分檔內則是各卷的內容。<br>
 
●切檔命名規則<br>
志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名頁等)<br>
志碼_00:卷首(題名頁之後的內容,如:序文、目錄、山圖等)<br>
志碼_01:卷一<br>
志碼_02:卷二(以下依卷次類推)<br>
志碼_back:附錄、補編等<br>
志碼_back1:附錄、補編有多卷時,可加序號。例如附編卷一<br>
志碼_back2:附錄、補編有多卷時,可加序號。例如附編卷二<br>


 5內文頁碼
  <pb facs="1B009P294.jpg" n="0275"/>


===標 ===
●特殊例子的切檔<br>
例:<br>
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷 情勢做適當的調整)。<br>
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6<br>
g087_03-1,g087_03-2<br>


 1標題的標法
=加facs碼=
  ● &lt;head> 標題&lt;/head>
<b>1.執行git中的facs.py程式,為內文中的pb加上facs</b><br>
  ● &lt;head>標題&lt;/head>&lt;byline>&lt;persName>作者&lt;/persName>&lt;/byline>
 例:原<pb n="0041"/><br>
  ● &lt;head resp="ddbc.da"> 自加標題&lt;/head>
   執行程式後變成<pb facs="1B017P108.jpg" n="0041"/><br>
  ● &lt;head> 標題&lt;seg rend="font-size:small">副標題&lt;/seg>&lt;/head>
 
  
<b>2.請網路工程師(阿賢)為main檔加facsimile</b><br>
 2說明
   將 好pb facs 檔案,連同main檔 一併交給工程師。工 在main檔 入如下 的標記:<br>
  (1)若篇章缺乏標題者,可「自訂標題」。
<xml code>
  自 加的 標題將會出現在網頁左欄的樹狀目錄結構上 自動加上括弧,
  <tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0">
  以與文本上實有的標題區分。但自 加的 標題不會呈現在網頁全文化的內文中。
  <tei:graphic url="1B017P108.jpg"/>
  文本 標記 的格式 &lt;head resp="ddbc.da"> 自加的標題&lt;/head>
   <tei:graphic url="1B017P109.jpg"/>
  網頁樹狀目錄所呈現的樣式:(自加的標題)
 ......
 ......
   (2)標題後的副標題,可以&lt;seg>(隨機分割)標記之。
</xml>
   例:&lt;div>&lt;head>大安禪師&lt;seg rend="font-size:small"> 上堂一則   機緣二則&lt;/seg>&lt;/head>
 
   #&lt;seg>(隨機分割)包含文件中任何隨機字詞層次 單元(包括其他分割元素)。
<b> 注意事項:卷內的pb facs要與main中的facsimile url同步</b><br>
 
各卷內 頁碼有時會 錯誤,當修改pb facs碼 時, 請順便也要一併修改main中的facsimile url 這樣文件才會完整 <br>
  (3)若 長標題 時, 亦用長標題 不自訂短標題
  例:y141_00 <pb facs="4B100P005.jpg" n="0001"/><br>
  
  Y141_main <tei:graphic url="4B100P005.jpg"/><br>
 3標題亦可加新式標點符號。


===人名===
= 文件宣告=
 1 人名規範資料的建置(若欲建檔 ,請 先以帳號密碼登入)
 1 各卷文件宣告列 ,請 一致用:<br>
   ● 人名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/person/
<?xml version="1.0" encoding="UTF-8"?>(雙引號 大寫UTF)
   ● 人名規範資料建檔方式 請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「人名規範資料庫」]
   ● 人名規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]


 2 人名 標記 標法:
 2 缺字在檔頭宣告,其流程:<br>
   &lt;persName key="Axxxxxx"> 某某某&lt;/persName>
<xml code>
   &lt;persName key="unknown"> 未知的人名&lt;/persName>
1)開啟main檔
   &lt;persName key="Gxxxxxx"> 人名群組&lt;/persName>
2)在</fileDesc>之後加上以下的群組 標記
   &lt;roleName> 稱謂&lt;/roleName> (須包在&lt;persName> 內)
<encodingDesc>
   &lt;roleName type="honorific"> 尊稱&lt;/roleName> (須包在&lt;persName> 內)
  <charDecl>
   &lt;name> 族姓&lt;/name>
   <char xml:id="Z0001"> <!-- Z0001為DILA難檢字庫 ID -->
    <charName>DILA CHARACTER Z0001</charName>
    <charProp>
     <localName>CBETA</localName> <!-- CB碼 -->(若無可省略)
     <value>CB30005</value>
    </charProp>
    <charProp>
     <localName>composition</localName> <!-- 組字式 -->
     <value>[宀/廣]</value>
    </charProp>
   </char>
  </charDecl>
</encodingDesc>
3)在當志中,用「<g ref="#」搜尋出所有缺字。
4)逐一將缺字碼放在「DILA 難檢字庫」中檢索,將缺字資料填補入缺字宣告中。
(從缺的項目可省略)


  3 人名標記凡
 例 :g069_main
{| style="color:green;background-color:#ffffcc;" cellpadding="2" cellspacing="0" border="1"
</fileDesc>
!稱謂型態
<encodingDesc>
! 凡例
  <charDecl>
! 標記
   <char xml:id="Z0393">
|-
    <charName>DILA CHARACTER Z0393</charName>
|官稱
    <charProp>
|<ul><li>韋左司</li><li>韋應物左司</li><li>杜副校長正民</li></ul>
     <localName>composition</localName>
|<ul><li><persName>韋<roleName>左司<roleName></persName></li>
     <value>[ *克]</value>
<li><persName>韋應物<roleName>左司</roleName></persName></li>
    </charProp>
<li><persName>杜<roleName>副校長</roleName>正民</persName></li></ul>
   </char>
|-
   <char xml:id="Z0523">
|地名當人名
    <charName>DILA CHARACTER Z0523</charName>
|<ul><li>韋蘇州</li><li>塩官國師</li><li>臨濟</li><li>天童圓悟大師</li></ul>
    <charProp>
|<ul><li><persName>韋<placeName>蘇州</placeName></persName>(指韋應物)</li>
     <localName>composition</localName>
<li><persName><placeName>塩官</placeName><roleName>國師</roleName></persName></li>
     <value>[風*丘]</value>
<li><persName><placeName>臨濟</placeName></persName></li>
    </charProp>
<li><persName><placeName>天童</placeName>圓悟<roleName>大師</roleName></persName></li></ul>
   </char>
|-
   <char xml:id="Z0522">
|連名
    <charName>DILA CHARACTER Z0522</charName>
|<ul><li>大鶴居士鄭文焯</li><li>花之寺僧羅聘</li><li>華陽眞人陶貞白先生宏景</li></ul>
    <charProp>
|<ul><li><persName>大鶴<roleName>居士</roleName>鄭文焯</persName></li>
     <localName>composition</localName>
<li><persName>花之寺僧羅聘</persName>(不加roleName)</li>
     <value>[山*右]</value>
<li><persName><placeName>華陽</placeName><roleName>眞人</roleName>陶貞白<roleName>先生</roleName>宏景</persName></li></ul>
    </charProp>
|-
   </char>
|子
  </charDecl>
|<ul><li>寒山子</li><li>殳子山夫</li><li>楊氏子</li></ul>
</encodingDesc>
|<ul><li><persName>寒山子</persName></li>
</teiHeader>
<li><persName>殳<roleName type= ”honorific”>子</roleName>山夫</persName></li>
</xml>
<li>如堂,寂光寺僧,澂江<name>楊</name>氏子(楊,在此指其族姓)</li></ul>
|-
|兒
|<ul><li>陵兒</li></ul>
|<ul><li><persName>陵<roleName>兒</roleName></persName></li></ul>
|-
|公
|<ul><li>歐陽文忠公</li><li>忠定公燮元</li></ul>
|<ul><li><persName>歐陽文忠<roleName type=”honorific”>公</roleName></persName></li>
<li><persName>忠定<roleName type=”honorific”>公</roleName>燮元</persName></li></ul>
|-
|氏
|<ul><li>大雄氏(指佛)</li><li>孔雀氏(指阿育王)</li><li>俞氏</li></ul>
|<ul><li><persName>俞氏</persName>(皆直標persName,不用標roleName)</li></ul>
|-
|師、本師
|<ul><li>本師阿彌陀如來(「非人」單純標人名,不加稱謂)</li></ul>
|<ul><li>本師<persName>阿彌陀如來</persName></li>
<li><persName>阿彌陀佛</persName></li>
<li><persName>阿彌陀佛</persName>如來本地</li></ul>
|-
|大士、菩薩
|<ul><li>觀音大士</li><li>普賢菩薩(「非人」單純標人名,不加稱謂)</li></ul>
|<ul><li><persName>觀音大士</persName></li>
<li><persName>普賢菩薩</persName></li></ul>
|-
|
|<ul><li>漁洋山人</li></ul>
|<ul><li><persName>漁洋山人</persName></li></ul>
|-
|上人
|<ul><li>悟上人</li></ul>
|<ul><li><persName>悟<roleName type= ”honorific”>上人</roleName></persName></li></ul>
|-
|老
|<ul><li>印老法師</li><li>南亭老和尚</li></ul>
|<ul><li><persName>印<roleName type=”honorific”>老法師</roleName></persName></li>
<li><persName>南亭<roleName type=”honorific”>老和尚</roleName></persName></li></ul>
|-
|老人
|<ul><li> 南極老人</li><li>無著老人</li></ul>
|<ul><li><persName>南極老人</persName> (慣用語、專名)</li>
<li>惟我先師<persName>無著<roleName type=”honorific”>老人</roleName></persName>(一般稱謂,標<roleName>)</li>
|-
|翁
|<ul><li>壑翁相國(賈秋壑)</li></ul>
|<ul><li><persName>壑<roleName type= ”honorific”>翁</roleName><roleName>相國</roleName></persName></li></ul>
|-
|先生
|<ul><li>半農先生</li></ul>
|<ul><li><persName>半農<roleName type=”honorific”>先生</roleName></persName></li></ul>
|-
|夫人
|<ul><li>許夫人</li><li>秦國夫人計氏</li></ul>
|<ul><li><persName><roleName>秦國夫人</roleName>計氏</persName></li></ul>
|-
|諡號
|<ul><li>謚「大悟禪師」</li><li>賜號「廣慧妙悟智寶宏教禪師」</li><li>妙覺圓通慧慈普應輔國顯教灌頂弘善西天佛子大國師釋迦也失</li></ul>
|<ul><li><persName>大悟<roleName>禪師</roleName></persName></li>
<li><persName>廣慧妙悟智寶宏教<roleName>禪師</roleName></persName></li><li><persName><roleName>妙覺圓通慧慈普應輔國顯教灌頂弘善西天佛子大國師</roleName>釋迦也失</persName>。(皇帝賜給的封號與本身的名字連用時,可將封號變通為<roleName>。)</li></ul>
|-
|皇帝(皇后)
|<ul><li>世宗憲皇帝</li><li>梁皇</li><li>慈寧皇太后</li></ul>
|<ul><li><persName>世宗憲<roleName>皇帝</roleName></persName></li>
<li><persName>慈寧<roleName>皇太后</roleName></persName></li></ul>
|-
|帥
|<ul><li>筱帥</li></ul>
|<ul><li><persName>筱<roleName>帥</roleName></persName></li></ul>
|-
|君
|<ul><li>須直君</li><li>葛君</li></ul>
|<ul><li><persName>葛<roleName type=”honorific”>君</roleName></persName></li></ul>
|-
|諱
|<ul><li>王諱舉(王舉)</li></ul>
|<ul><li><persName> 王</persName>諱<persName>舉</persName></li></ul>
|-
|}


4 人名規範資料建檔注意事項
= 段落 式=
(1)名字:
== 題==
   a)常名、別名請冠上姓氏,以便利檢索。
   b)每一語系中,應有一常名,餘則為別名。
(2)缺字:人名中有缺字時,人名欄位以通用字表示。
(3)朝代:以此人的卒年為依。
(4)籍貫:其地名朝代以此人的生年為依。
(5)生卒年
   a)生年的計算:生年= 卒年-歲壽+1
   b)生卒年的取捨:若資料來源有干支年及西元年,以取干支年為準。
    例:重顯(980~1052),宋代雲門宗僧。於皇祐四年入寂。
     建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。
(6)是否為歷史人物:若非歷史人物,則在此欄位勾「否」。
(7)註解:
   a)以120個字為限(阿拉伯數字不算字數,標點符號算字數),並請使用全 標點符號。
   b)若此人查不到生卒年,則應在註解欄的資料中盡可能節錄相關人事物的時間參考點。
   c)僧人註解資料的基本要件:師承、師兄弟、著作、法嗣、事件時間。
   d)引用資料,盡量以紙本、藏經或佛學辭典為優先。
    使用網路資料時,應注意留存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。
   e)引用資料時須註明資料來源。出處的作用:1).說明資料來源 2).幫助使用者搜尋(Finding Aid)
   f)「佛學規範資料庫」對於經常引用的參考工具書編有「簡稱」,引用這些參考書時請以這些「簡稱」為依。
   g)Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。
(8)若是查詢不到任何資料的人名,請不用收錄至規範資料庫。(文本上 key="unknown" 即可)


  5 人名 記規則
  的標 法<br>
(1)文本中出現 人名,皆應 記。(例外:書名號內的人名,不標記。)
  ● &lt;head> 標題&lt;/head><br>
  
&lt;head>標題&lt;/head>&lt;byline>&lt;persName>作者&lt;/persName>&lt;/byline><br>
  (2) 標題 後的人名是「作者」時的標法
&lt;head> 題&lt;seg rend="font-size:small">副標題&lt;/seg>&lt;/head><br>
   &lt;head>標題&lt;/head>&lt;byline>&lt;persName key="Axxxxxx">作者 &lt;/persname>&lt;/byline>
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg><br>
  (&lt;byline> :包含作品的主要責任陳述,出現在 名頁或作品開頭或結尾處即署名之意。)
●  題小字要折行:<seg rend="font-size:small;display:block">縮小 字</seg><br>
  
  題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩<br>
(3)遇人名不確定是否為某人時,可加屬性值標示。
   例:&lt;persName key="A001606" cert="70%">
   cert是表示 記者認為 正確度,是相對值,非絕對的。
  
  (4)非人,非人界皆要 記。(2011/1/27回函決議)


[[#三、人 |返三、人名]]
2自訂標題<br>
 1.全自加<br>
  &lt;head>&lt;supplied resp="dila.da">自訂標題&lt;/supplied>&lt;/head><br>
  例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0309 〔劉仁本題跋〕]<br>
 2.半自加<br>
  &lt;head>原標題&lt;supplied resp="dila.da">自訂標題&lt;/supplied>&lt;/head><br>
  例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g084&cpage=0005 雞足山志序〔二〕]<br>
 3.隱藏自加的標題<br>
  &lt;head rend="display:none">&lt;supplied resp="dila.da">自訂標題&lt;/supplied>&lt;/head><br>
  例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0001 志 ]<br>
  ps.  rend="display:none" 隱藏元素格式(不留白)<br>
    rend="visibility:hidden" 保留元素格式(留白)<br>


===地名===
3說明<br>
  地名規 資料 置( 若欲 請先以帳號密碼登入
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。<br>
  ● 地名規 資料庫網頁 http://dev.ddbc.edu.tw/authority/place/
  另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。<br>
  ● 地名規 資料建檔方式 請參閱「 學規 資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「 地名規範資料庫 ]
 段落句首折作標題與否示例(以g074雲居山志 為例)
  ● 地名規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]
 (一)直接折作標題
    原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。
 
    範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來---
       標題:自寳禪師
       內文:上堂。總恁麽風恬浪靜,那裏得來---
    範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲---
       標題:宗杲大慧禪師
       內文:時圜悟詔住雲居,師往省覲---
  
    範例3:p82 晦山顯禪師  師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
       標題:晦山顯禪師
       內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
  
    例4:p105 復合神鐘  寺有巨鐘,明中葉院圮---
       標題:復合神鐘
       內文:寺有巨鐘,明中葉院圮---
 
 (二)依句頭另作標題[ ]
    原則:若段落首句 文法成份是屬於「主詞」或「前 受詞」的,則應留作內文句頭,而另訂標題。
    範例1:p65 道齊禪師 本州金氏子,徧歷禪會---
       標題:[道齊禪師]
       內文:道齊禪師 主詞),本州金氏子,徧歷禪會---
    範例2:p70 克勤佛果禪師  炎丁未歲十一月初六日 奉敕住雲居---
       標題:[克勤佛果禪師]
       內文:克勤佛果禪師(主詞 ,建炎丁未歲十一月初六日,奉敕住雲居---
  
    例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居---
       標題:[燕雷鵬禪師]
       內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居---
  
    例4:p103 佛印禪師 周茂叔謁見 問曰---
       標題:[佛印禪師]
       內文: 印禪師(前置受詞),周茂叔謁見,問曰---
    例5:p106 寺左三塔 沉埋土中多年---
       標題:[ 寺左三塔]
       內文:寺左三塔(主詞)沉埋土中多年---
 ○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。
(2)標題後的副標題,可以&lt;seg>(隨機分割)標記之。<br>
.例:&lt;div>&lt;head>大安禪師&lt;seg rend="font-size:small">上堂一則 機緣二則&lt;/seg>&lt;/head><br>
.&lt;seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。<br>
  
(3)若底本格式為「作者在標題之前」,且 編輯 分類是以 作者 為主時,則作者亦可作標題。<br>
  例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g028&cpage=0458 g028p458 厲鶚]<br>


  地名
  4長詩題的另訂
&lt;xml code>標法:
  關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂 題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對 理由。
   &lt;placeName key="xxxxxxxxxxxxxx">地名&lt;/placeName>
   &lt;placeName key="unknown">未知 地名&lt;/placeName>
   &lt;placeName key="xxxxxxxxxGxxxx">地名群組&lt;/placeName>&lt;/xml>


  3 地名 記凡例
  點符號<br>
{| border="1" cellpadding="0" cellspacing="0"
(1)標題亦可加新式 標點 符號 惟結尾 用句點。<br>
|+
! 型態
! 凡例
|-
|單純行政區地名
|杭州
|&lt;placeName key="CN0330103Z19AA">杭州&lt;/placeName>
(需配合文意而選擇朝代別)
|-
|單純自然區地名
|普陀山
|&lt;placeName key="CN0330903M01AA">普陀山&lt;/placeName>
|-
|連名
|四川峨眉縣
|&lt;placeName key="CN0511181Z02AA">四川峨眉縣&lt;/placeName>
(以連名的最小地 為其ID)
|-
|地名中含人名
|遂賜額曰「天花尊者開巖院」
|&lt;placeName key="CN0331023T57AA">&lt;persName key="unknown">天花尊者&lt;/persName>開巖院&lt;/placeName>
|-
|寺內建築:一般
|大雄寶殿、放生池
|文本不標 資料庫
|-
|寺內建築:具特殊意義
|阿育王寺舍利塔殿
|文本應標,資料庫應建
|-
|地名群組
|五嶽
|&lt;placeName key="CN0000000G07AA">五嶽&lt;/placeName>
|
|}


4 地名規範資料建檔注意事項
==段落樣式==
  (1)地名尾碼非AA碼者,不可重新編碼,因為會牽涉到相同主碼的其他地名。
===樣式語法===
  (2)Google map與衛星圖的經緯度有落差,在標經緯度時以衛星圖為主。
  ◎全段縮小字<br>
  (3)地名的建置,註解欄注意事項請參閱[[4人名規範資料建檔注意事項]] 內有關註解的條目。
   &lt;p rend="font-size:small">全段縮小字&lt;/p><br>
   範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0427 g009p0427]<br>


  5 地名標記規則
  ◎全段縮排一個字<br>
 ● 文本中出現 地名,皆應標記,但除了(小地名不標外)。
   &lt;p rend="margin-top:1ex;text-indent:0">縮排 段落&lt;/p><br>
 ● 非人界、傳說中的地名,不用標記、建檔。
   範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0593 g009p0593]<br>


[[#四、地名|返四、地名]]
◎全段縮排一個字,但第一行凸排一個字<br>
 &lt;p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落&lt;/p><br>
 範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0023 g009p0023]<br>
 ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。


===時間===
  ◎第一行不縮排。(通常用在詩文夾雜 長行段落 <br>
  1 時間規範資料 查詢(若欲查詢,請先以帳號密碼登入
   &lt;p rend="text-indent:0">詩偈後接續的長行&lt;p><br>
  ● 時間規範資料庫網頁 http://dev.ddbc.edu.tw/authority/time/
    例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g062&cpage=0104 g062p0104]<br>
  ● 時間規 資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]


  2 時間標記
  ◎靠右對齊<br>
 ● 標法:
   &lt;p rend="text-align:right"><br>
&lt;date key="j+(起始時間碼)+(結尾時間碼)" notBefore-iso="起始西元年-月-日" notAfter-iso="結尾西元年-月-日">區段性的某時間&lt;/date>
  &lt;date key="j+(開始時間碼)+(結束時間碼)" from-iso="開始西元年-月-日" to-iso="結束西元年月日"> 事件持續進行的時間&lt;/date>
&lt;date key="j+(當日時間碼)+(當日時間碼)" when-iso="西元年-月-日">時間點&lt;/date>
&lt;date key="unknown">未知的時間&lt;/date>


  3 時間標記凡例
  ◎全 並排小字,有 調整為大字<br>
{|border="1" cellpadding="0" cellspacing="0"
 例:g079 p.004崇眞 壽宮<br>
|-
!時間型態
!凡例
!標記
|-
|區 性的某
|余 光緒己卯游天台
|&lt;date key="j24073722407755" notBefore-iso="1879-01-22" notAfter-iso="1880-02-09">光緒己卯&lt;/date>
 說明:a)key2407372:光緒己卯年正月一日ID
    b)key2407755:光緒己卯年正月三十日
    c)notBefore-iso:光緒己卯年正月一日ID
    d)notAfter-iso:光緒己卯年正月三十日
|-
|明確日期
|萬曆庚戌年五月十六日
|&lt;date key="j23092772309277" when-iso="1610-06-26"> 曆庚戌年五月十六日&lt;/date>
|}


===序、跋、按語之格式===
1. 小序、小引<br>
  1)「詩」(詩行)前小序、小引,做一般段落,並依底本之大小字體編輯之。<br>
   例:g023卷六p371(雲林看雨圖題句小引)<br>
  2)「文」(長行)前小序、小引,全段縮排3格。<br>
   例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)<br>


  4 時間規範資料建檔注意事項
2. 跋、識(獨立的段落)<br>
  (1)佛寺志專案使用Julian day number時間系統,請確認介面是否選用此項
    1)跋文本身無標題:全段縮排3格 <br>
  (2)若未「登入」時間規範資料庫,查詢結果將不會自動計算「初年」、「末年」等較詳細之資訊。
      例1:g016p362( - - - 慧荃跋closer)<br>
  (3)時間的查詢有多種管道:中國年 朝代、帝號、年號、年干支 ,西元年(三種方式),ID碼。
      例2:g023p363 - - - 魏成憲并識 <br>


  5 時間標記規則
    2)跋文本身 有標 (或 添加標題 :作一般段落 不縮排。<br>
(1) 明確年號、年代、或月日等的時間,皆應 記;
    例1:g028p445(--- 大掄敬識)<br>
   無法證知 從前後文 其他資料皆無法得知 的時間
    例2:g016p1374(李流芳題跋)<br>
   則可標記&lt;date key="unknown"> 未知年的時間&lt;/date>


  (2)有些時間因文本錯誤以致無法找到id,可用note註解,
3. 按語(獨立的段落)<br>
  例:當穆王五十三年壬申二月十五子夜 入般涅槃
  全段縮排3格 並依底本之大小字體編輯之。<br>
  &lt;date key="unknown"> 穆王 十三年壬申二月十五子夜&lt;/date>
  例1:g016p378按寺舊志云觀松在香積......<br>
  &lt;note resp="ddbc.da">據《中國史厯日和中西厯日對照表》(方詩銘、方小芬編著,上海人民出版社2007)編載,周穆王只行到四十一戊戌年(-983)。&lt;/note>
  例2:y105p54按范浦之水來自 雲諸山......<br>


  (3)初年,末年時間的擷取原則
    [註] 在不影響版面之識別效果下 上開底本之小字體可以改大 <br>
  取當朝、當年號、當年的前1/4為其初年 末1/4為其末年


  (4)時間為民國年的注意事項:
    ps. 以上規則僅是個大原則 若遇有特殊情況 得依當志之特性而做適切之調整。<br>
   A. 民國十三年 → 用西曆
   B.民國十三年冬 → 標示西曆民國十三年11月~民國十四年2月
   (西曆:春3-5月,夏6-8月 秋9-11月 冬11-2月)
   C.民國十三年甲子 → 用農曆民國甲子年
   D.民國十三年甲子冬 → 用農曆民國甲子年10~12月


  (5)時間為民國年 查法
==表格==
  登入網頁「兩千年 西曆轉換」http://sinocal.sinica.edu.tw/
  表格 標記元素 <br>
  兌換出相對應 西元時間,再到時間規範資料庫換算ID碼即可。
 &lt;table>:以表格形式呈現、包含在直行橫列 的文字內容<br>
  例:民國壬寅年
 &lt;row>:包含表格中 一列<br>
  兌換出為西元1962年2月5日~1963年1月24日
 &lt;cell>:包含表格中的一個儲存格<br>
  再到時間規範資料庫以西元年查詢為5949266~5949619
 &lt;cell rows=" 列數">:表格合併列<br>
  即&lt;date key="d59492665949619"
 &lt;cell cols=" 欄數">:表格合併欄<br>
    notBefore="1962-02-05" notAfter="1963-01-24">
 實例:請參見中國佛寺志 g089p0254<br>


(6)時間屬性的變更:(2011.01.20)
== 詩詞歌賦偈==
   notBefore,notAfter,from,to,when,全要加上-iso(計算0年)
   如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso
   例:&lt;date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13">哀帝元壽間&lt;/date>


(7)萬 丙子秋 =萬曆丙子秋
===元素===
   例:&lt;date> 萬 丙子秋&lt;/date> (照 時間,空格不再處理
*&lt;lg> 行組, Line Group 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
*&lt;l> (詩行)包含詩文的一行,也許是不完整的詩行。
*&lt;caesura/> 記韻律詩行可能被截斷的位置


(8)屬性key,notBefore,notAfter的先後順序不一,不會影響驗證或呈現。
=== 範例===
   例:&lt;date key="j22968992296986" notBefore-iso="1576-08-05" notAfter-iso="1576-10-31">萬曆丙子秋&lt;/date>
詩文的呈現方式有二:1.作詩行。2.做長行。<br>
   =&lt;date notAfter-iso="1576-10-31" notBefore-iso="1576-08-05" key="j22968992296986">萬曆丙子秋&lt;/date>


  (9)當時 同時有年次、歲次時 可只標較詳細的歲次時間
1. 詩行格式通常不用標點,同行兩句 標<caesure/> 如g007p.887 <br>
   例:時宣統三年,歲在&lt;date key="j24192292419229" when-iso="1911-07-11"> 辛亥六 旣望&lt;/date> ,長洲葉昌熾謹記
<syntaxhighlight lang="XML">
 <p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作序
師具表奏謝仍進頌曰:
<lg><l>古佛與今佛<caesura/>同一廣長舌</l>
  <l>於無途轍中<caesura/>為物啟途轍</l>
  <l>撥開千嶂雲<caesura/>放出一輪 </l>
  <l>普令大地人<caesura/>言下悉照徹</l>
  <l>覺亦無可圎<caesura/>幻亦無可滅</l>
  <l>只此無亦無<caesura/> 紅爐一點雪</l>
  <l>稽首佛與佛<caesura/>字字無異說</l></lg>
既經乙夜之覽皇情大悅</p>
※p內可包lg(已可通過validate驗證)
</syntaxhighlight>


  (10)時間名詞+初、初年、末、末年、年:包進時間。
2. 文章 夾有詩文,若做詩行格式,則 用引號。若必須用,則改用長行,並加標點,如g038p.174 <br>
   時間名詞+ 、間、年間: 包進時間
<syntaxhighlight lang="XML">
   例1:&lt;date> 萬曆初&lt;/date>
<p> 張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池,
   例2 &lt;date> 曆三年&lt;/date>
獻詩曰 賊寇臨京口,王師出海邊。四方喧動地, 姓共瞻天。
   例3:&lt;date>萬曆&lt;/date> 年間
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p>
</syntaxhighlight>


(11)清光緒末年的時間計算問題(德宗&恭宗皆以光緒為年號)
===標點===
  a)光緒末年,指德宗+恭宗 年代的末1/4。
<b>按語 標點規則:</b><br>
   阿賢 無法用程式計算 請各位自己計算
1. 作「據查」解<br>
  b)志偉的意見 若有數個 則取最長的那一個末年 則取德宗光緒的末年即可
 g049編按 産西門寨石之「鞏州」 爲今甘肅之隴西縣  <br>
 g049按 華嚴寺 馮守誦《華嚴經》,感玉女饋餐......<br>
 g049謹按:師 生於 川  <br>


  (12)朝代 仍標時間 但不 輸出頁面(內文)上呈現 而以 表」的方式附錄在索引項中。
2. 作「依據」解<br>
 g49按《莊子》 瞿君字鵲子。<br>
 g049按大師此語 峨眉遊居者 皆當......<br>
 g049按《益部方物略》: 海棠,有數種。<br>
 g077按志中,前 諸鉅公經此境者,其唯......<br>


  6 知識備忘
3. 作「依照 、查看」解<br>
  (1)春=農曆1-3月 夏=農曆4-6月 秋=農曆7-9月,冬=農曆10-12
   g049按新圖 稽舊聞 亦數 而竣事。<br>
  (2)農曆月份的別名
   g049故只按舊志及諸經傳而爲證訂 <br>
   一月:孟春、元春、開歲、端月、嘉月、正月
 g077按之 華碑版亦然 <br>
   二月:仲春、杏月、麗月、如月、花月。
   三月:季春、晚春、暮春、季月、蠶月、桃月、桐月。
   四月:孟夏、麥月、陰月、梅月、純陽。
   五月:仲夏、榴月、蒲月、皋月、毒月。
   六月:季夏、暑月、焦月、荷月、荔月。
   七月:孟秋、新秋、蘭秋、蘭月、瓜月、巧月。
   八月:仲秋、竹春、桂月、壯月。
   月:季秋、暮商、菊月、朽月、陽月、季秋。
   十月:孟冬、初冬、開冬、露月、良月、陽月。
   十一月:仲冬、辜月、葭月、龍潛月、冬月。
   十二月:季冬、殘冬、臘月、冰月、嚴月


[[#五 時間|返五、時間]]
===詩偈的小字===
1.詩偈中,解釋上句(或同行)的註解性質的小字,可標<seg rend="font-size:small">。<br>
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面 </lg>前面)<br>
 (由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l>同行。<br>
  TEI語法的規則,seg無法標在<l></l>外面。)<br>
3.詩偈中,總釋前幾首詩的註解性質的小字,可標&lt;p>&lt;note rend="font-size:small">&lt;/note>&lt;/p>。<br>


=== 代名詞===
=== 注意事項===
#&lt;lg>與&lt;p> 是平行的結構,故&lt;lg> &lt;p> 不可互包。應結束&lt;/p> 後,再標&lt;lg>
1標法:
#當詩 跨頁時,照書換頁,不用顧及排版問題。
&lt;ref key="Axxxxxx"> 人名代名詞&lt;/ref>
#詩偈不用標逗,詩句中間的間隔,以&lt;caesura/> 標示。
 例:&lt;ref key="A003940"> &lt;/ref> (余指徐時泰)
&lt;ref key="xxxxxxxxxxxxxx"> 地名代名 詞&lt;/ref>
 例:待補


  2標記時機:當詞意不明顯時才須標
==一頁多欄==
   例如:g003p0273


=[http://wiki.dila.edu.tw/pages/%E6%A8%99%E8%A8%98%E5%85%83%E7%B4%A0 標記元素]=
1 頁碼<br>
2 人名<br>
 2.1 人名規範資料的建置<br>
 2.2 人名標記標法<br>
 2.3 人名標記凡例<br>
 2.4 人名規範資料建檔注意事項<br>
 2.5 人名標記規則<br>
3 地名<br>
 3.1 地名規範資料的建置<br>
 3.2 地名標記<br>
 3.3 地名標記凡例<br>
 3.4 地名規範資料建檔注意事項<br>
 3.5 地名標記規則<br>
 3.6 地名問答<br>
4 時間<br>
 4.1 時間規範資料的查詢<br>
 4.2 時間標記<br>
 4.3 時間標記凡例<br>
 4.4 時間規範資料建檔注意事項<br>
 4.5 時間標記規則<br>
 4.6 民國年<br>
  4.6.1 時間為民國年的注意事項<br>
  4.6.2 時間為民國年的查法<br>
  4.6.3 時間屬性的變更(2011.01.20)<br>
  4.6.4 時間問答<br>
 4.7 知識備忘<br>
 4.8 朝代code<br>
5 代名詞<br>
 5.1 標法<br>
 5.2 標記時機<br>
6 註解(底本本身)<br>
7 註解(dila.da)<br>
8 空格<br>
9 訛字處理<br>
10 漏字處理<br>
 10.1 缺漏字<br>
 10.2 補字<br>
11 重複字<br>
12 底本本身的刪塗、訂正字<br>
13 印章<br>
14 上標字及頁註<br>
 14.1 上標字<br>
 14.2 頁註<br>
15 圖檔<br>
 15.1 圖檔標記<br>
 15.2 特殊圖表製圖流程(Odg轉svg)<br>
16 標籤label<br>


[[#《中國佛寺史志》數位典藏工作手冊|返目錄]]
=字元層次=


===註解(ddbc.da)===
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 佛寺志專案 特字處理]==
  
  1.註解內無超連結
  標法:&lt;note resp="ddbc.da">註解文字&lt;/note>
  例:梁視&lt;note resp="ddbc.da">視,疑爲「祖」字。&lt;/note>普通三年


  2. 註解內 超連結
1 作業環境<br>
  標法:&lt;note resp="ddbc.da"> 註解文 (&lt;ptr target="網址"/> ,日期)&lt;/note>
2 特字處理方式及工具<br>
  例:應案&lt;note resp="ddbc.da"> 「案」 ,萬福禪寺網站此 處作 「索」。
3 特字處理原則<br>
 (&lt;ptr target="http://www.huangboshan.com/zisusifu.htm"/> ,2010.05.04)&lt;/note> 屐而自潸。(g010p0445)
3.unicode 編碼的字<br>
 3.1.1 易於辨識<br>
 3.1.2 不易辨識<br>
3.2 無 unicode 編碼的 <br>
 3.2.1 易於辨識<br>
 3.2.2 不易辨識, 有通用字<br>
 3.2.3 不易辨識, 無通用字<br>
4 特 字處 理新規則<br>
5 如何統一各志間特字處理方式<br>
6 難檢字庫缺字建檔<br>
7 難檢字庫缺字圖檔製 <br>
 7.1 原則<br>
 7.2 製圖步驟<br>
8 缺字呈現<br>
9 unicode 編碼字<br>
 9.1 CJK漢字編碼範圍<br>
 9.2 編輯器<br>
 9.3 快速尋找unicode的方法<br>
10 有助於增加特字處理效率的工具與方法<br>
11 SVG造字<br>
 11.1 參閱<br>
 11.2 安裝<br>
 11.3 inkscape造字操作法<br>
 11.4 illustrator造字操作法<br>
 11.5 參考範例<br>
12 參考資源<br>


3.註解引用自CBETA資料時
==標逗==
  標法:&lt;note resp="ddbc.da">CBETA經文(CBETA預設 引用格 )&lt;/note>
===書名===
  例 著作郎&lt;persName key="A010335">顧允祖&lt;/persName>&lt;note resp="ddbc.da">
1. 書名 標符樣 式: 《》<br>
  《集神州三寶感通錄》卷1:「著作郎顧胤祖」(CBETA, T52, no. 2106, p. 405, a17)&lt;/note>
2. 書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。<br>


其他規則
===結尾署語===
(1) 題內的註解,請置於&lt;head> 內。
Q 結尾署語<closer>中的文字是否 逗?<br>
  例 &lt;head>于黃檗丈室堂第三代隱元隆琦國師  堂九則 機緣三則&lt;note resp="ddbc.da">
A 原則 開放 適度添加 方便閱讀。但結束可不加句號 <br>
  按: 題為上堂法語九則 機緣三則;內文實則收錄上堂法語八則 機緣五則 &lt;/note>&lt;/head>


例如:<br>
元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記<br>


===特字===
加上標逗:<br>
<syntaxhighlight lang="XML">
  元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記<br>
  ● 特字處理的作業環境
  皆以NotePad++軟體來處理UTF-8編碼的txt檔。
 一、將現有txt檔更改為UTF-8編碼的方式:
  (1)點選另存新檔。


  (2)在存檔畫面下方「編碼」那一欄選擇UTF-8。
 二、以NotePad++開啟已更改編碼的txt檔案。


● 特 處理
Q:closer後仍有文 的情況,如何標記?<br>
  特殊字處理的原則 首先是尋查 無unicode編碼 (包含Extention C)
A 例如,於g053p247「康熙五年七月二十九日給」後 ,有 「立碑東廊」小 。<br>
  然後再根據 文字 本身(或搭配前後文)是否易於辨識而做應 記。
由於「立碑東廊」不屬closer的內容 因此在closer結束後將「立碑東廊」標註為note;<br>
為了讓 文字 靠右,所以又標了一個靠右 齊的p。(單獨note無法靠右)<br>
  法:
<xml code>
<closer>康熙五年七月二十九日給</closer><note><p rend="font-size:small;text-align:right">立碑東廊</p></note></div>
</xml>


 一、有unicode編碼字
===詩篇名===
  (1)此字易於辨識者(不會產生懷疑的),則直接採用unicode編碼字,不做任何 記。
詩篇名 符樣式 〈〉
   例如 静,徳,録,䟽


  (2)此字不易於辨識者(不易讀懂,罕用字),但有通用字時,則 記<choice>。
===偈頌===
   例如:㝎(定),灋( ),銕(鐵)。(見圖二)
標法:<l> 詩句<caesura/> 詩句</l><br>
   標記 :<choice><orig>文本原字(unicode)</orig><reg resp="ddbc.da">通用字</reg></choice>
範例:<br>
    範例: 優曇華發<choice><orig> </orig><reg resp="ddbc.da"> </reg></choice> 中香
<lg><br>
    (通用字的查詢,可借助字書工具,如CBETA漢字資料庫,教育部異體字網站等)
 <l> 稽首觀音<caesura/> 大悲之主</l><br>
   
 <l> 我今說偈<caesura/> 畧讚所以</l><br>
  (3)若文字本身有歧義,易使讀者對句意產生誤會者(即文字本身雖為一般字,但在此另當別解時),則標記<choice>
 <l> 所以者何<caesura/> 所謂三摩</l><br>
   例如:縣(「懸」的通假字),餉(「晌」的通假字)
   <l> 菩薩證入<caesura/> 常住寶陀</l><br>
   標法:<choice><sic> 文本原字</sic><reg resp="ddbc.da">消歧字</reg></choice>
<lg/><br>
   範例:萬靈八部<choice><sic>縣</sic><reg resp="ddbc.da">懸</reg></choice> 望已久
  
 二、無unicode編碼字
  (1)此字易於辨識者(不會產生懷疑的),但有通用字時,則選用其通用字,而不做任何標記。
   (a) 少一撇、多一點的字:不標記(選擇用通用字)。例:播,余。(見圖一)
   (b) 刻版慣例,書寫習慣:不標記(選擇用通用字)。例:於,所。(見圖一)
   (c) 搭配前後文易於辨識者:不標記(選擇用通用字)。例:關。(見圖一)
  
  (2)此字不易於辨識者(不易讀懂,罕用字),但有通用字時,則標記<reg>
   例如:[叠*毛]=㲲。(見圖三)
   標法:<reg>通用字</reg>
   範例:青天飛一錫,白<reg>㲲</reg> 入孤雲。
  (3)此字不易於辨識者(不易讀懂,罕用字),無通用字時,則標記<g>,並需建立缺字檔。(缺字建檔方法見【附一】)
   例如:[悖*力]。(見圖四)
   標法:<g ref="#字圖檔名"/>
   範例:頓令須彌倒卓,<g ref="#btg086026901"/><!--[悖*力]--> 𣿨全枯。


  ● 訛字處理
  *偈頌 不使用標點符號 詩句中 分隔 ,以 &lt;caesura/> 標 。<br>
  文本 的錯字 包含看似錯誤但仍照實轉錄 則加 修訂。
  訛字修訂:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  範例:一切殿宇皆頹<choice><sic>圯</sic><corr resp="ddbc.da">圮</corr></choice>剝落
  
● 漏字處理
  文本中的缺漏字,或模糊不清的字,或難以讀懂的字,則標「省略」 記(gap)
  1)缺漏字
   標法:<gap extent="1" unit="chars" reason="lost"/>
  2)模糊不清的字
   標法:<gap extent="2" unit="chars" reason="unclear"/>
  3)難以讀懂的字(例如草書字)
   標法:<gap extent="3" unit="chars" reason="illegible"/>
  4)缺漏一段文字
   標法:<gap extent="unknown" unit="chars" reason="lost"/>
   (註)extent:此指字數
● 底本本身的刪塗、訂正字
  <choice><del>刪塗字</del><add>後人訂正字</add></choice>
  例:<choice><del>梦</del><add>愛</add></choice> (g014p0156)


【附一】缺字建檔
===底本有黑點(•)白點( )===
佛寺志缺字庫網頁http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq
有些 寺志 底本中有黑點 •)白點 ,這是 不錯的標逗參考 但可不必完全依照 標逗以文意暢達為要 。<br>
缺字建置步驟
江西彭澤許止淨•高慕淨•二居士•《禮觀世 菩薩疏》文曰 (g009_11_p589 )<br>
1. 登入缺字庫網頁,輸入缺字的位置「第幾志、第幾頁、當頁第幾個字」,
    可改為 江西彭澤許止淨、高慕淨二居士 《禮觀世 菩薩疏》文曰 <br>
   按「新增一筆」,產生一個缺字id:<glyph xml:id="">
   缺字編碼原則:btg(佛 寺志 )XXX 志碼3碼)XXXX 頁碼4碼)XX(序號2碼
   例如:阿育王山志第298頁第4 缺字[口*斗]的id是:btg010029804
2. <glyphName>:選擇是否為unicode編碼字 若為unicode編碼字,則採用Decimal碼
3. <charProp>:若知其發音,則點選「再增加一個charProp」
   (1) <localName> :若知其發音,則選pronunciation。
   (2) <value> 欄內填入此字之漢語拼 音。 例:媽ma1,嗎ma5,恰qia4
     (第幾聲用數字表示一聲、二聲、三聲、四聲、輕聲 = 1、2、3、4、5
4. <mapping type> :有common(通用字)、cbeta(CBETA組字式)、cbetaNo(CB碼)、
   unicode(unicode Decimal碼)、MoEvariant(教育部異體字編碼)五種型態,
   依其資料一一增加mapping填入。
  5. <note> 若對此字有特殊之考查 可add a note,描述考據的結果。
   例:韻 [ *貟],異體字例,部件「口、厶」俗寫多彼此相訛,凡此皆可視為異體。
6. 填寫上述資料後,按「更新資料庫」,即完成一個缺字的建置。
【附二】缺字圖檔製作
 1.原則 裁切文本掃瞄檔(.tif)作為字圖。(作法如下)


 2.裁切 圖步驟(利用Gimp軟體處理)
==中文數 字「 ==
  (1)開啟Gimp功能表 檔案 .
中文數 字「 ,請統一用這個 (unicode編碼u+3007)<br>
  (2)點選「開啟」.
Ps. 其餘 非數 字」的 圓圈符號,仍可用 。(這個○跟 面的〇不同)<br>
  (3)選擇缺 當頁的掃瞄圖.ex:1B001P077
   (檔案路徑Y:\Projects\fosizhi\master-data\images\tif\1Book001\1B001P077)
  (4)放大圖片以利裁切:點選 顯示 選擇 縮放1:1(100﹪) .
  (5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆).
  (6)將 剪裁」圖形移至缺字字體,確認位置後在選取的 框內點選滑鼠左鍵2次,即出現裁切之缺字圖檔.
  (7)設定圖片尺寸:點選「影像」或「圖片 選擇「縮放影像」「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目 是解除固定) 水平及垂直解析度:72像素,完成後點選下方 縮放 即完成.
  (8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成
  (9)缺字圖檔存放位置Y:\Projects\fosizhi\images\figure\gword\
  (10)缺字圖檔請通知妙妙 傳到dev.


  ●●缺字給 CBETA Maha製作流程
==巳=已 的處理==
  (1)請Maha幫忙製作缺字 無CB碼、無組字
  文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方 :<br>
  (2)須製作(1) 二點資訊者 於缺 介面note 明maha
  在「巳=已」 條件下 一志只在第一次出現的「巳」 做特字標記及 (如下),而後出現的「巳」則直接取代為「已」。<br>
(3)小花再以note註明的maha 彙整送給maha
<xml>
(4)缺字資訊的note寫法可參考缺字介面的(8)<add a note>: 為註記資訊用
  第一次出現的「巳」 標記:
  
<choice><orig>巳</orig><reg resp="dila.da">已</reg>
  ●●缺 圖上傳
<note resp="dila.da">書中「已」 多作「巳」,不煩標註。</note></choice>
  (1) FTP informations:
</xml>
    session:fosizhi
    host name:10.10.0.49
    user name:april  
    password:m4tjp
  (2)上傳位置 
    從 Y:\Projects\fosizhi\images\gword\
    複製到 ftp://dev.ddbc.edu.tw/fosizhi_gwords
  (3)從dev 到informatics 上傳時間為一週
  ●●缺字在佛寺志網頁的呈現順序?
   1.
   2.字圖


  【附三】unicode編碼字
=format重整文件=
  Unihan網站 http://www.unicode.org/charts/unihanrsindex.html
*執行format.py程式,可清除多餘空格及重整元素折行設定。<br>
  *電腦條件:電腦中要安裝有python-3.3.0以上版本的程式<br>
   程式放置路徑:Z:\數位典藏組\python<br>
*執行步驟:<br>
1. 在(TortoiseGit)\bin\下開啟dos視窗<br>
2. 在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter<br>
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾<br>
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)<br>
5.用main檔驗證一下,若是validation,即成。<br>
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。<br>
 (小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)<br>


  .utf字符碼CJK漢字 範圍
==如何解救亂了格式的文件?==
  * utf-32:U+20000- U+2A6DF(中日韓統一表意文字擴展B區)
  (不小心按到Oxygen工具列的縮排按鈕時用)<br>
  * utf-32:U+2A700-U+2B73F(中日韓統一表意文字擴展C區)
1.<b>先將所有自動折行 頁碼接起來</b><br>
  * utf-32:U+2B740- U+2B81F(中日韓統一表意文字擴展D區)
 在亂了格式的檔案下<br>
  * Decimal:131072以上
 → Ctrl+F
  (以上皆屬Extension的擴展字,可直接貼在文本)
 →尋找:<pb <br>
  
facs=<br>
  . 若unicode編碼字在Oxygen編輯器下無法直 貼上時,則先以Notepad++開啟此檔,
 →取代為:<pb facs=<br>
  並於內貼上此字、存 ,然後再轉接以Oxygen繼續作業。
   →Replace All<br>
  此時經過Notepad++轉化 此缺字,將在Oxygen以□ 形式呈顯,
   →Close<br>
  但此字在網頁上應已可以如實呈現。
2.<b>再將所有自動折行的lb 起來</b><br>
  如果此字在介面仍無法顯現,請 檢查 是否已安裝Undicode擴充字型
 在亂了格式的 案下<br>
  Y:\Projects\fosizhi\work\tools\字型\ext_b\PMingLiU Update Pack.msi
 →Ctrl+F<br>
  Y:\Projects\fosizhi\work\tools\字型\hanazono\hanazono.ttf
 →尋找:<lb <br>
n=<br>
 →取代:<lb n=<br>
 →Replace All<br>
 →Close<br>
3.<b>吃掉所有tag間 空格</b><br>
 在亂了格式 檔案下<br>
 →Ctrl+F<br>
 →尋找:>[ \n]*<<br>
 →取代:><<br>
 →Replace All<br>
 →Close<br>
4.<b> 檢查 文件</b><br>
 看看還有沒有不正常的空白。<br>
5.<b>在Dos下執行git bin下的format.py</b><br>
6. 在git下的output資料夾中取得檔案,看看是否可用。<br>


</syntaxhighlight>
=標記問答=
 *台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
Q:格式問題:是否照書編排?<br>
 *別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml
A:數位文本不必全照書編排。<br>


[[#top|回目錄]]
Q:敬格的情況,有空一格,有另起一行。<br>
A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的標記困擾,決定不遵照底本格式。<br>
  即「敬格」統一都不須空格或另起一行。<br>


===空格===
Q:並列的文字。<br>
  法:
A:不作並列標記。可 記縮小字&lt;seg rend="font-size:small"> 。<br>
  1)&lt;space quantity="1" unit="eng_chars"/> (一個英文半形空格)
  2)&lt;space quantity="1" unit="chi_chars"/> (一個中文全形空格)
   註:quantity內可填空格字數


===印章===
刷錯誤, 文字 內容重複時。<br>
 標法 &lt;stamp> 章上的 文字&lt;/stamp>
  :可用[註]標示 但若有跨頁 頁碼要放在note的外面。<br>
 例子:乾隆御覽之寶&lt;stamp>清乾隆玉璽&lt;/stamp>
  
 規則
1.文章結尾署名的印章, 可用&lt;closer>包之
  例:&lt;closer>萬曆丁未孟夏 賜進士第定海令椘潛樊王家撰&lt;/closer>
    &lt;closer>&lt;stamp>樊王家印&lt;/stamp>&lt;/closer> (這是個印章)


===表格===
Q:文本若超出可處理 範圍,如 朝蒙語譯 。<br>
 表格 標記 素:
可不標句讀,但須於檔頭&lt;teiHeader> 作說明。<br>
  &lt;table>:以表格形式呈現、包含在直行橫列中的 字內容
  &lt;row> :包含表格中的一列
  &lt;cell> 包含表格中的一個儲存格
  &lt;cell rows="列數"> :表格合併列
  &lt;cell cols="欄數"> :表格合併欄
 
 實例:請參見中國佛寺志 g089p0254


===詩偈===
Q:雙關語的 標記( 人地混雜 <br>
  標記 元素:
  A:依字面 標記 元素 ,以 註解說明喻意 <br>
  &lt;lg> 行組 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
例1:g077p0293<br>
  &lt;l> (詩行)包含詩文的一行,也許是不完整的詩行。
淳氣日凋薄,<placeName key="PL000000021567"> 鄒</placeName><placeName key="PL000000021513"> 魯</placeName><note resp="dila.da">此 處「鄒魯」代指「孔孟」 鄒魯乃孔子和孟子 誕生地 </note> 亡眞承 <br>
  &lt;caesura/> 標記 韻律詩行可能被截斷的位置。
 範例:
  &lt;p>...其徒理公囑余文記之,故述師行實 ,以 此重系之以賛 賛曰:&lt;/p>
  &lt;lg>&lt;l>師負衣鉢&lt;caesura/>循乞諸方&lt;/l>
    &lt;l> 持律嚴甚&lt;caesura/> 懴聲揚揚&lt;/l>
    &lt;l> 傳法天台&lt;caesura/> 卓錫育王&lt;/l>
    &lt;l>重新紺殿&lt;caesura/> 舍利增光&lt;/l>
    &lt;l>緇素皈仰&lt;caesura/>佩德難忘&lt;/l>
    &lt;l>玉几雲白&lt;caesura/>娑羅樹蒼&lt;/l>
    &lt;l>忽然示寂&lt;caesura/>眷屬徬徨&lt;/l>&lt;/lg>
  &lt;p>噫!我知瓶公滅 生蓮,沼花綻金,渠極樂邦 &lt;/p>
 注意事項:
  1) &lt;lg>與&lt;p>是平行 結構,故&lt;lg>與&lt;p>不可互包
   應結束&lt;/p>後,再標&lt;lg>。
  2) 當詩詞跨頁時,照書換頁,不用顧及排版問題。
 
  3) 詩偈不用標逗,詩句中間的間隔,以&lt;caesura/> 標示。


===標記問答===
  例2:g017p0194<br>
 Q:格式問題:是否照書編排?
  笙歌日日娛<persName key="A008915"> 西子</persName><note resp="dila.da"> 此處 西子 代指 西湖 」。</note>  為愛幽閒到玉岑<br>
 A:數位文本不必全照書編排。
 Q:敬格的情況,有空一格,有另起一行。
 A:"敬格"統一都不須空格或另起一行。
  
 Q:並列的文字。
 A:不作並列標記。可標記縮小字&lt;seg rend="font-size:small"> 及加括弧以區別之。
  
 Q:文章中小字的標法
 A:&lt;seg rend="font-size:small"> (縮小的字)&lt;/seg>
   ps. &lt;seg> 的標法,是著重在 樣式 (小字)上的呈顯,而非 意義 上的表示


  :標題 中的 小字
:oXygen xml文件 ,如何取消元素 定義提示?<br>
 A:<seg rend="font-size:small"> (縮小的字)</seg>(小字 標此 ,會 強制折行)
  oXygen xml 件中,當將鼠標停留在TEI元素上 時,會 自動pop up出一個解釋該元素定義的小視窗;<br>
   <seg rend="font-size:small;display:inline"> (縮 小的字 </seg> (標題小字不換行)
  這個 視窗有時會遮擋到文件中正要處理 ,造成作業的困擾。<br>
  
 A: 取消元素定義提 示的 設定步驟:<br>
 Q:若印刷錯誤,文字內容重複時。
    oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip( 要勾選)<br>
  A: 可用[註]標 。但若有跨頁,頁碼要放在note 外面。
  
 Q:文本若超出可處理的範圍,如元朝蒙語譯文。
 A:可 標句讀,但須於檔頭&lt;teiHeader> 作說明。


== 標逗==
=[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97PDF%E7%89%88 佛寺志PDF版]=
  
1 凡例備忘<br>
  1. 《》與〈〉
2 圖檔<br>
   書名的標 符樣式 :《》
   2.1 構想<br>
   詩篇名標 符樣式 :〈〉
 2.2 各志景點<br>
3 佛寺志PDF版面<br>
 3.1 開本<br>
 3.2 邊界<br>
 3.3 行距<br>
 3.4 字型<br>
 3.5 字體大小<br>
4 佛寺志PDF校訂規則<br>
 4.1 目錄<br>
  4.1.1 擷取層級<br>
  4.1.2  樣式<br>
 4.2 內文<br>
  4.2.1 樣式 號<br>
  4.2.2 段落 樣式<br>
  4.2.3 標題<br>
  4.2.4 人名<br>
  4.2.5 地名<br>
  4.2.6 時間<br>
  4.2.7 特字<br>
   4.2.7.1 勘誤字(底本中的錯字)<br>
   4.2.7.2 從缺字(易辨識,卻打不出來)<br>
   4.2.7.3 罕見字(難以辨識的罕見字)<br>
   4.2.7.4 特字的註解<br>
  4.2.8 註腳<br>
  4.2.9 詩偈<br>
  4.2.10 小字<br>
  4.2.11 補字<br>
  4.2.12 印章<br>
  4.2.13 書名<br>
  4.2.14 備忘<br>
 4.3 人名索引<br>
 4.4 地名索引<br>
5 討論區<br>


2.偈頌中不使用標點符號,詩句中的分隔,以<caesura/>標示。
=[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%9786%E5%BF%97%E7%B2%97%E6%A8%99 佛寺志粗標]=
  標法:<l>詩句<caesura/>詩句</l>
  範例:<lg><l>稽首觀音<caesura/>大悲之主</l>
       <l>我今說偈<caesura/>畧讚所以</l>
       <l>所以者何<caesura/>所謂三摩</l>
       <l>菩薩證入<caesura/>常住寶陀</l><lg/>


  3. 有些寺志底本有黑點 白點 ,是否依照原文斷句?
1 電校<br>
  答 以文意暢達為要 ,不 必照原書 黑點白點逗句。
2 切檔<br>
   例:g081_05_p0214英宗 <date> 正統十年春</date>,<date> 旣望</date>,上 造藏經 送安臺山普恩禪寺
 2.1 分檔方式<br>
   可改為:英宗 <date> 正統十年春旣望</date>, 上造藏 經, 送安臺山普恩禪寺。
 2.2 書名頁的納入<br>
 2.3 卷前的標記<br>
 2.4 書名頁 出版社的 的標法<br>
 2.5 題名頁 原刻板的 的標法<br>
3 粗標<br>
 3.1 段落標記<br>
 3.2 行號問題<br>
 3.3 跨頁的表格頁碼<br>
 3.4 補字標記修訂 加resp屬性(2013.05.20)<br>
 3.5 「取代標記 取代文字」 正規表示式語法(in oXygen)<br>
   3.6 自加標題標記修訂:加supplied元素(2013.05.20)<br>
 3.7 隱藏的自加標題標記修訂<br>
 3.8 地名標題下的詩偈 不用標<head>(標<p>及<lg> <br>
 3.9 詞的上下闕標記法<br>
 3.10 法語中 如有「 堂」法語 可分段 <br>
 3.11 尾註的標法<br>
 3.12 印章的標法、位置<br>
 3.13 圖內的文字<br>
4 特字處理<br>
5 特殊問題<br>
 5.1 稿本有大量塗改的情形 如何標記?<br>
 5.2 新訂標題的原則<br>
 5.3 作者位置 標記人員移動時的註解說明<br>
 5.4 以程式標記詩偈<br>
 5.5 「全段縮排」可取代「小字」<br>
 5.6 長行裡的詩偈 目前可暫不標詩行<br>
 5.7 不縮排的詩行<br>
 5.8 錯位移正後要處理行號嗎?<br>
 5.9 xml文件中的「&」<br>
6 標點符號問題<br>

於 2021年4月27日 (二) 09:56 的最新修訂

回《中國佛寺史志》數位典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual)

《中國佛寺志》標記作業
另可參考:遵循 TEI 的佛學數位化 XML 標記

工作準備

1. 參考資料:
   進行寺志標記前,應先找好該志的相關參考資料,例如:白話本、點校本等。

2. 檔案管理:
本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。
目前檔案資料夾分為三部份:
 1)xml(已完成細標的檔案。細標是指有人名、地名、時間的標記)
 2)xml-basic-g(明丹本)
 3)xml-basic-y(廣陵本)
  
3. 作業軟體oXygen(19版)的環境設定
 1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose
 2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾)
 3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排)
 4) 呼叫結構樹 outline:window→Show View→outline
   (結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。)

4. 作業技巧:凡具規則性、大量性之機械式作業,應尋求以程式批次處理,避免人工重複作業。

5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。  
  「意義標記」著重在付予文字意義,例如:persName(人名),p(段落)。
  「樣式標記」著重在樣貌的呈現,即編輯樣式,例如:lb(折行),p rend=""(段落格式)。
    本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。

檔案架構

 《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。
 (例:重修普陀山志,代碼g008)

 每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
 及數個分檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。

 主檔內含有版本資訊(teiHeader)、掃描圖資訊(tei:facsimile)及分檔的鍊結(text xi:include)。
 分檔內則是各卷的內容。

●切檔命名規則
志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名頁等)
志碼_00:卷首(題名頁之後的內容,如:序文、目錄、山圖等)
志碼_01:卷一
志碼_02:卷二(以下依卷次類推)
志碼_back:附錄、補編等
志碼_back1:附錄、補編有多卷時,可加序號。例如附編卷一
志碼_back2:附錄、補編有多卷時,可加序號。例如附編卷二


●特殊例子的切檔
例:
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷題情勢做適當的調整)。
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6
g087_03-1,g087_03-2

加facs碼

1.執行git中的facs.py程式,為內文中的pb加上facs
 例:原<pb n="0041"/>
   執行程式後變成<pb facs="1B017P108.jpg" n="0041"/>

2.請網路工程師(阿賢)為main檔加facsimile
 將加好pb facs的檔案,連同main檔,一併交給工程師。工程師會在main檔加入如下的標記:
<xml code>

 <tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0">
 <tei:graphic url="1B017P108.jpg"/>
 <tei:graphic url="1B017P109.jpg"/>

 ......  ...... </xml>

注意事項:卷內的pb facs要與main中的facsimile url同步
各卷內的頁碼有時會有錯誤,當修改pb facs碼時,請順便也要一併修改main中的facsimile url,這樣文件才會完整。
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/>
  Y141_main <tei:graphic url="4B100P005.jpg"/>

文件宣告

1各卷文件宣告列,請一致用:
<?xml version="1.0" encoding="UTF-8"?>(雙引號,大寫UTF)

2缺字在檔頭宣告,其流程:
<xml code> 1)開啟main檔 2)在</fileDesc>之後加上以下的群組標記 <encodingDesc>

 <charDecl>
   <char xml:id="Z0001"> 
     <charName>DILA CHARACTER Z0001</charName>
     <charProp>
       <localName>CBETA</localName> (若無可省略)
       <value>CB30005</value>
     </charProp>
     <charProp>
       <localName>composition</localName> 
       <value>[宀/廣]</value>
     </charProp>
   </char>
 </charDecl>

</encodingDesc> 3)在當志中,用「<g ref="#」搜尋出所有缺字。 4)逐一將缺字碼放在「DILA 難檢字庫」中檢索,將缺字資料填補入缺字宣告中。 (從缺的項目可省略)

例:g069_main </fileDesc> <encodingDesc>

 <charDecl>
   <char xml:id="Z0393">
     <charName>DILA CHARACTER Z0393</charName>
     <charProp>
       <localName>composition</localName>
       <value>[山*克]</value>
     </charProp>
   </char>
   <char xml:id="Z0523">
     <charName>DILA CHARACTER Z0523</charName>
     <charProp>
       <localName>composition</localName>
       <value>[風*丘]</value>
     </charProp>
   </char>
   <char xml:id="Z0522">
     <charName>DILA CHARACTER Z0522</charName>
     <charProp>
       <localName>composition</localName>
       <value>[山*右]</value>
     </charProp>
   </char>
 </charDecl>

</encodingDesc> </teiHeader> </xml>

段落形式

標題

1標題的標法
● <head>標題</head>
● <head>標題</head><byline><persName>作者</persName></byline>
● <head>標題<seg rend="font-size:small">副標題</seg></head>
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg>
● 標題小字要折行:<seg rend="font-size:small;display:block">縮小的字</seg>
● 標題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩

2自訂標題
 1.全自加
  <head><supplied resp="dila.da">自訂標題</supplied></head>
  例:〔劉仁本題跋〕
 2.半自加
  <head>原標題<supplied resp="dila.da">自訂標題</supplied></head>
  例:雞足山志序〔二〕
 3.隱藏自加的標題
  <head rend="display:none"><supplied resp="dila.da">自訂標題</supplied></head>
  例:志名頁
  ps. rend="display:none" 隱藏元素格式(不留白)
    rend="visibility:hidden" 保留元素格式(留白)

3說明
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。
  另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。

段落句首折作標題與否示例(以g074雲居山志 為例)
(一)直接折作標題
     原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。
 
     範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來---
           標題:自寳禪師
           內文:上堂。總恁麽風恬浪靜,那裏得來---

     範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲---
           標題:宗杲大慧禪師
           內文:時圜悟詔住雲居,師往省覲---

     範例3:p82 晦山顯禪師  師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
           標題:晦山顯禪師
           內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---

     範例4:p105 復合神鐘  寺有巨鐘,明中葉院圮---
           標題:復合神鐘
           內文:寺有巨鐘,明中葉院圮---
 
(二)依句頭另作標題[ ]
     原則:若段落首句的文法成份是屬於「主詞」或「前置受詞」的,則應留作內文句頭,而另訂標題。

     範例1:p65 道齊禪師 本州金氏子,徧歷禪會---
           標題:[道齊禪師]
           內文:道齊禪師(主詞),本州金氏子,徧歷禪會---

     範例2:p70 克勤佛果禪師 建炎丁未歲十一月初六日,奉敕住雲居---
           標題:[克勤佛果禪師]
           內文:克勤佛果禪師(主詞),建炎丁未歲十一月初六日,奉敕住雲居---

     範例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居---
           標題:[燕雷鵬禪師]
           內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居---

     範例4:p103 佛印禪師 周茂叔謁見,問曰---
           標題:[佛印禪師]
           內文:佛印禪師(前置受詞),周茂叔謁見,問曰---

     範例5:p106 寺左三塔 沉埋土中多年---
           標題:[寺左三塔]
           內文:寺左三塔(主詞)沉埋土中多年---

○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。

(2)標題後的副標題,可以<seg>(隨機分割)標記之。
.例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
.<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。

(3)若底本格式為「作者在標題之前」,且編輯分類是以「作者」為主時,則作者亦可作標題。
例:g028p458 厲鶚

4長詩題的另訂 關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂標題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對的理由。

5標點符號
(1)標題亦可加新式標點符號,惟結尾不用句點。

段落樣式

樣式語法

◎全段縮小字
 <p rend="font-size:small">全段縮小字</p>
 範例:g009p0427

◎全段縮排一個字
 <p rend="margin-top:1ex;text-indent:0">縮排的段落</p>
 範例:g009p0593

◎全段縮排一個字,但第一行凸排一個字
 <p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落</p>
 範例:g009p0023
 ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。

◎第一行不縮排。(通常用在詩文夾雜的長行段落)
 <p rend="text-indent:0">詩偈後接續的長行<p>
 範例:g062p0104

◎靠右對齊
 <p rend="text-align:right">

◎全段並排小字,有時可以調整為大字
 例:g079 p.004崇眞萬壽宮

序、跋、按語之格式

1. 小序、小引
  1)「詩」(詩行)前小序、小引,做一般段落,並依底本之大小字體編輯之。
   例:g023卷六p371(雲林看雨圖題句小引)
  2)「文」(長行)前小序、小引,全段縮排3格。
   例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)

2. 跋、識(獨立的段落)
  1)跋文本身無標題:全段縮排3格。
    例1:g016p362( - - - 慧荃跋closer)
    例2:g023p363( - - - 魏成憲并識)

  2)跋文本身有標題(或添加標題):作一般段落,不縮排。
    例1:g028p445(--- 大掄敬識)
    例2:g016p1374(李流芳題跋)

3. 按語(獨立的段落)
  全段縮排3格,並依底本之大小字體編輯之。
  例1:g016p378按寺舊志云觀松在香積......
  例2:y105p54按范浦之水來自五雲諸山......

  [註] 在不影響版面之識別效果下,上開底本之小字體可以改大。

  ps.以上規則僅是個大原則,若遇有特殊情況,得依當志之特性而做適切之調整。

表格

表格的標記元素:
 <table>:以表格形式呈現、包含在直行橫列中的文字內容
 <row>:包含表格中的一列
 <cell>:包含表格中的一個儲存格
 <cell rows="列數">:表格合併列
 <cell cols="欄數">:表格合併欄
 實例:請參見中國佛寺志 g089p0254

詩詞歌賦偈

元素

  • <lg>(行組, Line Group)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
  • <l>(詩行)包含詩文的一行,也許是不完整的詩行。
  • <caesura/> 標記韻律詩行可能被截斷的位置。

範例

詩文的呈現方式有二:1.作詩行。2.做長行。

1. 詩行格式通常不用標點,同行兩句間標<caesure/>,如g007p.887。

 <p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作序
師具表奏謝仍進頌曰:
<lg><l>古佛與今佛<caesura/>同一廣長舌</l>
  <l>於無途轍中<caesura/>為物啟途轍</l>
  <l>撥開千嶂雲<caesura/>放出一輪月</l>
  <l>普令大地人<caesura/>言下悉照徹</l>
  <l>覺亦無可圎<caesura/>幻亦無可滅</l>
  <l>只此無亦無<caesura/>紅爐一點雪</l>
  <l>稽首佛與佛<caesura/>字字無異說</l></lg>
既經乙夜之覽皇情大悅</p>
※p內可包lg(已可通過validate驗證)

2. 文章中夾有詩文,若做詩行格式,則不用引號。若必須用,則改用長行,並加標點,如g038p.174。

<p>張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池,
獻詩曰:賊寇臨京口,王師出海邊。四方喧動地,萬姓共瞻天。
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p>

標點

按語的標點規則:
1. 作「據查」解
 g049編按:産西門寨石之「鞏州」,爲今甘肅之隴西縣 。
 g049按:華嚴寺,馮守誦《華嚴經》,感玉女饋餐......
 g049謹按:師,生於上川 。

2. 作「依據」解
 g49按《莊子》,瞿君字鵲子。
 g049按大師此語,凡在峨眉遊居者,皆當......
 g049按《益部方物略》:「海棠,有數種。
 g077按志中,前代諸鉅公經此境者,其唯......

3. 作「依照 、查看」解
 g049按新圖,稽舊聞,亦數月而竣事。
 g049故只按舊志及諸經傳而爲證訂。
 g077按之九華碑版亦然。

詩偈的小字

1.詩偈中,解釋上句(或同行)的註解性質的小字,可標<seg rend="font-size:small">。
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面、</lg>前面)
 (由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l>同行。
  TEI語法的規則,seg無法標在<l></l>外面。)
3.詩偈中,總釋前幾首詩的註解性質的小字,可標<p><note rend="font-size:small"></note></p>。

注意事項

  1. <lg>與<p>是平行的結構,故<lg>與<p>不可互包。應結束</p>後,再標<lg>。
  2. 當詩詞跨頁時,照書換頁,不用顧及排版問題。
  3. 詩偈不用標逗,詩句中間的間隔,以<caesura/>標示。

一頁多欄

 例如:g003p0273

標記元素

1 頁碼
2 人名
 2.1 人名規範資料的建置
 2.2 人名標記標法
 2.3 人名標記凡例
 2.4 人名規範資料建檔注意事項
 2.5 人名標記規則
3 地名
 3.1 地名規範資料的建置
 3.2 地名標記
 3.3 地名標記凡例
 3.4 地名規範資料建檔注意事項
 3.5 地名標記規則
 3.6 地名問答
4 時間
 4.1 時間規範資料的查詢
 4.2 時間標記
 4.3 時間標記凡例
 4.4 時間規範資料建檔注意事項
 4.5 時間標記規則
 4.6 民國年
  4.6.1 時間為民國年的注意事項
  4.6.2 時間為民國年的查法
  4.6.3 時間屬性的變更(2011.01.20)
  4.6.4 時間問答
 4.7 知識備忘
 4.8 朝代code
5 代名詞
 5.1 標法
 5.2 標記時機
6 註解(底本本身)
7 註解(dila.da)
8 空格
9 訛字處理
10 漏字處理
 10.1 缺漏字
 10.2 補字
11 重複字
12 底本本身的刪塗、訂正字
13 印章
14 上標字及頁註
 14.1 上標字
 14.2 頁註
15 圖檔
 15.1 圖檔標記
 15.2 特殊圖表製圖流程(Odg轉svg)
16 標籤label

字元層次

佛寺志專案 特字處理

1 作業環境
2 特字處理方式及工具
3 特字處理原則
3.1 有 unicode 編碼的字
 3.1.1 易於辨識
 3.1.2 不易辨識
3.2 無 unicode 編碼的字
 3.2.1 易於辨識
 3.2.2 不易辨識, 有通用字
 3.2.3 不易辨識, 無通用字
4 特字處理新規則
5 如何統一各志間特字處理方式
6 難檢字庫缺字建檔
7 難檢字庫缺字圖檔製作
 7.1 原則
 7.2 製圖步驟
8 缺字呈現
9 unicode 編碼字
 9.1 CJK漢字編碼範圍
 9.2 編輯器
 9.3 快速尋找unicode的方法
10 有助於增加特字處理效率的工具與方法
11 SVG造字
 11.1 參閱
 11.2 安裝
 11.3 inkscape造字操作法
 11.4 illustrator造字操作法
 11.5 參考範例
12 參考資源

標逗

書名

1.書名的標符樣式:《》
2.書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。

結尾署語

Q:結尾署語<closer>中的文字是否標逗?
A:原則上開放標點,適度添加,方便閱讀。但結束可不加句號。

例如:
元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記

加上標逗:
元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記


Q:closer後仍有文字的情況,如何標記?
A:例如,於g053p247「康熙五年七月二十九日給」後,有「立碑東廊」小字。
由於「立碑東廊」不屬closer的內容,因此在closer結束後將「立碑東廊」標註為note;
為了讓文字靠右,所以又標了一個靠右對齊的p。(單獨note無法靠右)
 標法: <xml code>

<closer>康熙五年七月二十九日給</closer><note>

立碑東廊

</note>

</xml>

詩篇名

詩篇名標符樣式:〈〉

偈頌

標法:<l>詩句<caesura/>詩句</l>
範例:
<lg>
 <l>稽首觀音<caesura/>大悲之主</l>
 <l>我今說偈<caesura/>畧讚所以</l>
 <l>所以者何<caesura/>所謂三摩</l>
 <l>菩薩證入<caesura/>常住寶陀</l>
<lg/>

*偈頌中不使用標點符號,詩句中的分隔,以 <caesura/> 標示。

底本有黑點(•)白點(。)

有些寺志底本中有黑點(•)白點(。),這是個不錯的標逗參考,但可不必完全依照。標逗以文意暢達為要。
例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)
  可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰:

中文數字「零」

中文數字「零」,請統一用這個「〇」(unicode編碼u+3007)
Ps. 其餘「非數字」的圓圈符號,仍可用「○」。(這個○跟上面的〇不同)

巳=已 的處理

文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方式:
在「巳=已」的條件下,一志只在第一次出現的「巳」字做特字標記及註(如下),而後出現的「巳」則直接取代為「已」。
<xml> 第一次出現的「巳」字標記: <choice><orig>巳</orig><reg resp="dila.da">已</reg> <note resp="dila.da">書中「已」字多作「巳」,不煩標註。</note></choice> </xml>

format重整文件

*執行format.py程式,可清除多餘空格及重整元素折行設定。
*電腦條件:電腦中要安裝有python-3.3.0以上版本的程式
 程式放置路徑:Z:\數位典藏組\python
*執行步驟:
1.在(TortoiseGit)\bin\下開啟dos視窗
2.在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)
5.用main檔驗證一下,若是validation,即成。
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。
 (小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)

如何解救亂了格式的文件?

(不小心按到Oxygen工具列的縮排按鈕時用)
1.先將所有自動折行的頁碼接起來
 在亂了格式的檔案下
 → Ctrl+F  →尋找:<pb
facs=
 →取代為:<pb facs=
 →Replace All
 →Close
2.再將所有自動折行的lb接起來
 在亂了格式的檔案下
 →Ctrl+F
 →尋找:<lb
n=
 →取代:<lb n=
 →Replace All
 →Close
3.吃掉所有tag間的空格
 在亂了格式的檔案下
 →Ctrl+F
 →尋找:>[ \n]*<
 →取代:><
 →Replace All
 →Close
4.檢查文件
 看看還有沒有不正常的空白。
5.在Dos下執行git bin下的format.py
6.在git下的output資料夾中取得檔案,看看是否可用。

標記問答

Q:格式問題:是否照書編排?
A:數位文本不必全照書編排。

Q:敬格的情況,有空一格,有另起一行。
A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的標記困擾,決定不遵照底本格式。
  即「敬格」統一都不須空格或另起一行。

Q:並列的文字。
A:不作並列標記。可標記縮小字<seg rend="font-size:small">。

Q:若印刷錯誤,文字內容重複時。
A:可用[註]標示。但若有跨頁,頁碼要放在note的外面。

Q:文本若超出可處理的範圍,如元朝蒙語譯文。
A:可不標句讀,但須於檔頭<teiHeader>作說明。

Q:雙關語的標記(人地混雜)
A:依字面標記元素,以註解說明喻意。
例1:g077p0293
淳氣日凋薄,<placeName key="PL000000021567">鄒</placeName><placeName key="PL000000021513">魯</placeName><note resp="dila.da">此處「鄒魯」代指「孔孟」。鄒魯乃孔子和孟子的誕生地。</note>亡眞承。

例2:g017p0194
笙歌日日娛<persName key="A008915">西子</persName><note resp="dila.da">此處「西子」代指「西湖」。</note>  為愛幽閒到玉岑

Q:oXygen xml文件中,如何取消元素的定義提示?
  oXygen xml文件中,當將鼠標停留在TEI元素上時,會自動pop up出一個解釋該元素定義的小視窗;
  這個小視窗有時會遮擋到文件中正要處理的文字,造成作業的困擾。
A:取消元素定義提示的設定步驟:
  oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip(不要勾選)

佛寺志PDF版

1 凡例備忘
2 圖檔
 2.1 構想
 2.2 各志景點
3 佛寺志PDF版面
 3.1 開本
 3.2 邊界
 3.3 行距
 3.4 字型
 3.5 字體大小
4 佛寺志PDF校訂規則
 4.1 目錄
  4.1.1 擷取層級
  4.1.2 符號樣式
 4.2 內文
  4.2.1 樣式符號
  4.2.2 段落樣式
  4.2.3 標題
  4.2.4 人名
  4.2.5 地名
  4.2.6 時間
  4.2.7 特字
   4.2.7.1 勘誤字(底本中的錯字)
   4.2.7.2 從缺字(易辨識,卻打不出來)
   4.2.7.3 罕見字(難以辨識的罕見字)
   4.2.7.4 特字的註解
  4.2.8 註腳
  4.2.9 詩偈
  4.2.10 小字
  4.2.11 補字
  4.2.12 印章
  4.2.13 書名
  4.2.14 備忘
 4.3 人名索引
 4.4 地名索引
5 討論區

佛寺志粗標

1 電校
2 切檔
 2.1 分檔方式
 2.2 書名頁的納入
 2.3 卷前的標記
 2.4 書名頁(出版社的)的標法
 2.5 題名頁(原刻板的)的標法
3 粗標
 3.1 段落標記
 3.2 行號問題
 3.3 跨頁的表格頁碼
 3.4 補字標記修訂:加resp屬性(2013.05.20)
 3.5 「取代標記,但不取代文字」的正規表示式語法(in oXygen)
 3.6 自加標題標記修訂:加supplied元素(2013.05.20)
 3.7 隱藏的自加標題標記修訂

 3.8 地名標題下的詩偈,不用標<head>(標

及<lg>)
 3.9 詞的上下闕標記法
 3.10 法語中,如有「上堂」法語,可分段。
 3.11 尾註的標法
 3.12 印章的標法、位置
 3.13 圖內的文字
4 特字處理
5 特殊問題
 5.1 稿本有大量塗改的情形,如何標記?
 5.2 新訂標題的原則
 5.3 作者位置經標記人員移動時的註解說明
 5.4 以程式標記詩偈
 5.5 「全段縮排」可取代「小字」
 5.6 長行裡的詩偈,目前可暫不標詩行
 5.7 不縮排的詩行
 5.8 錯位移正後要處理行號嗎?
 5.9 xml文件中的「&」
6 標點符號問題