「《中國佛寺史志》標記作業」:修訂間差異

出自DILA Wiki
imported>Miaomiao
imported>Jiayu.xu
無編輯摘要
 
(未顯示由 9 位使用者於中間所作的 612 次修訂)
行 1: 行 1:
==標記總說==
[http://wiki.dila.edu.tw/pages/%E5%90%8D%E5%B1%B1%E5%8F%A4%E5%89%8E-%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%95%B8%E4%BD%8D%E5%85%B8%E8%97%8F 回《 國佛寺史志》 數位 典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual ]
1. 本專案將以TEI-XML格式進行作業,對於文本 的人名、地名、時間皆加以標記
  及建置資料庫,旨在提供高質量的 數位 化全文。
2.數位化的文本也將加入新式標點符號。
3.文本中的難檢字將採用Unicode字符,
  若於Unicode字庫中尚未收錄的字,則將改以同義異體字代替,或者建立缺字檔。
4.TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。
  「意義標記」著重在付予文字意義,例如:<persName>人名。
  「樣式標記」著重在呈現的樣貌,例如:<lb/>(折行
  TEI-XML標記著重於「意義標記」,而文本呈現的樣貌則多操縱於XSLT。


==檔案架構==
《中國佛寺志》 標記作業<br>
  《中國佛寺 志》 以「志」為單位,每一部志皆有一代碼。(例:重修普陀山志代碼g008)
另可參考 [http://wiki.dila.edu.tw/pages/%E9%81%B5%E5%BE%AA_TEI_%E7%9A%84%E4%BD%9B%E5%AD%B8%E6%95%B8%E4%BD%8D%E5%8C%96_XML_%E6%A8%99%E8%A8%98 遵循 TEI  佛學 數位 化 XML 標記]
 每一志皆由一個主檔(例 重修普陀山志 主檔g008_main)
 及 個小檔(以卷為單 ,例:重修普陀山志卷一g008_01)組成。
 主檔內寫有版本資訊及小檔的鍊結,小檔內則是各卷的內容。


==標記說明==
= 工作準備=
 
1. 參考資料:
===頁碼===
   進行寺 標記 ,應先找好該 志的 相關參考資料 ,例 白話 、點校
 1頁碼放置的位置:置於&lt;div>與&lt;head>之間。
  例1:&lt;div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0">
    &lt;pb facs="1B009P003.jpg" n="0000a"/>
    &lt;head resp="ddbc.da">普陀山 &lt;/head>
  例2:&lt;div>
    &lt;pb facs="1B009P022.jpg" n="0003"/>
    &lt;head>重修普陀 叙&lt;/head>
 2版本說明頁的頁碼、卷之前無頁碼 頁碼
  格式:第一頁0000a,第二頁0000b 第三頁0000c
   例:&lt;div>
    &lt;pb facs="1B009P003.jpg" n="0000a"/>
    &lt;head resp="ddbc.da">版 說明&lt;/head>
  ps.由於卷首需要一個頁碼,因此「版 說明」的頁碼會被挪移到當卷第一個&lt;head>之前
   (見頁碼放置的位置例1)
 
 3插圖頁的頁碼
  格式:插圖前頁頁碼+a
  例:&lt;pb facs="xBxxxPxxx n="0123a""/>
 4空白頁
  需標上當頁頁碼
  例:&lt;pb facs="1B009P043.jpg" n="0024"/>
 
===標題===
 
 1標題的標法
  ● &lt;head>標題&lt;/head>
  ● &lt;head>標題&lt;/head>&lt;byline>&lt;persName>作者&lt;/persName>&lt;/byline>
  ● &lt;head resp="ddbc.da">自加標題&lt;/head>
  ● &lt;head>標題&lt;seg rend="font-size:small">副標題&lt;/seg>&lt;/head>
  
  
   2說明
2. 檔案管理:
   (1)若篇章缺乏 題者,可「自訂 題」。
 本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。
   自 加的標題將會出現在網頁左欄的樹狀目錄結構上 並程式會 自動 括弧,
   目前檔案資料夾分為三部份:
  以與 本上實有的標題區分。但自加的標題不會 呈現 在網頁全文化的內文中。
   1 )xml(已完成細標的檔案。細 是指有人名、地名、時間的 記)
  文本標記的格式:&lt;head resp="ddbc.da">自加的標題&lt;/head>
  2)xml-basic-g(明丹本)
  網頁樹狀 目錄 所呈現 樣式:(自加的標題)
  3)xml-basic-y(廣陵本)
    
3. 作業軟體oXygen(19版)的環境設定
  1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose
  2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾)
  3) 設定不 動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾 即打字時不 自動 縮排、貼 時不自動縮排)
  4) 呼叫結構樹 outline:window→Show View→outline
   (結構樹可固定於 件左側,需要時點擊其縮圖按鈕即可 呈現目錄 結構;點擊目錄樹視窗上 「圖釘」按鈕即可固定或收起。)
  
  
  (2)標題後的副標題,可以&lt;seg>(隨機分割)標記之。
4. 作業技巧 凡具規則性、 量性之 械式作業,應尋求以程式批 處理,避免人工重複作業
   例 &lt;div>&lt;head> 安禪師&lt;seg rend="font-size:small">上堂一則  緣二則&lt;/seg>&lt;/head>
   #&lt;seg>(隨機分割)包含文件中任何隨機字詞層 的單元(包括其他分割元素)
  
  
 3 題亦 加新 式標 點符號
5. TEI 記元素的型態, 大分為「意義標記」與「樣式標記」。 
  「意義標記」著重在付予文字意義,例如:persName(人名),p(段落)。
  「樣式標記」著重在樣貌的呈現,即編輯樣式,例如:lb(折行),p rend=""(段落格 )。
   本專案標記側重於「意義 記」,而版面樣貌的呈現則大多操縱於XSLT


===人名===
= 檔案架構=
  1 人名規範資料的建置(若欲建檔,請先 帳號密碼登入)
   《中國佛寺史志》 以「 為單位,每一部志皆有一代碼。<br>
   ● 人名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/person/
   (例:重修普陀山志 代碼g008)<br>
   ● 人名規範資料建檔方式,請參閱 佛學規範資料庫 工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「人名規範資料庫」]
   ● 人名規範資料的問題討論 請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]


  2 人名標記
   每一志皆由一個主檔(例 重修普陀山志 主檔g008_main)<br>
&lt;xml code>標法
 及數個分檔 以卷為單位,例:重修普陀山志卷一g008_01 組成。<br>
   &lt;persName key="Axxxxxx">某某某&lt;/persName>
   &lt;persName key="unknown">未知 人名&lt;/persName>
   &lt;persName key="Gxxxxxx">人名群組&lt;/persName>
   &lt;roleName>稱謂&lt;/roleName> 須包在&lt;persName>內
   &lt;roleName type="honorific">尊稱&lt;/roleName>(須包在&lt;persName>內)
   &lt;name>族姓&lt;/name>
&lt;/xml>


  3 人名標記凡例
   主檔內含有版 資訊(teiHeader )、 掃描圖資訊(tei:facsimile 及分檔的鍊結(text xi:include 。<br>
{| style="color:green;background-color:#ffffcc;" cellpadding="2" cellspacing="0" border="1"
 分檔內則是各卷的內容。<br>
!稱謂型態
! 凡例
!   標記
|-
|官稱
|&lt;ul>&lt;li>韋左司&lt;/li>&lt;li>韋應物左司&lt;/li>&lt;li>杜副校長正民&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>韋&lt;roleName>左司&lt;roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>韋應物&lt;roleName>左司&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>杜&lt;roleName>副校長&lt;/roleName>正民&lt;/persName>&lt;/li>&lt;/ul>
|-
|地名當人名
|&lt;ul>&lt;li>韋蘇州&lt;/li>&lt;li>塩官國師&lt;/li>&lt;li>臨濟&lt;/li>&lt;li>天童圓悟大師&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>韋&lt;placeName>蘇州&lt;/placeName>&lt;/persName>(指韋應物)&lt;/li>
&lt;li>&lt;persName>&lt;placeName>塩官&lt;/placeName>&lt;roleName>國師&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>&lt;placeName>臨濟&lt;/placeName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>&lt;placeName>天童&lt;/placeName>圓悟&lt;roleName>大師&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|連名
|&lt;ul>&lt;li>大鶴居士鄭文焯&lt;/li>&lt;li>花之寺僧羅聘&lt;/li>&lt;li>華陽眞人陶貞白先生宏景&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>大鶴&lt;roleName>居士&lt;/roleName>鄭文焯&lt;/persName>&lt;/li>
&lt;li>&lt;persName>花之寺僧羅聘&lt;/persName>(不加roleName)&lt;/li>
&lt;li>&lt;persName>&lt;placeName>華陽&lt;/placeName>&lt;roleName>眞人&lt;/roleName>陶貞白&lt;roleName>先生&lt;/roleName>宏景&lt;/persName>&lt;/li>&lt;/ul>
|-
|子
|&lt;ul>&lt;li>寒山子&lt;/li>&lt;li>殳子山夫&lt;/li>&lt;li>朱氏子&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>寒山&lt;roleName type=”honorific”>子&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>孔&lt;roleName type=”honorific”>子&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>殳&lt;roleName type=”honorific”>子&lt;/roleName>山夫&lt;/persName>&lt;/li>
&lt;li>寂窓照禪師,俗姓&lt;persName>鄧&lt;/persName>。(鄧,在此指其 姓)&lt;/li>
&lt;li>如堂,寂光寺僧,澂江&lt;name>楊&lt;/name>氏子(楊,在此指其族姓 &lt;/li>&lt;/ul>
|-
|兒
|&lt;ul>&lt;li>陵兒&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>陵&lt;roleName>兒&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|公
|&lt;ul>&lt;li>歐陽文忠公&lt;/li>&lt;li>忠定公燮元&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>歐陽文忠&lt;roleName type=honorific>公&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>忠定&lt;roleName type=honorific>公&lt;/roleName>燮元&lt;/persName>&lt;/li>&lt;/ul>
|-
|氏
|&lt;ul>&lt;li>大雄氏(指佛)&lt;/li>&lt;li>孔雀氏(指阿育王)&lt;/li>&lt;li>俞氏&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>俞氏&lt;/persName>(皆直標persName,不用標roleName)&lt;/li>&lt;/ul>
|-
|師 本師
|&lt;ul>&lt;li>本師阿彌陀如來(「非人」名稱只單純標&lt;persName> &lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>本師阿彌陀如來&lt;/persName>&lt;/li>
&lt;li>&lt;persName>阿彌陀佛&lt;/persName>&lt;/li>
&lt;li>&lt;persName>阿彌陀佛&lt;/persName>如來本地&lt;/li>&lt;/ul>
|-
|大士、菩薩
|&lt;ul>&lt;li>觀音大士&lt;/li>&lt;li>普賢菩薩(「非人」名稱只單純標&lt;persName> &lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>觀音大士&lt;/persName>&lt;/li>
&lt;li>&lt;persName>普賢菩薩&lt;/persName>&lt;/li>&lt;/ul>
|-
|山人
|&lt;ul>&lt;li>漁洋山人&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>漁洋山人&lt;/persName>&lt;/li>&lt;/ul>
|-
|上人
|&lt;ul>&lt;li>悟上人&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>悟&lt;roleName type=honorific>上人&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|老
|&lt;ul>&lt;li>印老法師&lt;/li>&lt;li>南亭老和尚&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>印&lt;roleName type=honorific>老&lt;/roleName>&lt;roleName>法師&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>南亭&lt;roleName type=honorific>老和尚&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|老人
|&lt;ul>&lt;li>南極老人&lt;/li>&lt;li>無著老人&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>南極老人&lt;/persName>&lt;/li>
&lt;li>惟我先師&lt;persName>無著&lt;roleName type=honorific>老人&lt;/roleName>&lt;/persName>(一般稱謂、敬稱,標示&lt;roleName>)&lt;/li>
&lt;li>別號&lt;persName>無著老人&lt;/persName>(專稱、別號,直用&lt;persName>)&lt;/li>&lt;/ul>
|-
|翁
|&lt;ul>&lt;li>壑翁相國(賈秋壑)&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>壑&lt;roleName type=honorific>翁&lt;/roleName>&lt;roleName>相國&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|先生
|&lt;ul>&lt;li>半農先生&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>半農&lt;roleName type=honorific>先生&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|夫人
|&lt;ul>&lt;li>許夫人&lt;/li>&lt;li>秦國夫人計氏&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>&lt;roleName>秦國夫人&lt;/roleName>計氏&lt;/persName>&lt;/li>&lt;/ul>
|-
|諡號
|&lt;ul>&lt;li>謚「大悟禪師」&lt;/li>&lt;li>賜號「廣慧妙悟智寶宏教禪師」&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>大悟&lt;roleName>禪師&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>廣慧妙悟智寶宏教&lt;roleName>禪師&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|皇帝(皇后)
|&lt;ul>&lt;li>世宗憲皇帝&lt;/li>&lt;li>梁皇&lt;/li>&lt;li>慈寧皇太后&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>世宗憲&lt;roleName>皇帝&lt;/roleName>&lt;/persName>&lt;/li>
&lt;li>&lt;persName>慈寧&lt;roleName>皇太后&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|帥
|&lt;ul>&lt;li>筱帥&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>筱&lt;roleName>帥&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|君
|&lt;ul>&lt;li>須直君&lt;/li>&lt;li>葛君&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>葛&lt;roleName type=honorific>君&lt;/roleName>&lt;/persName>&lt;/li>&lt;/ul>
|-
|諱
|&lt;ul>&lt;li>王諱舉(王舉)&lt;/li>&lt;/ul>
|&lt;ul>&lt;li>&lt;persName>王&lt;/persName>諱&lt;persName>舉&lt;/persName>&lt;/li>&lt;/ul>
|-
|}


  4 人 名規 範資料建檔注意事項
  ●切檔命 名規 則<br>
  (1)名字
  志碼_front:卷前(如 出版社的書 頁、出版社的版本說明 木刻版的題 頁等)<br>
   a)常 名、 請冠上姓氏,以便利檢索。
  志碼_00 卷首(題 頁之後的內容 如:序文、目錄、山圖等)<br>
   b)每一語系中,應有一常名,餘則為別名。
  志碼_01 卷一<br>
  (2)缺字 中有缺字時 人名欄位以通用字表示。
  志碼_02 卷二( 卷次類推)<br>
  (3)朝代 以此人的卒年為依。
  志碼_back 附錄、補編等<br>
  (4)籍貫 其地名朝代 此人的生年為
志碼_back1 附錄、補編 多卷時 可加序號 。例 如附編卷一<br>
  (5)生卒年
  志碼_back2 錄、 編有 多卷 時, 可加序號 例如附編卷二<br>
   a)生年的計算 生年=卒年-歲壽+1
   b)生卒年的取捨 若資料來源 干支年及西元年 以取干支年為準
    :重顯(980~1052),宋代雲門宗僧。於皇祐四年入寂。
     建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。
  (6)是否為歷史人物 若非歷史人物,則在此欄位勾「否」。
(7)註解:
   a)以120個字為限(阿拉伯數字不算字數,標點符號算字數),並請使用全形標點符號。
   b)若此人查不到生卒年,則應在註解欄的資料中盡可能節 相關人事物的時間參考點。
   c)僧人註解資料的基本要件:師承 師兄弟、著作、法嗣、事件時間。
   d)引用資料,盡量以紙本、藏經或佛學辭典為優先。
    使用網路資料時,應注意留存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。
   e)引用資料時須註明資料來源。出處的作用:1).說明資料來源 2).幫助使用者搜尋(Finding Aid)
   f)「佛學規範資料庫」對於經常引用的參考工具書 編有 「簡稱」,引用這些參考書 請以這些「簡稱」為依。
   g)Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。
(8)若是查詢不到任何資料的人名 請不用收錄至規範資料庫 (文本上標 key="unknown" 即可)


5 人名標記規則
(1)文本中出現的人名,皆應標記。(包括書名號內的人名)
  
(2)標題後的人名是「作者」時的標法
   &lt;head>標題&lt;/head>&lt;byline>&lt;persName key="Axxxxxx">作者名&lt;/persname>&lt;/byline>
  (&lt;byline>:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
  
(3)遇人名不確定是否為某人時,可加屬性值標示。
   例:&lt;persName key="A001606" cert="70%">
   cert是表示標記者認為的正確度,是相對值,非絕對的。
(4)非人,非人界皆要標記。(2011/1/27回函決議)


[[# 、人名|返三、人名]]
●特殊例子的切檔<br>
例:<br>
g087有六個卷一,兩個卷 。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷題情勢做適當的調整)。<br>
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6<br>
g087_03-1,g087_03-2<br>


===地名===
= 加facs碼=
1 地名規範資料的建置(若欲建檔,請先以帳號密碼登入)
<b>1. 執行git中的facs.py程式,為內文中的pb加上facs</b><br>
  ● 地名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/place/
   例:原<pb n="0041"/><br>
  ● 地名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「地名規範資料庫」]
     執行程式後變成<pb facs="1B017P108.jpg" n="0041"/><br>
  ● 地名規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]


  2 地名 標記
<b>2.請網路工程師(阿賢)為main檔加facsimile</b><br>
&lt;xml code> 標法:
   將加好pb facs的檔案,連同main檔,一併交給工程師。工程師會在main檔加入如下的 標記 :<br>
   &lt;placeName key="xxxxxxxxxxxxxx">地名&lt;/placeName>
<xml code>
   &lt;placeName key="unknown">未知的地名&lt;/placeName>
  <tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0">
   &lt;placeName key="xxxxxxxxxGxxxx">地名群組&lt;/placeName>&lt;/xml>
  <tei:graphic url="1B017P108.jpg"/>
  <tei:graphic url="1B017P109.jpg"/>
 ......
 ......
</xml>


3 地名標記凡例
<b> 事項:卷內的pb facs要與main中的facsimile url同步</b><br>
{| border="1" cellpadding="0" cellspacing="0"
  各卷內 頁碼有時會有錯誤,當修改pb facs碼時,請順便也要一併修改main 的facsimile url,這樣文件才會完整。<br>
|+
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/><br>
! 型態
  Y141_main <tei:graphic url="4B100P005.jpg"/><br>
! 凡例
! 標記
|-
|單純行政區地名
|杭州
|&lt;placeName key="CN0330103Z19AA">杭州&lt;/placeName>
(需配合文 而選擇朝代別)
|-
|單純自然區地名
|普陀山
|&lt;placeName key="CN0330903M01AA">普陀山&lt;/placeName>
|-
|連名
|四川峨眉縣
|&lt;placeName key="CN0511181Z02AA"> 四川峨眉縣&lt;/placeName>
  (以連名 最小地點為其ID)
|-
|地名 含人名
|遂賜額曰「天花尊者開巖院」
|&lt;placeName key="CN0331023T57AA">&lt;persName key="unknown">天花尊者&lt;/persName> 開巖院&lt;/placeName>
|-
|寺內建築:一般
|大雄寶殿、放生池
|文本不標,資料庫不建
|-
|寺內建築: 具特殊意義
|阿育王寺舍利塔殿
|文本應標,資料庫應建
|-
|地名群組
|五嶽
|&lt;placeName key="CN0000000G07AA"> 五嶽&lt;/placeName>
|
|}


4 地名規範資料建檔注意事項
=文件宣告=
  (1)地名尾碼非AA碼者 不可重新編碼,因為會牽涉到相同主碼的其他地名。
  1各卷文件宣告列 請一致用:<br>
(2)Google map與衛星圖的經緯度有落差 在標經緯度時以衛星圖為主。
<?xml version="1.0" encoding="UTF-8"?>(雙引號 大寫UTF)
(3)地名的建置,註解欄注意事項請參閱[[4人名規範資料建檔注意事項]]內有關註解的條目。


  5 地名 標記 規則
  2缺字在檔頭宣告,其流程:<br>
   文本 中出 現的地名 皆應標記,但除了 小地名不標外
<xml code>
1)開啟main檔
2)在</fileDesc>之後加上以下的群組 標記
<encodingDesc>
   <charDecl>
   <char xml:id="Z0001"> <!-- Z0001為DILA難檢字庫 ID -->
    <charName>DILA CHARACTER Z0001</charName>
    <charProp>
     <localName>CBETA</localName> <!-- CB碼 -->(若無可省略)
     <value>CB30005</value>
    </charProp>
    <charProp>
     <localName>composition</localName> <!-- 組字式 -->
     <value>[宀/廣]</value>
    </charProp>
   </char>
  </charDecl>
</encodingDesc>
3)在當志 ,用「<g ref="#」搜尋 所有缺字。
4)逐一將缺字碼放在「DILA 難檢字庫」中檢索 將缺字資料填補入缺字宣告中。
從缺的項目可省略


例:g069_main
</fileDesc>
<encodingDesc>
  <charDecl>
   <char xml:id="Z0393">
    <charName>DILA CHARACTER Z0393</charName>
    <charProp>
     <localName>composition</localName>
     <value>[山*克]</value>
    </charProp>
   </char>
   <char xml:id="Z0523">
    <charName>DILA CHARACTER Z0523</charName>
    <charProp>
     <localName>composition</localName>
     <value>[風*丘]</value>
    </charProp>
   </char>
   <char xml:id="Z0522">
    <charName>DILA CHARACTER Z0522</charName>
    <charProp>
     <localName>composition</localName>
     <value>[山*右]</value>
    </charProp>
   </char>
  </charDecl>
</encodingDesc>
</teiHeader>
</xml>


[[#四、地名|返四、地名]]
=段落形式=
==標題==


===時間===
 1 標題 標法<br>
 1 時間規範資料 查詢(若欲查詢,請先以帳號密碼登入)
&lt;head>標題&lt;/head><br>
  ●  時間規範資料庫網頁 http://dev.ddbc.edu.tw/authority/time/
  ● &lt;head>標題&lt;/head>&lt;byline>&lt;persName>作者&lt;/persName>&lt;/byline><br>
  ●  時間規範資料 討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問]
● &lt;head>標題&lt;seg rend="font-size:small">副標題&lt;/seg>&lt;/head><br>
●  標題小字不折行(程式預設):<seg rend="font-size:small">標題中 縮小字</seg><br>
● 標 小字要折行:<seg rend="font-size:small;display:block">縮小的字</seg><br>
● 標題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩<br>


 2 時間
 2 自訂 題<br>
 
   1.全自加<br>
  ● 標法:
    &lt;head>&lt;supplied resp="dila.da"> 自訂標題&lt;/supplied>&lt;/head><br>
  &lt;date key="j+(起始時間碼)+(結尾時間碼)" notBefore-iso="起始西元年-月-日" notAfter-iso="結尾西元年-月-日"> 區段性的某時間&lt;/date>
  例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0309 〔劉仁本題跋〕]<br>
&lt;date key="j+(開始時間碼)+(結束時間碼)" from-iso="開始西元年-月-日" to-iso="結束西元年月日"> 事件持續進行的時間&lt;/date>
 2.半自加<br>
&lt;date key="j+(當日時間碼)+(當日時間碼)" when-iso="西元年-月-日"> 時間點&lt;/date>
  &lt;head> 原標題&lt;supplied resp="dila.da"> 自訂標題&lt;/supplied>&lt;/head><br>
&lt;date key="unknown"> 未知的時間&lt;/date>
     :[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g084&cpage=0005 雞足山志序〔二〕]<br>
 
 3.隱藏自加的 題<br>
 
  &lt;head rend="display:none">&lt;supplied resp="dila.da"> 自訂標題&lt;/supplied>&lt;/head><br>
時間標記凡
  例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g008&cpage=0001 志名頁]<br>
{|border="1" cellpadding="0" cellspacing="0"
  ps.  rend="display:none"  隱藏元素格式(不留白)<br>
|-
    rend="visibility:hidden"  保留元素格式(留白)<br>
!時間型態
!凡例
!
|-
|區段性的某時間
|余以光緒己卯游天台
|&lt;date key="j24073722407755" notBefore-iso="1879-01-22" notAfter-iso="1880-02-09"> 光緒己卯&lt;/date>
 說明:a)key2407372: 光緒己卯年正月一日ID
    b)key2407755:光緒己卯年正月三十日
    c)notBefore-iso:光緒己卯年正月一日ID
    d)notAfter-iso:光緒己卯年正月三十日
|-
|明確日期
|萬曆庚戌年五月十六日
|&lt;date key="j23092772309277" when-iso="1610-06-26"> 萬曆庚戌年五月十六日&lt;/date>
|}


3說明<br>
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。<br>
  另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。<br>
 段落句首折作標題與否示例(以g074雲居山志 為例)
 (一)直接折作標題
    原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。
 
    範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來---
       標題:自寳禪師
       內文:上堂。總恁麽風恬浪靜,那裏得來---
    範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲---
       標題:宗杲大慧禪師
       內文:時圜悟詔住雲居,師往省覲---
    範例3:p82 晦山顯禪師  師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
       標題:晦山顯禪師
       內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
    範例4:p105 復合神鐘  寺有巨鐘,明中葉院圮---
       標題:復合神鐘
       內文:寺有巨鐘,明中葉院圮---
 
 (二)依句頭另作標題[ ]
    原則:若段落首句的文法成份是屬於「主詞」或「前置受詞」的,則應留作內文句頭,而另訂標題。
    範例1:p65 道齊禪師 本州金氏子,徧歷禪會---
       標題:[道齊禪師]
       內文:道齊禪師(主詞),本州金氏子,徧歷禪會---
    範例2:p70 克勤佛果禪師 建炎丁未歲十一月初六日,奉敕住雲居---
       標題:[克勤佛果禪師]
       內文:克勤佛果禪師(主詞),建炎丁未歲十一月初六日,奉敕住雲居---
    範例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居---
       標題:[燕雷鵬禪師]
       內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居---
    範例4:p103 佛印禪師 周茂叔謁見,問曰---
       標題:[佛印禪師]
       內文:佛印禪師(前置受詞),周茂叔謁見,問曰---
    範例5:p106 寺左三塔 沉埋土中多年---
       標題:[寺左三塔]
       內文:寺左三塔(主詞)沉埋土中多年---
 ○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。
(2)標題後的副標題,可以&lt;seg>(隨機分割)標記之。<br>
.例:&lt;div>&lt;head>大安禪師&lt;seg rend="font-size:small">上堂一則 機緣二則&lt;/seg>&lt;/head><br>
.&lt;seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。<br>
(3)若底本格式為「作者在標題之前」,且編輯分類是以「作者」為主時,則作者亦可作標題。<br>
例:[http://buddhistinformatics.dila.edu.tw/fosizhi/ui.html?book=g028&cpage=0458 g028p458 厲鶚]<br>


 4 時間規範資料建檔注意事項
 4 長詩題的另訂
  (1)佛寺志專案使用Julian day number時間系統 請確認介面是否選用此項
  關於長詩題的另訂 顧問老師自訂一個「30字的參考值」 即約超過30字,就另訂標題;不到30字 另訂。30個字,是經驗上 拿捏 也是 便工作的設計,沒有絕對的理由
(2)若未「登入」時間規範資料庫 查詢結果將 會自動計算「初年」、「末年」等較詳細之資訊。
(3)時間 查詢有多種管道:中國年(朝代、帝號、年號、年干支) 西元年(三種 式),ID碼


 5 時間 記規則
 5標 點符號<br>
(1)可 查知的時間,皆應 記;無法證知(從前後文或其他資料皆無法得知)的時間
(1) 標題亦 加新式 點符號 惟結尾不用句點。<br>
  則可標記&lt;date key="unknown">未知年的時間&lt;/date>


(2)有些時間因文本錯誤以致無 找到id,可用note註解,
==段落樣式==
  例:當穆王五十三年壬申二月十五子夜,入般涅槃
===樣式語 ===
  &lt;date key="unknown"> 穆王五十三年壬申二月十五子夜&lt;/date>
◎全段縮小字<br>
  &lt;note resp="ddbc.da">據《中國史厯日和中西厯日對照表》(方詩銘、方小芬編著,上海人民出版社2007)編載,周穆王只行到四十一戊戌年(-983)。&lt;/note>
 &lt;p rend="font-size:small"> 全段縮小字&lt;/p><br>
 範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0427 g009p0427]<br>


  (3)初年,末年時間 擷取原則
  ◎全段縮排一個字<br>
  取當朝、當年號、當年的前1/4為其初年,末1/4為其末年。
 &lt;p rend="margin-top:1ex;text-indent:0">縮排 段落&lt;/p><br>
 範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0593 g009p0593]<br>


  (4)時間為民國年 查法
  ◎全段縮排一個字,但第一行凸排一個字<br>
  登入網頁「兩千年中西曆轉換」http://sinocal.sinica.edu.tw/
 &lt;p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排 段落&lt;/p><br>
  兌換出相對應的西元時間 再到時間規範資料庫換算ID碼即可
 範例 [http://dev.dila.edu.tw/fosizhi/ui.html?book=g009&cpage=0023 g009p0023]<br>
  例:民國壬寅年
 ps.底本若有條列式段落符號,以符號「―」表示 而不用「一」
  兌換出為西元1962年2月5日~1963年1月24日
  再到時間規範資料庫以西元年查詢為5949266~5949619
  即&lt;date key="d59492665949619"
    notBefore="1962-02-05" notAfter="1963-01-24">


  (5)時間屬性 變更:(2011.01.20)
  ◎第一行不縮排。(通常用在詩文夾雜 長行段落 <br>
   notBefore,notAfter,from,to,when,全要加上-iso(計算0年
 &lt;p rend="text-indent:0"> 詩偈後接續的長行&lt;p><br>
   如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso
 範例:[http://dev.dila.edu.tw/fosizhi/ui.html?book=g062&cpage=0104 g062p0104]<br>
   例:&lt;date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13"> 哀帝元壽間&lt;/date>


  (6)萬   丙子秋(=萬曆丙子秋)
  ◎靠右對齊<br>
   例:&lt;date> 萬 丙子秋&lt;/date> (照標時間,空格不再處理。)
 &lt;p rend="text-align:right"><br>


  (7)屬性key,notBefore,notAfter的先後順序不一 不會影響驗證或呈現。
  ◎全段並排小字 有時可以調整為大字<br>
   :&lt;date key="j22968992296986" notBefore-iso="1576-08-05" notAfter-iso="1576-10-31">萬曆丙子秋&lt;/date>
  :g079 p.004崇眞 壽宮<br>
   =&lt;date notAfter-iso="1576-10-31" notBefore-iso="1576-08-05" key="j22968992296986"> 曆丙子秋&lt;/date>


  (8)當時間同時有年次 歲次時 可只標較詳細的歲次時間
===序、跋、按語之格式===
   :時宣統三年 歲在&lt;date key="j24192292419229" when-iso="1911-07-11"> 辛亥六月旣望&lt;/date> ,長洲葉昌熾謹記
1. 小序、小引<br>
  1)「詩」(詩行)前小序 小引 做一般段落,並依底本之大小字體編輯之 <br>
    :g023卷六p371(雲林看雨圖題句小引)<br>
  2)「文」(長行)前小序、小引 全段縮排3格。<br>
   例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)<br>


  (9)時間名詞+初 末:包進時間。
2. 識(獨立的段落)<br>
   例:&lt;date key="j22956292299967" notBefore-iso="1573-02-12" notAfter-iso="1584-12-29">萬曆初&lt;/date>
  1)跋文本身無標題 全段縮排3格 <br>
   時間名詞+初年、末年 包進時間
    例1:g016p362( - - - 慧荃跋closer)<br>
   例:&lt;date key="j22956292299967" notBefore-iso="1573-02-12" notAfter-iso="1584-12-29">萬曆初年&lt;/date>
    例2:g023p363( - - - 魏成憲并識)<br>
   時間名詞+中、間、年間:不包進時間。
   例:&lt;date key="j22956292312983" notBefore-iso="1573-02-12" notAfter-iso="1620-08-18">萬曆&lt;/date> 年間


  (10)清光緒末年的時間計算問 題( 德宗&恭宗皆以光緒為年號
    2)跋文本身有標 題( 或添加標題 ): 作一般段落 不縮排 <br>
  a)光緒末年,指德宗+恭宗的年代的末1/4。
    例1:g028p445(--- 大掄敬識)<br>
   阿賢 無法用程式計算 請各位自己計算
    例2:g016p1374(李流芳題跋)<br>
  b) 志偉的意見:若有數個,則取最長的那一個末年,如上則取德宗光緒的末年即可。


  6 知識備忘
3. 按語(獨立的段落)<br>
  (1)春=農曆1-3月 夏=農曆4-6月,秋=農曆7-9月,冬=農曆11-12月
    全段縮排3格 並依底本之大小字體編輯之。<br>
  (2)農曆月份的別名
    例1:g016p378按寺舊志云觀松在香積......<br>
   一月:孟春、元春、開歲、端月、嘉月、正月。
  例2:y105p54按范浦之水來自 雲諸山......<br>
   二月:仲春、杏月、麗月、如月、花月。
   三月:季春、晚春、暮春、季月、蠶月、桃月、桐月。
   四月:孟夏、麥月、陰月、梅月、純陽。
   月:仲夏、榴月、蒲月、皋月、毒月。
   六月:季夏、暑月、焦月、荷月、荔月。
   七月:孟秋、新秋、蘭秋、蘭月、瓜月、巧月。
   八月:仲秋、竹春、桂月、壯月。
   九月:季秋、暮商、菊月、朽月、陽月、季秋。
   十月:孟冬、初冬、開冬、露月、良月、陽月。
   十一月:仲冬、辜月、葭月、龍潛月、冬月。
   十二月:季冬、殘冬、臘月、冰月、嚴月。


[[#五、時間|返五、時間]]
  [ ] 在不影響版面之識別效果下,上開底本之小字體可以改大。<br>


===代名詞===  
    ps.以上規則僅是個大原則,若遇有特殊情況,得依當志之特性而做適切之調整。<br>
1標法:
&lt;ref key="Axxxxxx">人名代名詞&lt;/ref>
 例:&lt;ref key="A003940">余&lt;/ref>(余指徐時泰)
&lt;ref key="xxxxxxxxxxxxxx">地名代名詞&lt;/ref>
 例:待補


  標記 時機 當詞意不明顯時才須標
==表格==
  表格的 標記 元素 <br>
 &lt;table>:以表格形式呈現、包含在直行橫列中的文字內容<br>
 &lt;row>:包含表格中的一列<br>
 &lt;cell>:包含表格中的一個儲存格<br>
 &lt;cell rows="列數">:表格合併列<br>
 &lt;cell cols="欄數">:表格合併欄<br>
 實例:請參見中國佛寺志 g089p0254<br>


==詩詞歌賦偈==


[[#《中國佛寺史志》數 典藏工作手冊|返目錄]]
===元素===
*&lt;lg>(行組, Line Group)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
*&lt;l>(詩行)包含詩文的一行,也許是不完整的詩行。
*&lt;caesura/> 標記韻律詩行可能被截斷的 置。


=== 註解(ddbc.da)===
=== 範例===
  
  詩文的呈現方式有二:1. 作詩行。2. 做長行 <br>
1. 註解內無超連結
  標法:&lt;note resp="ddbc.da">註解文字&lt;/note>
  例:梁視&lt;note resp="ddbc.da">視,疑爲「祖」字 &lt;/note> 普通三年


  2. 註解內有超連結
1. 詩行格式通常不用標點,同行兩句間標<caesure/>,如g007p.887。<br>
  標法:&lt;note resp="ddbc.da">註 解文字(&lt;ptr target="網址"/> ,日期)&lt;/note>
<syntaxhighlight lang="XML">
  例:應案&lt;note resp="ddbc.da"> 「案」字,萬福禪寺網站 處作「索」。
 <p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇
 (&lt;ptr target="http://www.huangboshan.com/zisusifu.htm"/> ,2010.05.04 &lt;/note> 屐而自潸。(g010p0445)
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上 圎覺經遣使馳賜命作序
師具表奏謝仍進頌曰:
<lg><l>古佛與今佛<caesura/>同一廣長舌</l>
  <l>於無途轍中<caesura/>為物啟途轍</l>
  <l>撥開千嶂雲<caesura/>放出一輪月</l>
  <l>普令大地人<caesura/>言下悉照徹</l>
  <l>覺亦無可圎<caesura/> 幻亦無可滅</l>
  <l> 無亦無<caesura/>紅爐一點雪</l>
  <l>稽首佛與佛<caesura/>字字無異說</l></lg>
既經乙夜之覽皇情大悅</p>
※p內可包lg(已可通過validate驗證
</syntaxhighlight>


  3.註解 引用 自CBETA資料時
2. 文章中夾有詩文,若做詩行格式,則不用 號。若必須 ,則改用長行,並加 點,如g038p.174。<br>
  法:&lt;note resp="ddbc.da">CBETA經文(CBETA預設的引用格式)&lt;/note>
<syntaxhighlight lang="XML">
  例:著作郎&lt;persName key="A010335"> 顧允祖&lt;/persName>&lt;note resp="ddbc.da">
<p> 張萊 《三 山志 》:「 守戒住金山,行高而能文詞。高廟駐蹕於北 鳳凰池,
   集神州 寶感通錄 卷1 :「 著作郎 胤祖 (CBETA, T52, no. 2106, p. 405, a17)&lt;/note>
獻詩曰:賊寇臨京口,王師出海邊。四方喧動地,萬姓共瞻天。
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。 </p>
</syntaxhighlight>


其他 規則:
===標點===
  (1)標題內的註 ,請置於&lt;head> 內。
<b>按語的標點 規則:</b><br>
  例 &lt;head> 于黃檗丈室堂第三代隱元隆琦國師 上堂九則 機緣三則&lt;note resp="ddbc.da">
1. 作「據查」 <br>
   按: 標題為上堂法語九則 機緣三則;內文實則收錄 堂法語八則,機緣五則 &lt;/note>&lt;/head>
 g049編按 産西門寨石之「鞏州」,爲今甘肅之隴西縣 。<br>
   g049按:華嚴寺,馮守誦《華嚴經》,感玉女饋餐......<br>
 g049謹 按: 生於 川  <br>


2. 作「依據」解<br>
 g49按《莊子》,瞿君字鵲子。<br>
 g049按大師此語,凡在峨眉遊居者,皆當......<br>
 g049按《益部方物略》:「海棠,有數種。<br>
 g077按志中,前代諸鉅公經此境者,其唯......<br>


===特字===
3. 作「依照 、查看」解<br>
  特字處理原則:
 g049按新圖 稽舊聞 亦數月而竣事。<br>
  特殊字的處理 第一優先是尋查有無unicode編碼字(包含Ext. C)
 g049故只按舊志及諸經傳而爲證訂 <br>
  接著再根據文字本身或搭配前後文做判斷
 g077按之九華碑版亦然。<br>
  (以下說明參照圖檔[[1B011P039.jpg]]、[[1B009P562.jpg]]、[[特字對應處理表.pdf]])


  一、若此字易於辨識者(不會產生懷疑 ,不管是否為unicode編碼 ),則不做任何標記。
===詩偈 ===
   (1)少一撇、多一點的字:不標記 選擇用通用字 。例:播,余。
1.詩偈中,解釋上句 或同行 的註解性質的小 字, <seg rend="font-size:small"> <br>
   (2)刻版慣例,書寫習慣:不標記(選擇用通用 )。例:於/扵 所。
2.詩偈中 解釋全首的註解性質的小 字, <note rend="font-size:small"> (放在</l> 後面、</lg>前面)<br>
   (3)搭配前後文易於辨識者:不 記(選擇用通用字)。例:關,賴
 (由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l> 同行。<br>
  
  TEI語法的規則,seg無法標在<l></l> 外面 。)<br>
  二、若此字不易於辨識者(不易讀懂 罕用 字, 異體字,古體字),則:
3.詩偈中,總釋前幾首詩的註解性質的小 字, 標&lt;p>&lt;note rend="font-size:small">&lt;/note>&lt;/p>。<br>
   (1)有unicode編碼字,亦有通用字時。例:[㝎=定][銕=鐵][厺=去][灋=法]
     法:&lt;choice>&lt;orig>文本原字(unicode)&lt;/orig>&lt;reg resp="ddbc.da"> 通用字&lt;/reg>&lt;/choice>
     範例:優曇華發&lt;choice>&lt;orig> 㝎&lt;/orig>&lt;reg resp="ddbc.da"> 定&lt;/reg>&lt;/choice> 中香
    (通用字的查詢,可借助字書工具,如CBETA漢字資料庫,教育部異體字網站等 。)
   
   (2)無unicode編碼 字, 有通用字時。例:[叠*毛]=㲲
     法:&lt;reg> 通用字&lt;/reg>
     範例:無價白&lt;reg> &lt;/reg> 殮金色身


   (3)無unicode編碼字 亦無通用字 例:[革*代]
===注意事項===
     法:&lt;g ref="#btgzzzppppnn"/> (並需建立缺字檔)
#&lt;lg>與&lt;p>是平行的結構 故&lt;lg>與&lt;p>不可互包 應結束&lt;/p>後,再 標&lt;lg>
     佛寺志字圖檔命名原則:#btg+志碼3碼+ 碼4碼+序碼2碼(序碼:此 第幾個缺字)
# 當詩詞跨 時,照書換 ,不用顧及排版問題。
     範例:捫蘿雲在&lt;g ref="#btg010052801"/> ,汲井月隨繩
#詩偈不用標逗,詩句中間的間隔,以&lt;caesura/> 標示


  三、若文字本身有歧義時,即文字本身雖為 般字,但在此另有別義,易使讀者對句意產生誤會者。
== 頁多欄==
   例:[縣;懸][餉;晌]
  如:g003p0273
   標法:&lt;choice>&lt;sic>文本原字&lt;/sic>&lt;reg resp="ddbc.da">消歧字&lt;/reg>&lt;/choice>
   範例:萬靈八部&lt;choice>&lt;sic>縣&lt;/sic>&lt;reg resp="ddbc.da">懸&lt;/reg>&lt;/choice>望已久
   範 :&lt;choice>&lt;sic>餉&lt;/sic>&lt;reg resp="ddbc.da">晌&lt;/reg>&lt;/choice>刻而返


=[http://wiki.dila.edu.tw/pages/%E6%A8%99%E8%A8%98%E5%85%83%E7%B4%A0 標記元素]=
1 頁碼<br>
2 人名<br>
 2.1 人名規範資料的建置<br>
 2.2 人名標記標法<br>
 2.3 人名標記凡例<br>
 2.4 人名規範資料建檔注意事項<br>
 2.5 人名標記規則<br>
3 地名<br>
 3.1 地名規範資料的建置<br>
 3.2 地名標記<br>
 3.3 地名標記凡例<br>
 3.4 地名規範資料建檔注意事項<br>
 3.5 地名標記規則<br>
 3.6 地名問答<br>
4 時間<br>
 4.1 時間規範資料的查詢<br>
 4.2 時間標記<br>
 4.3 時間標記凡例<br>
 4.4 時間規範資料建檔注意事項<br>
 4.5 時間標記規則<br>
 4.6 民國年<br>
  4.6.1 時間為民國年的注意事項<br>
  4.6.2 時間為民國年的查法<br>
  4.6.3 時間屬性的變更(2011.01.20)<br>
  4.6.4 時間問答<br>
 4.7 知識備忘<br>
 4.8 朝代code<br>
5 代名詞<br>
 5.1 標法<br>
 5.2 標記時機<br>
6 註解(底本本身)<br>
7 註解(dila.da)<br>
8 空格<br>
9 訛字處理<br>
10 漏字處理<br>
 10.1 缺漏字<br>
 10.2 補字<br>
11 重複字<br>
12 底本本身的刪塗、訂正字<br>
13 印章<br>
14 上標字及頁註<br>
 14.1 上標字<br>
 14.2 頁註<br>
15 圖檔<br>
 15.1 圖檔標記<br>
 15.2 特殊圖表製圖流程(Odg轉svg)<br>
16 標籤label<br>


● unicode編碼
= 元層次=
  Unihan網站 http://www.unicode.org/charts/unihanrsindex.html


.utf字符碼CJK漢字的範圍
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 佛寺志專案 特 處理]==
  * utf-32:U+20000- U+2A6DF(中日韓統一表意文字擴展B區)
  * utf-32:U+2A700-U+2B73F(中日韓統一表意文字擴展C區)
   Y:\Projects\fosizhi\work\tools\字型\ext_c\n3190.pdf
  * utf-32:U+2B740- U+2B81F(中日韓統一表意文字擴展D區)
   Y:\Projects\fosizhi\work\tools\字型\ext_d\ExtensionD
  * Decimal:131072以上
  (以上皆屬Extension的擴展 ,可直接貼在文本。)


  . 若unicode 編碼字 在Oxygen 輯器下 法直接貼上時, 先以Notepad++開啟此 ,並於內貼上此 、存
1 作業環境<br>
  然後再轉接以Oxygen繼續作業。此時經過Notepad++轉化的此 缺字 ,將在Oxygen以□的形式 顯,
2 特字處理方式及工具<br>
  但在網頁上應已可以如實呈現。
3 特字處理原則<br>
  如果此 在介面仍無 顯現,請檢查是否已安裝Undicode擴充
3.1 有 unicode  編碼 <br>
  Y:\Projects\fosizhi\work\tools\ 型\ext_b\PMingLiU Update Pack.msi
 3.1.1 易於辨識<br>
  Y:\Projects\fosizhi\work\tools\ 型\hanazono\hanazono.ttf
 3.1.2 不易辨識<br>
3.2 無 unicode  碼的字<br>
 3.2.1 易於辨識<br>
 3.2.2 不易辨識, 有通用字<br>
 3.2.3 不易辨識,  通用字<br>
4 特字處理新規 <br>
5 如何統一各志間特字處理方式<br>
6 難檢字庫缺字建 <br>
7 難檢字庫缺 製作<br>
 7.1 原則<br>
 7.2 製圖步驟<br>
缺字呈 現<br>
9 unicode 編碼字<br>
 9.1 CJK漢 編碼範圍<br>
 9.2 編輯器<br>
 9.3 快速尋找unicode的方 <br>
10 有助於增加特 處理效率的工具與方法<br>
11 SVG造 <br>
 11.1 參閱<br>
 11.2 安裝<br>
 11.3 inkscape造 操作法<br>
 11.4 illustrator造字操作法<br>
 11.5 參考範例<br>
12 參考資源<br>


==標逗==
● 缺字圖檔處理【Erica】
===書名===
1.書名的標符樣式:《》<br>
2.書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。<br>


1.原則 裁切 本掃瞄檔(.tif)作為 圖。(作法如下)
===結尾署語===
 
Q 結尾署語<closer>中的 文字 是否標逗?<br>
2.裁切掃瞄檔製作字圖步驟(利用Gimp軟體處理)
A:原則上 開放 ,適 添加, 便閱讀。但結束可不加句號。<br>
  (1)開啟Gimp功能表「檔案」.
  (2)點選「 啟」.
  (3)選擇缺字當頁的掃瞄圖.ex:1B001P077
   (檔案路徑Y:\Projects\fosizhi\master-data\images\tif\1Book001\1B001P077)
  (4)放大圖片以利裁切:點選「顯示」選擇「縮放1:1(100﹪)」.
  (5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆).
  (6)將「剪裁」圖形移至缺字字體,確認位置後在選取的字框內點選滑鼠左鍵2次,即出現裁切之缺字圖檔.
  (7)設定圖片尺寸:點選「影像」選擇「縮 影像」設定尺寸:45X47( 一下右邊鐵鍊圖形--目的是解除固定) 解析 :72像素,完成後點選下 「縮放」即完成.
  (8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成


  
  例如:<br>
  ● 建立缺字檔【Erica】
  元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記<br>
  佛寺志缺字庫網頁http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq


  (1)缺字檔名編碼原則: btg086(志名)0327(頁碼) 01(第幾個缺字)。
  加上 逗:<br>
   目錄缺字id:btgcal(目錄)XXXX(頁碼)XX(第幾個)
  元祐三年八月 十有八日 朝散大夫. 舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡 <br>
(2)登入佛寺志缺字庫網頁
(3)取碼目的:取得缺字碼&lt;g ref="#btg086001701"/> 記內文及建置缺字組
(4)建置步驟說明:
  (a)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (b)產生缺字id後,即可輸入缺字資訊(如e).
(5)完成後,按「更新資料庫」.
(6)輸入缺字資訊須知,說明如下:
  (a)&lt;glyph xml:id="btg086033701">: 為缺字id碼。
  (b)&lt;glyphName>: 為unicode編碼。
    ●到 [http://www.unicode.org/charts/unihanrsindex.html unicode網站 ]找cjk(Decimal)之下方編碼,例如:CJK IDEOGRAPH 15181
    ●其cjk(Decimal)之編碼=&lt;mapping type="unicode">15181&lt;/mapping>
    ●若查無unicode編碼資料,請點選「Non Unicode Character」即可.
  (c)&lt;charProp>: 標記&lt;value>發音。
    ●到 [http://www.iq-t.com/SYSCOM/pingying2.asp 漢語拚音字典 ]找漢語拼語,一律小寫,第幾聲用數字表示(一聲、 聲、三聲、四聲、輕聲 = 1、2、3、4、5),不知發音者以問號表示。
    ●&lt;charProp>表示字的屬性、表達方法。比如說注音、發音。
  (d)&lt;mapping type="cbeta">: 為組字式。
    ●組字方式均由 CBETA maha 統一組字,請參閱 [http://dict.cbeta.org/word2/search.php CBETA漢字庫 ]打通用字或組字式以獲得組字式與CB碼。
  (e)&lt;mapping type="cbetaNo"> : 為cbeta的CB碼。
    ●若查無CB碼資料,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入 maha 字樣即可.再以一志為單位,統一由程式人員:小花 處理.
    ●若 CBETA maha 回覆不收錄至CBETA漢字庫時,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入&lt;不收錄至CBETA 漢字資料庫>字樣即可.
  (f)&lt;mapping type="unicode"> : 為unicode編碼。
    ●Mapping說明:&lt;mapping/>可以用另一個系統來表示這個字的方法 比如說cb碼、組字式、unicode碼。cjk與Unicode(id=decimal)的關係猶如cjk=一年甲班,Unicode=10號。
  (g)&lt;mapping type="MoEvariant"> : 為教育部異體字編碼。
    ●到 [http://dict.variants.moe.edu.tw/suo.htm 教育部異體字網頁 ]找編碼。例如:b02420-001
    ●注意:沒有Undicode的字才要登錄教育部異體字編碼。
  (h)&lt;add a note>: 為註記資訊用
    ●輸入 maha 字樣 : 申請缺字收錄至CBETA 漢字資料庫。目的:索取CB碼及組字式。
    ●maha回覆訊息後, 供註 「不收錄至CBETA漢字庫」或「這是BIG5系統字「丱」資訊用。
(5)完成後,按「更新資料庫」.
  ●●缺字給 CBETA Maha製作流程
(1)請Maha幫忙製作缺字 無CB碼、無組字式 者
(2)須製作(1)的二點資訊者,於缺字介面note註明maha
(3)小花再以note註明的maha 彙整送給maha
(4)缺字資訊的note寫法可參考缺字介面的(8)&lt;add a note>: 為註記資訊用
  ●●缺字上傳
  (1) FTP informations:
    session:fosizhi
    host name:10.10.0.49
    user name:april  
    password:m4tjp
  (2)上傳位置 
    從 Y:\Projects\fosizhi\images\gword\
    到 0:/fosizhi/public_html/gword/
  (3)從dev 到informatics 上傳時間為一週
  ●●缺字在佛寺志網頁的呈現順序?
   1.組字式
   2.字圖


 *台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
 *別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml


  處理
Q:closer後仍有文字的情況,如何標記?<br>
A:例如,於g053p247「康熙五年七月二十九日給」後,有「立碑東廊」小字。<br>
  由於「立碑東廊」不屬closer的內容,因此在closer結束後將「立碑東廊」標註為note;<br>
  為了讓文 靠右,所以又標了一個靠右對齊的p。(單獨note無法靠右)<br>
 標法:
<xml code>
<closer>康熙五年七月二十九日給</closer><note><p rend="font-size:small;text-align:right">立碑東廊</p></note></div>
</xml>


勘字標法:&lt;choice>&lt;sic>文本的字&lt;/sic>&lt;corr resp="ddbc.da">修訂後的字&lt;/corr>&lt;/choice>
===詩篇名===
     &lt;sic>:包含看似錯誤但仍照實轉錄的文本。
  詩篇名標符樣式 〈〉
     &lt;corr>:(更正)包含文本中看似錯誤並加以更正過後的文字。
  例子 一切殿宇皆頹&lt;choice>&lt;sic>圯&lt;/sic>&lt;corr resp="ddbc.da">圮&lt;/corr>&lt;/choice>剝落


===偈頌===
標法:<l>詩句<caesura/>詩句</l><br>
範例:<br>
<lg><br>
 <l>稽首觀音<caesura/>大悲之主</l><br>
 <l>我今說偈<caesura/>畧讚所以</l><br>
 <l>所以者何<caesura/>所謂三摩</l><br>
 <l>菩薩證入<caesura/>常住寶陀</l><br>
<lg/><br>


  漏字處理
  *偈頌中不使用標點符號,詩句中的分隔,以 &lt;caesura/> 標示。<br>


漏字標法:
=== 底本有黑點(•)白點 )===
1)&lt;gap extent="1" unit="chars" reason="lost"/> 例如文本中的一個漏字
有些寺志底 本中 有黑點(•)白點(。),這是 個不 標逗參考 ,但 必完全依照。標逗以文意暢達 要。<br>
2)&lt;gap extent="2" unit="chars" reason="unclear"/>(例如文 本中 的二 模糊 字)
  例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)<br>
3)&lt;gap extent="3" unit="chars" reason="illegible"/>(例如三個草書字,字跡清楚 ,但不 何字)?
  可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰 <br>
  4)&lt;gap extent="unknown" unit="chars" reason="lost"/> (漏字無法估計字數時)
  (註)extent 此指字數


==中文數字「零」==
中文數字「零」,請統一用這個「〇」(unicode編碼u+3007)<br>
Ps. 其餘「非數字」的圓圈符號,仍可用「○」。(這個○跟上面的〇不同)<br>


=== 空格===
== = 已 的處理==
文本中,常有「巳= 已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方式:<br>
在「巳=已」的條件下,一志只在第一次出現的「巳」字做特字標記及註(如下),而後出現的「巳」則直接取代為「已」。<br>
<xml>
第一次出現的「巳」字標記:
<choice><orig>巳</orig><reg resp="dila.da">已</reg>
<note resp="dila.da">書中「已」字多作「巳」,不煩標註。</note></choice>
</xml>


1)&lt;space quantity="1" unit="eng_chars"/>(一個英文半形 空格)
=format重整文件=
2)&lt;space quantity="1" unit="chi_chars"/> 文全形空格)
*執行format.py程式,可清除多餘 空格 及重整元素折行設定。<br>
  註:quantity內 填空格字數
*電腦條件:電腦中要安裝有python-3.3.0以上版本的程式<br>
 程式放置路徑:Z:\數位典藏組\python<br>
*執行步驟:<br>
1.在(TortoiseGit \bin\下開啟dos視窗<br>
2.在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter<br>
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾<br>
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)<br>
5.用main檔驗證一下,若是validation,即成。<br>
6.若想再繼續format另 部志,則繼續在dos視窗 ,重複3-6的步驟。<br>
 (小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即 。)<br>


==如何解救亂了格式的文件?==
(不小心按到Oxygen工具列的縮排按鈕時用)<br>
1.<b>先將所有自動折行的頁碼接起來</b><br>
 在亂了格式的檔案下<br>
 → Ctrl+F
 →尋找:<pb <br>
facs=<br>
 →取代為:<pb facs=<br>
 →Replace All<br>
 →Close<br>
2.<b>再將所有自動折行的lb接起來</b><br>
 在亂了格式的檔案下<br>
 →Ctrl+F<br>
 →尋找:<lb <br>
n=<br>
 →取代:<lb n=<br>
 →Replace All<br>
 →Close<br>
3.<b>吃掉所有tag間的空格</b><br>
 在亂了格式的檔案下<br>
 →Ctrl+F<br>
 →尋找:>[ \n]*<<br>
 →取代:><<br>
 →Replace All<br>
 →Close<br>
4.<b>檢查文件</b><br>
 看看還有沒有不正常的空白。<br>
5.<b>在Dos下執行git bin下的format.py</b><br>
6.在git下的output資料夾中取得檔案,看看是否可用。<br>


===印章===
= 標記問答=
  
  Q:格式問題:是否照書編排?<br>
  *印章標記 &lt;stamp>包含一個字詞,描述一個印記或是類似圖案
  數位文本不必全照書編排 <br>
  例:乾隆御覽之寶&lt;stamp>清乾隆玉璽&lt;/stamp>
 
 
 
===表格===


  *表
  Q:敬 的情況,有空一格,有另起一行。<br>
  表格標記元素 &lt;table> &lt;row> &lt;cell>
為了避免多種抬頭(挪抬、平抬、單抬 雙抬 三抬)的標記困擾,決定不遵照底本格式。<br>
  表 合併列:&lt;cell rows="列數">
  即「敬 」統一都不須空 或另起一行。<br>
  表 合併欄:&lt;cell cols="欄數">


  *例1(g089p0254)
  Q:並列的文字。<br>
&lt;table>
A:不作並列標記。可標記縮小字&lt;seg rend="font-size:small"> 。<br>
&lt;row>&lt;cell rows="2">一、約部義&lt;/cell>&lt;cell>前四時&lt;/cell>&lt;cell>筌罤&lt;/cell>&lt;/row>
&lt;row>&lt;cell>今法華&lt;/cell>&lt;cell>魚兔&lt;/cell>&lt;/row>
&lt;row>&lt;cell rows="2">二、約教義&lt;/cell>&lt;cell>前三教&lt;/cell>&lt;cell>筌罤&lt;/cell>&lt;/row>
&lt;row>&lt;cell>今圓教&lt;/cell>&lt;cell>魚兔&lt;/cell>&lt;/row>
&lt;row>&lt;cell rows="2">三、約解義&lt;/cell>&lt;cell>言說教&lt;/cell>&lt;cell>筌罤&lt;/cell>&lt;/row>
&lt;row>&lt;cell>契妙理&lt;/cell>&lt;cell>魚兔&lt;/cell>&lt;/row>
&lt;row>&lt;cell rows="2">四、約行義&lt;/cell>&lt;cell>玄句開解&lt;/cell>&lt;cell>筌罤&lt;/cell>&lt;/row>
&lt;row>&lt;cell>止觀立行&lt;/cell>&lt;cell>魚兔&lt;/cell>&lt;/row>
&lt;row>&lt;cell rows="2"> 五、約玄義&lt;/cell>&lt;cell>釋名宗用教&lt;/cell>&lt;cell>筌罤&lt;/cell>&lt;/row>
&lt;row>&lt;cell>諸部經體&lt;/cell>&lt;cell>魚兔&lt;/cell>&lt;/row>&lt;/table>


  *例2(g089p0254)
  Q:若印刷錯誤,文字內容重複時 <br>
&lt;table>
A:可用[ ] 標示 但若 跨頁 頁碼要放在note的外面 <br>
&lt;row>&lt;cell>一、漸中開四&lt;/cell>&lt;cell cols="4">如破他宗,不識教體之妨,謂法華是漸圓,華嚴是頓圓 &lt;/cell>&lt;/row>
&lt;row>&lt;cell>二、方等中四&lt;/cell>&lt;cell cols="4">四教並談曰方,四機普被曰等。&lt;/cell>&lt;/row>
&lt;row>&lt;cell rows="4">三、別教𥪡&lt;!--[ ]-->入四&lt;/cell>&lt;cell>十信&lt;/cell>&lt;cell rows="4">修&lt;/cell>&lt;cell>生滅四諦&lt;/cell>&lt;cell>藏&lt;/cell>&lt;/row>
&lt;row>&lt;cell>十住&lt;/cell>&lt;cell>修無生四諦&lt;/cell>&lt;cell>通&lt;/cell>&lt;/row>
&lt;row>&lt;cell>十行&lt;/cell>&lt;cell>修無量四諦&lt;/cell>&lt;cell>別&lt;/cell>&lt;/row>
&lt;row>&lt;cell>十向&lt;/cell>&lt;cell>修無作四諦&lt;/cell>&lt;cell>圓&lt;/cell>&lt;/row>
&lt;row>&lt;cell>四、十行橫學四&lt;/cell>&lt;cell cols="4">別教十行化他心切,橫出四四一十六門 &lt;/cell>&lt;/row>
&lt;row>&lt;cell rows="4">五、涅槃追泯四&lt;/cell>&lt;cell cols="3">生生不可說&lt;/cell>&lt;cell>藏&lt;/cell>&lt;/row>
&lt;row>&lt;cell cols="3">生不生不可說&lt;/cell>&lt;cell>通&lt;/cell>&lt;/row>
&lt;row>&lt;cell cols="3">不生生不可說&lt;/cell>&lt;cell>別&lt;/cell>&lt;/row>
&lt;row>&lt;cell cols="3">不生不生不可說&lt;/cell>&lt;cell>圓&lt;/cell>&lt;/row>
&lt;pb facs="3B008P275.jpg" n="0254"/>
&lt;row>&lt;cell>六、涅槃追說四&lt;/cell>&lt;cell cols="4"> 因緣故亦可得說,四句如前,但義同施權 卻更分別前四教也 &lt;/cell>&lt;/row>
&lt;row>&lt;cell>七、法華施出四&lt;/cell>&lt;cell cols="4">從法華實理施四時三教,權理明無量義,從一清淨道施出二三四。&lt;/cell>&lt;/row>
&lt;row>&lt;cell>八、法華開顯四&lt;/cell>&lt;cell cols="4">開四時三教,歸今法華,收多歸一也。&lt;/cell>&lt;/row>&lt;/table>


Q:文本若超出可處理的範圍,如元朝蒙語譯文。<br>
A:可不標句讀,但須於檔頭&lt;teiHeader>作說明。<br>


Q:雙關語的標記(人地混雜)<br>
A:依字面標記元素,以註解說明喻意。<br>
例1:g077p0293<br>
淳氣日凋薄,<placeName key="PL000000021567">鄒</placeName><placeName key="PL000000021513">魯</placeName><note resp="dila.da">此處「鄒魯」代指「孔孟」。鄒魯乃孔子和孟子的誕生地。</note>亡眞承。<br>


===詩偈===
例2:g017p0194<br>
笙歌日日娛<persName key="A008915">西子</persName><note resp="dila.da">此處「西子」代指「西湖」。</note>  為愛幽閒到玉岑<br>


 ● &lt;lg>&lt;l>的 注意事項
Q:oXygen xml文件中,如何取消元素的定義提示?<br>
  &lt;lg>與&lt;p>是對等地位 故巢狀結構&lt;lg> 與&lt;p>不 可互包。應結束&lt;/p> 後,再標&lt;lg>。
  oXygen xml文件中,當將鼠標停留在TEI元素上時,會自動pop up出一個解釋該元素定義的小視窗;<br>
  這個小視窗有時會遮擋到文件中正要處理 文字 造成作業的困擾。<br>
A:取消元素定義提示的設定步驟:<br>
  oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip( 要勾選)<br>


 ● 當詩詞跨頁 時, 換頁,不用顧及排版問題。
=[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97PDF%E7%89%88 佛寺志PDF版]=
1 凡例備忘<br>
2 圖檔<br>
 2.1 構想<br>
 2.2 各志景點<br>
3 佛寺志PDF版面<br>
 3.1 開本<br>
 3.2 邊界<br>
 3.3 行距<br>
 3.4 字型<br>
 3.5 字體大小<br>
4 佛寺志PDF校訂規則<br>
 4.1 目錄<br>
  4.1.1 擷取層級<br>
  4.1.2 符號樣式<br>
 4.2 內文<br>
  4.2.1 樣式符號<br>
  4.2.2 段落樣式<br>
  4.2.3 標題<br>
  4.2.4 人名<br>
  4.2.5 地名<br>
  4.2.6 間<br>
  4.2.7 特字<br>
   4.2.7.1 勘誤字(底本中的錯字)<br>
   4.2.7.2 從缺字(易辨識 卻打不出來)<br>
   4.2.7.3 罕見字(難以辨識的罕見字)<br>
   4.2.7.4 特字的註解<br>
  4.2.8 註腳<br>
  4.2.9 詩偈<br>
  4.2.10 小字<br>
  4.2.11 補字<br>
  4.2.12 印章<br>
  4.2.13  名<br>
  4.2.14 備忘<br>
 4.3 人名索引<br>
 4.4 地名索引<br>
5 討論區<br>


 ● &lt;caesura> 記韻律詩行可能被截斷的位置。
=[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%9786%E5%BF%97%E7%B2%97%E6%A8%99 佛寺志粗 ]=


 
1 電校<br>
=== 標記 問答===
2 切檔<br>
 Q:格式問 :是否照書編排?
 2.1 分檔方式<br>
 A:數位文本不必全照書編排。
 2.2 書名頁的納入<br>
  
 2.3 卷前的 標記<br>
 Q:敬格 情況,有空一 ,有另起一行。
 2.4 書名頁(出版社的)的標法<br>
 A "敬格"統一都不須空格或另起一行。
 2.5  名頁(原刻板的)的標法<br>
  
3 粗標<br>
 Q:並列的 文字
 3.1 段落標記<br>
 A 不作並列 記。可 標記 縮小字&lt;seg rend="font-size:small"> 及加括弧以區別之。
   3.2 行號問題<br>
  
 3.3 跨頁 頁碼<br>
 Q:文章中所有小字 的標 法?
 3.4 補字標記修訂 加resp屬性(2013.05.20)<br>
 A:&lt;seg rend="font-size:small">( 縮小的字 &lt;/seg>
   3.5 「取代標記,但不取代 文字 」的正規表示式語法(in oXygen)<br>
   ps. &lt;seg> 的標法, 是著重在 樣式 (小字)上的呈顯 而非「意義」上的表示
 3.6 自加標題標記修訂 加supplied元素(2013.05.20)<br>
  
 3.7 隱藏的自加 標記 修訂<br>
 Q:若 刷錯誤,文字內容重複時。
   3.8 地名標題下 詩偈,不用 <head>( 標<p>及<lg> <br>
 A:可用[註] 示。
 3.9 詞 上下闕 <br>
 例:&lt;note resp="ddbc.da">此段重複「文本重複 的文字 」&lt;/note>
 3.10 法語中 如有 上堂 法語 可分段 <br>
   但若 跨頁 頁碼要放在note 外面。
   3.11 尾註的標法<br>
  
 3.12  章的 法、位置<br>
 Q:文本若超出 處理 範圍 如元朝蒙語譯文。
 3.13 圖內 的文字<br>
 A: 可不標 句讀,但須於檔頭&lt;teiHeader> 作說明。
4 特字處理<br>
  
5 特殊問題<br>
 Q:
 5.1 稿本 大量塗改的情形 如何標記?<br>
 A:
 5.2 新訂標題的原則<br>
 5.3 作者位置經標記人員移動時 註解說明<br>
   5.4 以程式標記詩偈<br>
 5.5 「全段縮排」 取代「小字」<br>
 5.6 長行裡 詩偈 目前 不標 詩行<br>
   5.7 不縮排的詩行<br>
 5.8 錯位移正後要處理行號嗎?<br>
 5.9 xml文件中的「&」<br>
6 標點符號問題<br>

於 2021年4月27日 (二) 09:56 的最新修訂

回《中國佛寺史志》數位典藏工作手冊 Archive of Buddhist Temple Gazetteers(Service manual)

《中國佛寺志》標記作業
另可參考:遵循 TEI 的佛學數位化 XML 標記

工作準備

1. 參考資料:
   進行寺志標記前,應先找好該志的相關參考資料,例如:白話本、點校本等。

2. 檔案管理:
本專案檔案倉儲於GitLab雲端協作平台,以git軟體做版本管理。
目前檔案資料夾分為三部份:
 1)xml(已完成細標的檔案。細標是指有人名、地名、時間的標記)
 2)xml-basic-g(明丹本)
 3)xml-basic-y(廣陵本)
  
3. 作業軟體oXygen(19版)的環境設定
 1) 設定字型及字體大小:Options→Preferences→Appearance→Fonts→右欄Editor→choose
 2) 設定折行:Options→Preferences→Editor→Edit modes→Text→右欄Line wrap(此項打勾)
 3) 設定不自動縮排:Options→Preferences→Format→XML→右欄Indent(最後兩項不打勾,即打字時不自動縮排、貼上時不自動縮排)
 4) 呼叫結構樹 outline:window→Show View→outline
   (結構樹可固定於文件左側,需要時點擊其縮圖按鈕即可呈現目錄結構;點擊目錄樹視窗上的「圖釘」按鈕即可固定或收起。)

4. 作業技巧:凡具規則性、大量性之機械式作業,應尋求以程式批次處理,避免人工重複作業。

5. TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。  
  「意義標記」著重在付予文字意義,例如:persName(人名),p(段落)。
  「樣式標記」著重在樣貌的呈現,即編輯樣式,例如:lb(折行),p rend=""(段落格式)。
    本專案標記側重於「意義標記」,而版面樣貌的呈現則大多操縱於XSLT。

檔案架構

 《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。
 (例:重修普陀山志,代碼g008)

 每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
 及數個分檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。

 主檔內含有版本資訊(teiHeader)、掃描圖資訊(tei:facsimile)及分檔的鍊結(text xi:include)。
 分檔內則是各卷的內容。

●切檔命名規則
志碼_front:卷前(如:出版社的書名頁、出版社的版本說明、木刻版的題名頁等)
志碼_00:卷首(題名頁之後的內容,如:序文、目錄、山圖等)
志碼_01:卷一
志碼_02:卷二(以下依卷次類推)
志碼_back:附錄、補編等
志碼_back1:附錄、補編有多卷時,可加序號。例如附編卷一
志碼_back2:附錄、補編有多卷時,可加序號。例如附編卷二


●特殊例子的切檔
例:
g087有六個卷一,兩個卷三。故分檔如下,供參考(由於每志卷情不盡相同,可視當志卷題情勢做適當的調整)。
g087_01-1,g087_01-2,g087_01-3,g087_01-4 ,g087_01-5 ,g087_01-6
g087_03-1,g087_03-2

加facs碼

1.執行git中的facs.py程式,為內文中的pb加上facs
 例:原<pb n="0041"/>
   執行程式後變成<pb facs="1B017P108.jpg" n="0041"/>

2.請網路工程師(阿賢)為main檔加facsimile
 將加好pb facs的檔案,連同main檔,一併交給工程師。工程師會在main檔加入如下的標記:
<xml code>

 <tei:facsimile xmlns:tei="http://www.tei-c.org/ns/1.0">
 <tei:graphic url="1B017P108.jpg"/>
 <tei:graphic url="1B017P109.jpg"/>

 ......  ...... </xml>

注意事項:卷內的pb facs要與main中的facsimile url同步
各卷內的頁碼有時會有錯誤,當修改pb facs碼時,請順便也要一併修改main中的facsimile url,這樣文件才會完整。
例:y141_00 <pb facs="4B100P005.jpg" n="0001"/>
  Y141_main <tei:graphic url="4B100P005.jpg"/>

文件宣告

1各卷文件宣告列,請一致用:
<?xml version="1.0" encoding="UTF-8"?>(雙引號,大寫UTF)

2缺字在檔頭宣告,其流程:
<xml code> 1)開啟main檔 2)在</fileDesc>之後加上以下的群組標記 <encodingDesc>

 <charDecl>
   <char xml:id="Z0001"> 
     <charName>DILA CHARACTER Z0001</charName>
     <charProp>
       <localName>CBETA</localName> (若無可省略)
       <value>CB30005</value>
     </charProp>
     <charProp>
       <localName>composition</localName> 
       <value>[宀/廣]</value>
     </charProp>
   </char>
 </charDecl>

</encodingDesc> 3)在當志中,用「<g ref="#」搜尋出所有缺字。 4)逐一將缺字碼放在「DILA 難檢字庫」中檢索,將缺字資料填補入缺字宣告中。 (從缺的項目可省略)

例:g069_main </fileDesc> <encodingDesc>

 <charDecl>
   <char xml:id="Z0393">
     <charName>DILA CHARACTER Z0393</charName>
     <charProp>
       <localName>composition</localName>
       <value>[山*克]</value>
     </charProp>
   </char>
   <char xml:id="Z0523">
     <charName>DILA CHARACTER Z0523</charName>
     <charProp>
       <localName>composition</localName>
       <value>[風*丘]</value>
     </charProp>
   </char>
   <char xml:id="Z0522">
     <charName>DILA CHARACTER Z0522</charName>
     <charProp>
       <localName>composition</localName>
       <value>[山*右]</value>
     </charProp>
   </char>
 </charDecl>

</encodingDesc> </teiHeader> </xml>

段落形式

標題

1標題的標法
● <head>標題</head>
● <head>標題</head><byline><persName>作者</persName></byline>
● <head>標題<seg rend="font-size:small">副標題</seg></head>
● 標題小字不折行(程式預設):<seg rend="font-size:small">標題中的縮小字</seg>
● 標題小字要折行:<seg rend="font-size:small;display:block">縮小的字</seg>
● 標題中含作者名時的標法 標題=作者:題名(作者名後加冒號)例:g080 p.0407洪昇:登挂月峰寄朱竹垞檢討詩

2自訂標題
 1.全自加
  <head><supplied resp="dila.da">自訂標題</supplied></head>
  例:〔劉仁本題跋〕
 2.半自加
  <head>原標題<supplied resp="dila.da">自訂標題</supplied></head>
  例:雞足山志序〔二〕
 3.隱藏自加的標題
  <head rend="display:none"><supplied resp="dila.da">自訂標題</supplied></head>
  例:志名頁
  ps. rend="display:none" 隱藏元素格式(不留白)
    rend="visibility:hidden" 保留元素格式(留白)

3說明
(1)若基於結構的需要,文章缺乏標題者,可「另訂標題」。
  另訂的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。

段落句首折作標題與否示例(以g074雲居山志 為例)
(一)直接折作標題
     原則:凡段落句首不屬於內文首句文法成份的,則可直接折用作標題。同一卷中,各段落折用的情況不統一亦無妨,以實義為判。
 
     範例1:p68 自寳禪師 上堂。總恁麽風恬浪靜,那裏得來---
           標題:自寳禪師
           內文:上堂。總恁麽風恬浪靜,那裏得來---

     範例2:p72 宗杲大慧禪師 時圜悟詔住雲居,師往省覲---
           標題:宗杲大慧禪師
           內文:時圜悟詔住雲居,師往省覲---

     範例3:p82 晦山顯禪師  師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---
           標題:晦山顯禪師
           內文:師在廬山歸宗寺受請,辛卯十二月廿一甲子進院---

     範例4:p105 復合神鐘  寺有巨鐘,明中葉院圮---
           標題:復合神鐘
           內文:寺有巨鐘,明中葉院圮---
 
(二)依句頭另作標題[ ]
     原則:若段落首句的文法成份是屬於「主詞」或「前置受詞」的,則應留作內文句頭,而另訂標題。

     範例1:p65 道齊禪師 本州金氏子,徧歷禪會---
           標題:[道齊禪師]
           內文:道齊禪師(主詞),本州金氏子,徧歷禪會---

     範例2:p70 克勤佛果禪師 建炎丁未歲十一月初六日,奉敕住雲居---
           標題:[克勤佛果禪師]
           內文:克勤佛果禪師(主詞),建炎丁未歲十一月初六日,奉敕住雲居---

     範例3:p85 燕雷鵬禪師 辛丑秋四祖老和尚命住雲居---
           標題:[燕雷鵬禪師]
           內文:燕雷鵬禪師(前置受詞),辛丑秋四祖老和尚命住雲居---

     範例4:p103 佛印禪師 周茂叔謁見,問曰---
           標題:[佛印禪師]
           內文:佛印禪師(前置受詞),周茂叔謁見,問曰---

     範例5:p106 寺左三塔 沉埋土中多年---
           標題:[寺左三塔]
           內文:寺左三塔(主詞)沉埋土中多年---

○結語:沒有所謂絕對的標準,提供例句參考,可望拉近彼此的差距。

(2)標題後的副標題,可以<seg>(隨機分割)標記之。
.例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
.<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。

(3)若底本格式為「作者在標題之前」,且編輯分類是以「作者」為主時,則作者亦可作標題。
例:g028p458 厲鶚

4長詩題的另訂 關於長詩題的另訂,顧問老師自訂一個「30字的參考值」。即約超過30字,就另訂標題;不到30字,就不另訂。30個字,是經驗上的拿捏,也是方便工作的設計,沒有絕對的理由。

5標點符號
(1)標題亦可加新式標點符號,惟結尾不用句點。

段落樣式

樣式語法

◎全段縮小字
 <p rend="font-size:small">全段縮小字</p>
 範例:g009p0427

◎全段縮排一個字
 <p rend="margin-top:1ex;text-indent:0">縮排的段落</p>
 範例:g009p0593

◎全段縮排一個字,但第一行凸排一個字
 <p rend="text-indent:-1ex;margin-top:1ex">全段縮排、第一行凸排的段落</p>
 範例:g009p0023
 ps.底本若有條列式段落符號,以符號「―」表示,而不用「一」。

◎第一行不縮排。(通常用在詩文夾雜的長行段落)
 <p rend="text-indent:0">詩偈後接續的長行<p>
 範例:g062p0104

◎靠右對齊
 <p rend="text-align:right">

◎全段並排小字,有時可以調整為大字
 例:g079 p.004崇眞萬壽宮

序、跋、按語之格式

1. 小序、小引
  1)「詩」(詩行)前小序、小引,做一般段落,並依底本之大小字體編輯之。
   例:g023卷六p371(雲林看雨圖題句小引)
  2)「文」(長行)前小序、小引,全段縮排3格。
   例:g033卷四p302(國朝太傅金之俊:再遊西天目記 有小引)

2. 跋、識(獨立的段落)
  1)跋文本身無標題:全段縮排3格。
    例1:g016p362( - - - 慧荃跋closer)
    例2:g023p363( - - - 魏成憲并識)

  2)跋文本身有標題(或添加標題):作一般段落,不縮排。
    例1:g028p445(--- 大掄敬識)
    例2:g016p1374(李流芳題跋)

3. 按語(獨立的段落)
  全段縮排3格,並依底本之大小字體編輯之。
  例1:g016p378按寺舊志云觀松在香積......
  例2:y105p54按范浦之水來自五雲諸山......

  [註] 在不影響版面之識別效果下,上開底本之小字體可以改大。

  ps.以上規則僅是個大原則,若遇有特殊情況,得依當志之特性而做適切之調整。

表格

表格的標記元素:
 <table>:以表格形式呈現、包含在直行橫列中的文字內容
 <row>:包含表格中的一列
 <cell>:包含表格中的一個儲存格
 <cell rows="列數">:表格合併列
 <cell cols="欄數">:表格合併欄
 實例:請參見中國佛寺志 g089p0254

詩詞歌賦偈

元素

  • <lg>(行組, Line Group)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
  • <l>(詩行)包含詩文的一行,也許是不完整的詩行。
  • <caesura/> 標記韻律詩行可能被截斷的位置。

範例

詩文的呈現方式有二:1.作詩行。2.做長行。

1. 詩行格式通常不用標點,同行兩句間標<caesure/>,如g007p.887。

 <p>別峰印禪師嘉州李氏得法於華藏民禪師首在鄉連主數剎後再出峽住保寧金山雪竇
及至兹山彌浹孝宗召對選德殿稱旨此日賜肩輿於東華門內上註圎覺經遣使馳賜命作序
師具表奏謝仍進頌曰:
<lg><l>古佛與今佛<caesura/>同一廣長舌</l>
  <l>於無途轍中<caesura/>為物啟途轍</l>
  <l>撥開千嶂雲<caesura/>放出一輪月</l>
  <l>普令大地人<caesura/>言下悉照徹</l>
  <l>覺亦無可圎<caesura/>幻亦無可滅</l>
  <l>只此無亦無<caesura/>紅爐一點雪</l>
  <l>稽首佛與佛<caesura/>字字無異說</l></lg>
既經乙夜之覽皇情大悅</p>
※p內可包lg(已可通過validate驗證)

2. 文章中夾有詩文,若做詩行格式,則不用引號。若必須用,則改用長行,並加標點,如g038p.174。

<p>張萊《三山志》:「守戒住金山,行高而能文詞。高廟駐蹕於北顧鳳凰池,
獻詩曰:賊寇臨京口,王師出海邊。四方喧動地,萬姓共瞻天。
笳鼓驚棲雁,旌旗耀戰船。生禽五千士,齊唱凱歌旋。」</p>

標點

按語的標點規則:
1. 作「據查」解
 g049編按:産西門寨石之「鞏州」,爲今甘肅之隴西縣 。
 g049按:華嚴寺,馮守誦《華嚴經》,感玉女饋餐......
 g049謹按:師,生於上川 。

2. 作「依據」解
 g49按《莊子》,瞿君字鵲子。
 g049按大師此語,凡在峨眉遊居者,皆當......
 g049按《益部方物略》:「海棠,有數種。
 g077按志中,前代諸鉅公經此境者,其唯......

3. 作「依照 、查看」解
 g049按新圖,稽舊聞,亦數月而竣事。
 g049故只按舊志及諸經傳而爲證訂。
 g077按之九華碑版亦然。

詩偈的小字

1.詩偈中,解釋上句(或同行)的註解性質的小字,可標<seg rend="font-size:small">。
2.詩偈中,解釋全首的註解性質的小字,可標<note rend="font-size:small">(放在</l>後面、</lg>前面)
 (由於css語法的關係,在頁面呈現上,note會自動折行,無法與<l></l>同行。
  TEI語法的規則,seg無法標在<l></l>外面。)
3.詩偈中,總釋前幾首詩的註解性質的小字,可標<p><note rend="font-size:small"></note></p>。

注意事項

  1. <lg>與<p>是平行的結構,故<lg>與<p>不可互包。應結束</p>後,再標<lg>。
  2. 當詩詞跨頁時,照書換頁,不用顧及排版問題。
  3. 詩偈不用標逗,詩句中間的間隔,以<caesura/>標示。

一頁多欄

 例如:g003p0273

標記元素

1 頁碼
2 人名
 2.1 人名規範資料的建置
 2.2 人名標記標法
 2.3 人名標記凡例
 2.4 人名規範資料建檔注意事項
 2.5 人名標記規則
3 地名
 3.1 地名規範資料的建置
 3.2 地名標記
 3.3 地名標記凡例
 3.4 地名規範資料建檔注意事項
 3.5 地名標記規則
 3.6 地名問答
4 時間
 4.1 時間規範資料的查詢
 4.2 時間標記
 4.3 時間標記凡例
 4.4 時間規範資料建檔注意事項
 4.5 時間標記規則
 4.6 民國年
  4.6.1 時間為民國年的注意事項
  4.6.2 時間為民國年的查法
  4.6.3 時間屬性的變更(2011.01.20)
  4.6.4 時間問答
 4.7 知識備忘
 4.8 朝代code
5 代名詞
 5.1 標法
 5.2 標記時機
6 註解(底本本身)
7 註解(dila.da)
8 空格
9 訛字處理
10 漏字處理
 10.1 缺漏字
 10.2 補字
11 重複字
12 底本本身的刪塗、訂正字
13 印章
14 上標字及頁註
 14.1 上標字
 14.2 頁註
15 圖檔
 15.1 圖檔標記
 15.2 特殊圖表製圖流程(Odg轉svg)
16 標籤label

字元層次

佛寺志專案 特字處理

1 作業環境
2 特字處理方式及工具
3 特字處理原則
3.1 有 unicode 編碼的字
 3.1.1 易於辨識
 3.1.2 不易辨識
3.2 無 unicode 編碼的字
 3.2.1 易於辨識
 3.2.2 不易辨識, 有通用字
 3.2.3 不易辨識, 無通用字
4 特字處理新規則
5 如何統一各志間特字處理方式
6 難檢字庫缺字建檔
7 難檢字庫缺字圖檔製作
 7.1 原則
 7.2 製圖步驟
8 缺字呈現
9 unicode 編碼字
 9.1 CJK漢字編碼範圍
 9.2 編輯器
 9.3 快速尋找unicode的方法
10 有助於增加特字處理效率的工具與方法
11 SVG造字
 11.1 參閱
 11.2 安裝
 11.3 inkscape造字操作法
 11.4 illustrator造字操作法
 11.5 參考範例
12 參考資源

標逗

書名

1.書名的標符樣式:《》
2.書名中的人名、地名不標記。若書名中的人名具重要性或特殊意義,可於書名後,以<note>的方式註記之。

結尾署語

Q:結尾署語<closer>中的文字是否標逗?
A:原則上開放標點,適度添加,方便閱讀。但結束可不加句號。

例如:
元祐三年八月二十有八日朝散大夫提舉洞霄宮上護軍吳興縣開國男食邑三百戶賜紫金魚袋章衡記

加上標逗:
元祐三年八月二十有八日,朝散大夫.提舉洞霄宮.上護軍.吳興縣開國男.食邑三百戶.賜紫金魚袋章衡記


Q:closer後仍有文字的情況,如何標記?
A:例如,於g053p247「康熙五年七月二十九日給」後,有「立碑東廊」小字。
由於「立碑東廊」不屬closer的內容,因此在closer結束後將「立碑東廊」標註為note;
為了讓文字靠右,所以又標了一個靠右對齊的p。(單獨note無法靠右)
 標法: <xml code>

<closer>康熙五年七月二十九日給</closer><note>

立碑東廊

</note>

</xml>

詩篇名

詩篇名標符樣式:〈〉

偈頌

標法:<l>詩句<caesura/>詩句</l>
範例:
<lg>
 <l>稽首觀音<caesura/>大悲之主</l>
 <l>我今說偈<caesura/>畧讚所以</l>
 <l>所以者何<caesura/>所謂三摩</l>
 <l>菩薩證入<caesura/>常住寶陀</l>
<lg/>

*偈頌中不使用標點符號,詩句中的分隔,以 <caesura/> 標示。

底本有黑點(•)白點(。)

有些寺志底本中有黑點(•)白點(。),這是個不錯的標逗參考,但可不必完全依照。標逗以文意暢達為要。
例:江西彭澤許止淨•高慕淨•二居士•《禮觀世音菩薩疏》文曰。(g009_11_p589)
  可改為:江西彭澤許止淨、高慕淨二居士,《禮觀世音菩薩疏》文曰:

中文數字「零」

中文數字「零」,請統一用這個「〇」(unicode編碼u+3007)
Ps. 其餘「非數字」的圓圈符號,仍可用「○」。(這個○跟上面的〇不同)

巳=已 的處理

文本中,常有「巳=已」的現象。這在古文本中很普遍,若一一處理則顯繁雜。我們的處理方式:
在「巳=已」的條件下,一志只在第一次出現的「巳」字做特字標記及註(如下),而後出現的「巳」則直接取代為「已」。
<xml> 第一次出現的「巳」字標記: <choice><orig>巳</orig><reg resp="dila.da">已</reg> <note resp="dila.da">書中「已」字多作「巳」,不煩標註。</note></choice> </xml>

format重整文件

*執行format.py程式,可清除多餘空格及重整元素折行設定。
*電腦條件:電腦中要安裝有python-3.3.0以上版本的程式
 程式放置路徑:Z:\數位典藏組\python
*執行步驟:
1.在(TortoiseGit)\bin\下開啟dos視窗
2.在bin\後游標閃動處,打上format.py g0xx(要執行的志碼),然後按Enter
3.在(TortoiseGit)\output\xml內,即可看到轉好的g0xx資料夾
4.取用output\xml內的g0xx(main保留舊的,不要覆蓋)
5.用main檔驗證一下,若是validation,即成。
6.若想再繼續format另一部志,則繼續在dos視窗中,重複3-6的步驟。
 (小竅訣:在dos視窗閃動的游標處按↑鍵,即可喚出前一執行命令,修改志碼即可。)

如何解救亂了格式的文件?

(不小心按到Oxygen工具列的縮排按鈕時用)
1.先將所有自動折行的頁碼接起來
 在亂了格式的檔案下
 → Ctrl+F  →尋找:<pb
facs=
 →取代為:<pb facs=
 →Replace All
 →Close
2.再將所有自動折行的lb接起來
 在亂了格式的檔案下
 →Ctrl+F
 →尋找:<lb
n=
 →取代:<lb n=
 →Replace All
 →Close
3.吃掉所有tag間的空格
 在亂了格式的檔案下
 →Ctrl+F
 →尋找:>[ \n]*<
 →取代:><
 →Replace All
 →Close
4.檢查文件
 看看還有沒有不正常的空白。
5.在Dos下執行git bin下的format.py
6.在git下的output資料夾中取得檔案,看看是否可用。

標記問答

Q:格式問題:是否照書編排?
A:數位文本不必全照書編排。

Q:敬格的情況,有空一格,有另起一行。
A:為了避免多種抬頭(挪抬、平抬、單抬、雙抬、三抬)的標記困擾,決定不遵照底本格式。
  即「敬格」統一都不須空格或另起一行。

Q:並列的文字。
A:不作並列標記。可標記縮小字<seg rend="font-size:small">。

Q:若印刷錯誤,文字內容重複時。
A:可用[註]標示。但若有跨頁,頁碼要放在note的外面。

Q:文本若超出可處理的範圍,如元朝蒙語譯文。
A:可不標句讀,但須於檔頭<teiHeader>作說明。

Q:雙關語的標記(人地混雜)
A:依字面標記元素,以註解說明喻意。
例1:g077p0293
淳氣日凋薄,<placeName key="PL000000021567">鄒</placeName><placeName key="PL000000021513">魯</placeName><note resp="dila.da">此處「鄒魯」代指「孔孟」。鄒魯乃孔子和孟子的誕生地。</note>亡眞承。

例2:g017p0194
笙歌日日娛<persName key="A008915">西子</persName><note resp="dila.da">此處「西子」代指「西湖」。</note>  為愛幽閒到玉岑

Q:oXygen xml文件中,如何取消元素的定義提示?
  oXygen xml文件中,當將鼠標停留在TEI元素上時,會自動pop up出一個解釋該元素定義的小視窗;
  這個小視窗有時會遮擋到文件中正要處理的文字,造成作業的困擾。
A:取消元素定義提示的設定步驟:
  oXygen→Option→Perferences→Editor→Content Completion→Annotations→Show annotations in tooltip(不要勾選)

佛寺志PDF版

1 凡例備忘
2 圖檔
 2.1 構想
 2.2 各志景點
3 佛寺志PDF版面
 3.1 開本
 3.2 邊界
 3.3 行距
 3.4 字型
 3.5 字體大小
4 佛寺志PDF校訂規則
 4.1 目錄
  4.1.1 擷取層級
  4.1.2 符號樣式
 4.2 內文
  4.2.1 樣式符號
  4.2.2 段落樣式
  4.2.3 標題
  4.2.4 人名
  4.2.5 地名
  4.2.6 時間
  4.2.7 特字
   4.2.7.1 勘誤字(底本中的錯字)
   4.2.7.2 從缺字(易辨識,卻打不出來)
   4.2.7.3 罕見字(難以辨識的罕見字)
   4.2.7.4 特字的註解
  4.2.8 註腳
  4.2.9 詩偈
  4.2.10 小字
  4.2.11 補字
  4.2.12 印章
  4.2.13 書名
  4.2.14 備忘
 4.3 人名索引
 4.4 地名索引
5 討論區

佛寺志粗標

1 電校
2 切檔
 2.1 分檔方式
 2.2 書名頁的納入
 2.3 卷前的標記
 2.4 書名頁(出版社的)的標法
 2.5 題名頁(原刻板的)的標法
3 粗標
 3.1 段落標記
 3.2 行號問題
 3.3 跨頁的表格頁碼
 3.4 補字標記修訂:加resp屬性(2013.05.20)
 3.5 「取代標記,但不取代文字」的正規表示式語法(in oXygen)
 3.6 自加標題標記修訂:加supplied元素(2013.05.20)
 3.7 隱藏的自加標題標記修訂

 3.8 地名標題下的詩偈,不用標<head>(標

及<lg>)
 3.9 詞的上下闕標記法
 3.10 法語中,如有「上堂」法語,可分段。
 3.11 尾註的標法
 3.12 印章的標法、位置
 3.13 圖內的文字
4 特字處理
5 特殊問題
 5.1 稿本有大量塗改的情形,如何標記?
 5.2 新訂標題的原則
 5.3 作者位置經標記人員移動時的註解說明
 5.4 以程式標記詩偈
 5.5 「全段縮排」可取代「小字」
 5.6 長行裡的詩偈,目前可暫不標詩行
 5.7 不縮排的詩行
 5.8 錯位移正後要處理行號嗎?
 5.9 xml文件中的「&」
6 標點符號問題