「名山古剎-《中國佛寺史志》數位典藏」:修訂間差異

出自DILA Wiki
imported>Miaomiao
imported>Jiayu.xu
無編輯摘要
 
(未顯示由 9 位使用者於中間所作的 712 次修訂)
行 1: 行 1:
==[http://dev.ddbc.edu.tw/fosizhi/ui.html 《中國佛寺史志》數位典藏工作手冊]==
 《中國佛寺史志》數位典藏工作手冊<br/>
Service manual:Archive of Buddhist Temple Gazetteers
Archive of Buddhist Temple Gazetteers (Service manual)


===簡介及目 的===
==簡介及目 ==
  
  一、簡介:<br>
  在中國佛教史料中, 佛寺志是一種獨特而重要的文獻, 它也是地方志或地方性歷史文獻之一。 其主要內容 在於 :佛寺歷史沿革 建設, 高僧 傳記 詩偈, 法脈傳承 感應事跡等 ,亦 兼及佛 寺所 在地 地理、人文、風俗的記載 及地圖、建物圖、人像等。通常是由對區域、城市及寺院研究有興趣的學者所編寫 因此此類文獻乃收集 種文 編輯而成。本專案的研究目的 除將佛寺志的 珍貴 史料數位典藏 流傳 並將進行相關 佛寺 志的書目研究和標 作業 ,使 之成為研究中國 佛教 歷史不可或缺 數位文獻 。適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助, 執行期間從2008年1月至2010年12月。
     佛寺志是一種獨特而重要的文獻,其主要內容 :佛寺歷史沿革 、高僧 行誼 、語 錄、 法脈傳承 感應事跡 、碑記詩賦藝文 。20世紀 兩大套木刻版 志叢書印刷,此二套叢書 佛寺志 或為手抄本 或為 國圖書館唯一藏 本, 世所罕傳,彌足 珍貴, 被譽 「續大藏未竟 偉業 教史料之遺珍,集 院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻 載之不足 ,使 漢傳 佛教 在時間、空間與內容 研究資源上更加完備 <br>
  有關 佛寺志 的收集 ,主 要來源為20世紀所印刷的兩套木刻版
   適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助, 自2008年起開始著手以下二套叢書之數位化工作:<br>
    1.《中國 佛寺 史志彙刊》(110冊;100 ):台北.明文出版社、丹青圖書公司,1980-1994 杜潔祥 編<br>
  2.《中國佛寺志叢刊》(130冊;197志) 揚州.廣陵書社,2006,張智、白化文等主編<br>


   *Zhongguo Fosi Shizhi Huikan 《中國佛 彙刊》
  二、目標:<br>
   Taipei, 1980-1985. Compiled by Du Jiexiang 杜潔祥. 110vols
  本專案的數位化目標,乃欲將200多座 寺志 建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老 寺志 的新版本,運用科技得以長遠保存,而有助於佛法的弘化。<br>
   *Zhongguo fosizhi congkan 《中國佛 寺志 叢刊》
   Hangzhou: Guangling shushe 廣陵書社 2006. Compiled by Zhang Zhi 張智.130 vols.


本專案預計於2010年之前,將完成超過200座寺志的數位化作業,並公開圖檔資料提供大眾免費使用,其中,至少有12座寺志將提供加上 物、時間與地點標記的數位化全文,同時,在本專案中所識別的人物、時間與地點之資料,將與其他專案的相同資料一併整合至本校「[http://authority.ddbc.edu.tw/ 佛學規範資料庫Buddhist Authority Database]」之中。除此之外,本專案至2011年之前,將完成相關佛寺志書目研究和標記作業,以提升本典藏之應用價值。
==進程及 力==


===預算 及人 力===
進程:<br>
第一階段(97年~99年):<br>
 1. 建置二套叢書後設資料庫(metadata)。<br>
 2. 設立DILA中國佛寺志網頁(開發版和推廣版)。<br>
 3. 二套叢書完整掃描,提供網頁瀏覽、下載。<br>
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀, 相關 名、地名資料連結。<br>


  預算 :<br>
  第二階段(100年~101年) :<br>
  此專案預計 執行 年度為97~99,共計3年,由 中華佛 學研究所贊助 。<br>
   1.  執行 出版「 中華佛 寺志叢書」計畫 (12部寺志,共15冊)<br>
  第一年經費NT$57,000<br>
   2. 複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇。<br>
  第二年經費NT$1,094,942<br>
第三年經費NT$1,024,380


  人力 :<br>
  第三階段(102年) :<br>
  程式設計 1人<br>
   進行明丹本85部寺志之初階 標記 <br>
時程控管 1人<br>
目錄及經緯度建立 1人<br>
標記 人員 3人<br>
後設資料建置人員 1人<br>
義工 1人


===執行單位:法鼓佛教學院數位典藏組===
  第四階段(103年~104年) :<br>
  負責人 馬德偉 Marcus Bingenheimer<br>
    行廣陵本124部寺 之初階 標記 <br>
 進 度及預算控管:柯春玉<br>
程式及介面撰寫:花金地、李 賢、周邦信<br>
標記 :林智妙、林綉麗、王秀雯、游美燕、彭川芩、何易儒、釋道厚、張聖豔<br>
權威資料庫:闕慧貞、葛賢敏


==各 特色==
第五階段(105年~108年):<br>
1九華山
 進行明丹本寺 之點校,以製成更便利後人閱讀的版本。<br>
   [http://wiki.ddbc.edu.tw/pages/%E4%B9%9D%E8%8F%AF%E5%B1%B1%E5%BF%97]
 1. 105年:點校18部寺志,約120萬字。<br>
   2. 106年:點校4部寺 ,約60萬字。<br>
   3. 107年:點校12部寺志,約71萬5千字。<br>
 4. 108年:點校9部寺志,約60萬字。<br>


2. 天台山方外志(1~3)
人力:<br>
[http://wiki.ddbc.edu.tw/pages/%E5%A4%A9%E5%8F%B0%E5%B1%B1%E6%96%B9%E5%A4%96%E5%BF%97]
 時程控管 1人<br>
 程式設計 2 人<br>
   標記人員 3人<br>
 後設資料建置人員 1 人<br>
 義工 1人<br>


3. 玉岑山慧因高麗華嚴教寺志
== 執行單位==
[http://wiki.ddbc.edu.tw/pages/%E7%8E%89%E5%B2%91%E5%B1%B1%E6%85%A7%E5%9B%A0%E9%AB%98%E9%BA%97%E8%8F%AF%E5%9A%B4%E6%95%99%E5%AF%BA%E5%BF%97]
  執行單位: 法鼓佛 數位典 藏組<br>
 
  主持人:Marcus Bingenheimer 馬德偉 士(97 ~102 )、洪振洲博士(102 ~108 )<br>
4. 明州阿育王山志.續志
 時 程及預算控 管: 柯春玉(97年~102年 )、 林智妙(103年~108年 )<br>
[http://wiki.ddbc.edu.tw/pages/%E6%98%8E%E5%B7%9E%E9%98%BF%E8%82%B2%E7%8E%8B%E5%B1%B1%E5%BF%97%E7%BA%8C%E5%BF%97]
 程式 及介面撰寫:花金地 李志賢 周邦信<br>
 
 標記 技術人員:林智妙、林綉麗 王秀雯 游美燕 何易儒 詹麗春<br>
5. 泉州開元寺志
  新式 人員 :蔡謀芳、張革丰<br>
[http://wiki.ddbc.edu.tw/pages/%E9%96%8B%E5%85%83%E5%AF%BA%E5%BF%97]
 佛 學規範 資料 庫維護 人員: 闕慧貞 葛賢敏<br>
 
6. 重修普陀山志
[http://wiki.ddbc.edu.tw/pages/%E9%87%8D%E4%BF%AE%E6%99%AE%E9%99%80%E5%B1%B1%E5%BF%97]
 
7. 峨嵋山志
[http://wiki.ddbc.edu.tw/pages/%E5%B3%A8%E5%B5%8B%E5%B1%B1%E5%BF%97]
 
8. 清涼山志
[http://wiki.ddbc.edu.tw/pages/%E6%B8%85%E6%B6%BC%E5%B1%B1%E5%BF%97]
 
9. 寒山寺志
[http://wiki.ddbc.edu.tw/pages/%E5%AF%92%E5%B1%B1%E5%AF%BA%E5%BF%97]
 
10. 普陀洛迦新志(1~2)
[http://wiki.ddbc.edu.tw/pages/%E6%99%AE%E9%99%80%E6%B4%9B%E8%BF%A6%E6%96%B0%E5%BF%97]
 
11. 黃檗山志
[http://wiki.ddbc.edu.tw/pages/%E9%BB%83%E6%AA%97%E5%B1%B1%E5%BF%97]
 
12. 雞足山志(1~2)
[http://wiki.ddbc.edu.tw/pages/%E9%9B%9E%E8%B6%B3%E5%B1%B1%E5%BF%97]
 
== 工具==
 
===使用工具===
  佛寺志工作網頁
 * 中國佛寺志(法鼓內部) http://dev.ddbc.edu.tw/fosizhi/ui.html
 * 中國佛寺志首頁( 法鼓) http://dev.ddbc.edu.tw/fosizhi/
 * 中國佛寺志首頁(逢甲) http://buddhistinformatics.ddbc.edu.tw/fosizhi/
 * 佛寺志檔案上傳 http://dev.ddbc.edu.tw/fosizhi/upload/index.php
 * 佛寺志節點更新 http://dev.ddbc.edu.tw/fosizhi/exeQuery.php?getTreeJson=yes
 * 佛寺志缺字資料庫 http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq
 * 佛寺志掃描圖檔 http://buddhistinformatics.ddbc.edu.tw/fosizhi/jpegs/ 
 * 普陀山志目錄比對 http://dev.ddbc.edu.tw/putuoshan/admin/
 
規範資料庫
 * 規範資料庫首頁(逢甲)  http://authority.ddbc.edu.tw/
 * 規範資料庫首頁(法鼓)  http://dev.ddbc.edu.tw/authority/
 * 人名規範資料庫(法鼓)  http://dev.ddbc.edu.tw/authority/person/
 * 地名規範資料庫(法鼓)  http://dev.ddbc.edu.tw/authority/place/
 * 時間規範資料庫(法鼓)  http://dev.ddbc.edu.tw/authority/time/
 * 法鼓愛搜尋 http://isearch.ddbc.edu.tw/
 
工作手冊
 * [http://blazer.org.tw/wiki/index.php/%E6%9C%9F%E5%88%8A/Wiki%E6%96%B0%E6%89%8B%E5%AF%AB%E4%BD%9C%E6%8C%87%E5%8D%97%E2%85%A0%EF%BC%88%E4%B8%8A%EF%BC%89 Wiki新手寫作指南]
 * [http://wiki.ddbc.edu.tw/pages/Blog_%E7%A4%BA%E7%AF%84 Blog 示範 - DDBC Wiki]
 * [http://wiki.ddbc.edu.tw/pages/%E5%90%8D%E5%B1%B1%E5%8F%A4%E5%89%8E-%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%95%B8%E4%BD%8D%E5%85%B8%E8%97%8F 中國佛寺史志工作手冊]
 * [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A  佛學 規範資料庫工作手冊]
 * [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 佛學規範資料庫問答]
 * [http://wiki.ddbc.edu.tw/pages/GIS%E3%80%8A%E9%AB%98%E5%83%A7%E5%82%B3%E3%80%8B%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A GIS《高僧傳》工作手冊]
 
TEI 網站
 * P5:TEI指引 http://www.tei-c.org/release/doc/tei-p5-doc/zh-tw/html/
 * TEI Elements http://www.tei-c.org/release/doc/tei-p5-doc/zh-tw/html/REF-ELEMENTS.html
 * TEI Lite http://www.tei-c.org/Guidelines/Customization/Lite/
 * TEI Lite(中文版)http://www.sinica.edu.tw/~metadata/standard/rarebook/TEI921224/index_c.htm
 * Roma http://www.tei-c.org/Roma/
 * teiWorkshop http://buddhistinformatics.chibs.edu.tw/~mb/webclassmb/teiWorkshop/indexTei.html
 * TEI(P4)核心元素一覽表 http://www.sinica.edu.tw/~metadata/standard/rarebook/TEIelements-core.htm
 
Unicode
 * unicode網站 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35
 * Unicode-維基百科 http://zh.wikipedia.org/w/index.php?title=UTF&variant=zh-tw
 * UTF-8-維基百科 http://zh.wikipedia.org/w/index.php?title=UTF-8&variant=zh-tw
 * 字符編碼理解 http://www.donews.net/holen/archive/2004/11/30/188182.aspx
 * Unicode字符平面映射 http://zh.wikipedia.org/zh-hk/Unicode%E5%AD%97%E7%AC%A6%E5%B9%B3%E9%9D%A2%E6%98%A0%E5%B0%84
 
漢字處理
 * 缺字SOP流程 http://wiki.ddbc.edu.tw/pages/%E5%9C%96%E7%89%87:FSOP.jpg
 * CBETA組字式規則 http://www.cbeta.org/data-format/rare-rule.htm
 * 別譯雜阿含缺字檔 http://buddhistinformatics.chibs.edu.tw/BZA/gaijiPron.html
 * 嘉興藏缺字處理參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
 * 古籍 數位 化中的漢字處理問題 http://artvine.org/forum/index.php?topic=617.0
 * 文獻處理實驗室 http://cdp.sinica.edu.tw/download/dcatalog.htm
 
字辭
 * CBETA字辭典資料網 http://dict.cbeta.org/word2/search.php
 * 教育部異體字字典: http://dict.variants.moe.edu.tw/suo.htm
 * 教育部重編國語辭典 http://dict.revised.moe.edu.tw/index.html
 * 全字庫 http://www.cns11643.gov.tw/web/index.jsp
 * 漢典:http://www.zdic.net/
 * 漢字庫 http://www.cns11643.gov.tw/seeker/chinese/search-04.jsp
 * 在線新華字典 http://xh.5156edu.com/html4/8952.html
 * 書法字典 http://www.9610.com/zidian/index.asp
 * CHISE IDS 漢字検索 http://app.kita.zinbun.kyoto-u.ac.jp/ids-find
 * 佛典辭書數位檢索系統 http://140.112.26.229/cyj/index.py
 * 中華 物文字庫工具書 http://www.gg-art.com/article/tools_b.php
 * 佛門網 http://glossary.buddhistdoor.com/
 * FODIAN 佛教辭典 http://fodian.goodweb.cn/fodict.asp
 * 中文字轉漢語拼音-1 http://www.iq-t.com/SYSCOM/pingying2.asp
 * 中文字轉漢語拼音-2 http://tdc.putonghuaonline.com/tools2.html
 * 繁簡轉換工具 http://tdc.putonghuaonline.com/tools3.html
 * 新同文堂(簡繁轉換) Firefox瀏覽器→工具→附加元件→取得附加元件→瀏覽所有附加元件→檢索「新同文堂」→新增至Firefox
 * OLDict http://zh-cn.oldict.com/
 * FODIAN佛教辞典 http://fodian.goodweb.cn/
 * 佛光大辭典第三版 http://etext.fgs.org.tw/etext6/search-1.htm
 
標點符號用法
 * CBETA標點符號用法 http://www.cbeta.org/xb/table.htm
 * 教育部重訂標點符號手冊 http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo
 * 重訂標點符號手冊 http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo
 
人名查詢
 * 清代檔案人名權威資料查詢 http://npmhost.npm.gov.tw/ttscgi/ttsweb?@0:0:1:mctauac::/tts/npmmeta/dblist.htm@@0.924019884790802
 * 中華藝術家人名大辭典 http://www.chinese-artists.net/name/name.htm
 * 詩人檢索 http://poems.tang.net/
 * 諡法及得諡人表
 * 謚號_百度百科 http://baike.baidu.com/view/1072.htm
 * 中國歷代人物傳記資料庫 http://isites.harvard.edu/icb/icb.do?keyword=k35201&pageid=icb.page145374
 
地名查詢
 * 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw
 * 中國古代地名大詞典  http://www.gg-art.com/dictionary/index_b.php?bookid=33
 * Google 地圖 http://ditu.google.com/
 * Google 地圖_大陸 http://ditu.google.com/
 * MapABC 地圖網 http://www.mapabc.com/
 * Sogou搜狗地圖 http://map.sogou.com/
 * Get Lat Lon(獲取經緯度的地圖網) http://www.getlatlon.com/
 * 中國歷史地理信息(有歷史地名釋文) http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp
 * 中国行政区划网 http://www.xzqh.org/index.htm
 
時間查詢
 * 國家時間與頻率標準實驗室 http://www.stdtime.gov.tw/chinese/home.aspx
 * 中原標準時間 http://w3.tkgsh.tn.edu.tw/95c244/TIME.htm
 * 中研院兩千 中西曆轉換 http://sinocal.sinica.edu.tw/
 * 中西曆對照查詢系統 http://thdl.ntu.edu.tw/datemap/index.php
 * 陸拓資訊萬 曆 http://time.rootinfo.com.tw/
 * 爱词霸_万 历 http://hanyu.iciba.com/wannianli.html
 * 中国历代 表 http://kdd.cc/fl/lisi/
 * 間參照系統-時間軸庫 https://cga-download.hmdc.harvard.edu/publish_web/Geo_Tools/timeRS/
 * 月份的名稱 http://tw.group.knowledge.yahoo.com/zeelandia-zeelandia/listitem/view?iid=114
 * 月份的別稱 http://zh.wikipedia.org/w/index.php?title=%E8%BE%B2%E6%9B%86&variant=zh-tw#.E9.97.B0.E6.9C.88.E6.9C.88.E4.BB.BD
 * 干支 http://zh.wikipedia.org/w/index.php?title=%E5%B9%B2%E6%94%AF&variant=zh-tw
 
綜合查詢
 * Authority書籤 http://share.foxmarks.com/folder/rss/osyCa6r9nX
 * oclc查詢系統(查詢出版品) http://www.worldcat.org/search?q=%E4%B9%9D%E8%8F%AF%E5%B1%B1%E5%BF%97&fq=dt%3Abks&dblist=638&qt=first_page
 * 國立編譯館學術名詞資訊網 http://terms.nict.gov.tw/search_b.php
 * 吳疆教授(亞利桑那大學東亞研究所,對中國佛寺志有鑽研)
   網址 http://bgis.coh.arizona.edu/
   聯絡信箱  jiangwu@email.arizona.edu
 
古籍文獻資料庫
 * 文淵閣四庫全書電子檔安裝(找圖書組櫂埕安裝)
 * 漢籍全文資料庫(二十五史) http://dbo.sinica.edu.tw/~tdbproj/handy1/index.html?
 * 中國古籍全錄(按經史子集收錄中國歷代古籍繕本) http://guji.artx.cn/
 * 宋史研究網 http://www.ihp.sinica.edu.tw/~twsung/scholar/scholarframe.html
 * 宋史檢索 http://www.ihp.sinica.edu.tw/~twsung/search/search.html
 * 數位資源數據庫 http://www.ddbc.edu.tw/zh/metalib_sfx/e_resource.html
 * 中國大陸各省地方志書目查詢系統 http://webgis.sinica.edu.tw/place/
 
學校相關網頁
 * 法鼓佛教學院首頁 http://www.ddbc.edu.tw/
 * DDBC_library http://licbib.ddbc.edu.tw/F?RN=411815122
 * DDBC_Moodle http://moodle.ddbc.edu.tw/
 * DDBC_Wiki http://wiki.ddbc.edu.tw/pages/
 * DDBC_gmail 學校首頁→資訊服務入口→網頁郵件系統
 * DDBC_calendar 學校首頁→資訊服務入口→網頁郵件系統→登入信箱→日曆
 * 法鼓山內部資訊網 http://w1.omtf.pl/
 
在Y公共磁碟區上的工具檔 Y:\Projects\fosizhi\work\tools
 * 漢語大辭典 accelon3-dict
 * 清除折行多餘空格軟體 cleanBK
 * 檔案總 freecommander
 * 裁圖軟體 GIMP
 * 搜狗拚音輸入法(可用漢語拚音輸入)
 * 出版物標點符號用法規範
 * 批次更名工具 UltraRename28b
 * FTP上傳 名稱:fosizhi, 主機地址:dev.ddbc.edu.tw
 
===操作技巧===
 幾個快捷技巧
  Alt+ Tab 切換文件
  Ctrl+ R 重新整理網頁
 在Oxygen下:
  Ctrl+ E 下標記
  Ctrl+Shift+ V  valid驗證
  Ctrl+Shift+ W  well form 驗證
  Ctrl+Shift+ <  加註;取消註
 在Oxygen xpath下:(Perspective → Show Toolbar → XPath
   //pb → 找所有<pb>(同理可推:找placeName---)
   //pb[@='0100'] → 找第100頁
   //persName[.='名字'] → 找出某人名
 使xml文件標記元素 屬性呈現中文化解說的方法
   在xml文件內
   →點選功能列上Document
   →XML Document
   →Associate Schema
   →RelaxNG Schema(Compact syntax ,URL選用新的Schema
   →ok
   之後,就會在文件上看到新增的聯繫<?oxygen RNGSchema="../../schema/gazetteers.rnc" type="compact"?>
   而後,標記時,當打上角括,其所出現的元素表,每一個元素都會有中文解釋。或者,將游標移到元素或屬性上時,也會出現中文解釋。
 
===工作準備===
1. 進行新一本寺志標記前,應先找好該志的相關參考資料,例如:白話本、標逗本等。
2. 凡可用 程式 一併處理的工作,就不一一手動作業。
 
=== All Tag 使用說明===
 
{| style="color:green;background-color:#ffffcc;" cellpadding="6" cellspacing="0" border="1"
! Tag
! 用法
|-
|byline
|[[#(1)人名<persName>|署名]]
|-
 
|corr
|[[#勘字|勘字]]
|-
 
|div
|[[#其他標記|文本正文前資訊 正文 及正文後的分段]]
|-
 
|docAuthor
|[[#標記問答|題名頁的作者]]
|-
 
|cell
|[[#表格|表格]]
|-
 
|figure
|[[#圖檔或圖檔內有文字標記法|圖檔標記法]]
|-
 
|figDesc
|[[#圖檔或圖檔內有文字標記法|圖檔的圖說標記法]]
|-
 
|g
|[[#缺字標記|缺字標記]]
|-
 
|gap
|[[#標記問答|文字漏段或無法辨認時]]
|-
 
|graphic
|[[#圖檔或圖檔內有文字標記法|參考圖檔或圖檔內有文字標記法]]
|-
 
|head
|[[#標題<head> 的標法|標題<head>的標法]]
|-
 
|item
|[[#Metadata 建置|連續數字的標法]]
|-
 
|lg
|[[# 標記 問答|詩節 疊句 韻文段落等]]
|-
 
|l
|[[#標記問答|詩節 疊句 韻文段落等]]
|-
 
 
|list
|[[#Metadata 建置|連續數字的標法]]
|-
 
|lb
|[[#標記問答|新起一行]]
|-
 
|note
|[[#註解|註解]]
|-
 
|orig
|[[#勘字|通用字標記用法1]]
|-
 
|pb
|[[#標記|頁碼標法]]
|-
 
|p
|[[#其他標記|段落]]
|-
 
|ptr
|[[#註解|文字加連結的註解]]
|-
 
|persName
|[[#(1)人名<persName>|人名]]
|-
 
|placeName
|[[#(2)地名<placeName>|地名]]
|-
 
|reg
|[[#勘字|通用字標記用法2]]
|-
 
|roleName
|[[#(1)人名<persName>|角色或尊稱]]
|-
 
|ref
|[[#代名詞|代名詞]] [[#缺字標記|缺字標記]]
|-
 
|space
|[[#其他標記|英或中文字的距離]]
|-
 
|seg
|[[#其他標記|縮小字]]
|-
 
|sic
|[[#勘字|訛字]]
|-
 
|}
 
 
[[#工具|返工具]]
 
==執行步驟==
 
===一、叢書目錄及地理資訊建立===
 
====叢書目錄====
1. 明丹本共110冊,廣陵本共130冊,目錄檔路徑:
 
Y:\Projects\fosizhi\master-data\catalog\gazetteerCatalog.xml
 
2. 明丹本與廣陵本版本分析,檔案路徑:
 
Y:\Projects\fosizhi\master-data\catalog\catalogGazetteers_main.xml
 
====地理資訊====
 
1. 明丹本檔案路徑:
 
Y:\Projects\fosizhi\master-data\catalog\gazetteerKMLzfsh.xml
 
2. 廣陵本檔案路徑:
 
Y:\Projects\fosizhi\master-data\catalog\gazetteerKMLzfc.xml
 
===二、外包打字及轉加粗 ===
 
  ● 外包打字前置作業(春玉)
   影印文本:標記用
  ● 外包打字(以掃瞄檔給打字公司,不用給影印本)
   檔案路徑:
  1.https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4idGtaOUJWdldPcy1IclNpN1hmTi1YNlE&hl=zh_TW
  2. https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AuvdMMzuEgeWcHktTUNsODNlWWhIbC1XWWQ4RkJjRkE&hl=zh_TW
  ● 轉粗標:H, pb, P(春玉、小花)
 
===三、掃瞄===
 
   * 選擇掃瞄檔案儲存為Tiff
   * 解析度為400dpi 像素是 1945x2992
   * 8 bits 灰階。( 不是黑白 )
   * Tiff 轉 jpg(網頁用)
   * Jpg 為 Tif的4/1 像素是 486x768
   * jpg檔加浮水印
   * 切邊
   * 明丹本掃瞄明細:https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4idGtaOUJWdldPcy1IclNpN1hmTi1YNlE&hl=zh_TW
   * 廣陵本掃瞄明細:https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4icDJXeXRzRF9JNHJUcW5aczR0a1JaRnc&hl=zh_TW
   * 檔案:  Y:\Projects\fosizhi\images\
   * 處理 人員:伯雍
 
===四、Metadata 建置 ===
 
<syntaxhighlight lang="XML">
* 建立掃瞄 Tiff 數位圖檔的 Metadata
* 一本 寺志各頁的掃瞄圖檔放在同一 資料
* 一本佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
* Metadata檔案內依序記錄每張掃瞄圖檔之資訊
* 每張圖檔資訊記於一組<div></div>
* 檔案放在: Y:\Projects\fosizhi\gazetteerTxt\
* 處理 人員: 家名,秀雯,琇麗,小花
 
</syntaxhighlight>
 
<syntaxhighlight lang="XML">
(一)內容說明:
<div n="1Book005/1B005P011">
<list>
<item n="1">1B005P011</item>
<item n="2">內文</item>
<item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
<item n="4">g006p0978</item>
<item n="5">放生池</item>
</list>
</div>
 
A.<item n="1">1B005P011</item>
  1)指數位圖檔的檔名。
  2)每一頁都有一個數位圖檔。
 
B.<item n="2">內文</item>
 1)志文分成5個分類:a)書名頁或題詞 b)版本說明 c)目錄 d)內文 e)圖 f)空頁。
 
   注意:a)古文內的目錄,分類屬"內文",標題則作"目錄"。
      (因古籍內的目錄有頁碼,屬古籍內文的一份部,頁碼為g***p****。)
      b)空頁:指全部空白。若有格線,只是沒有文字的話,則作"內文"類。
 
C.<item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
  1)每頁的標題。
  2)以「-」(dash)表達漸層關係。
  3)以「/」(slash)隔開同一頁上的不同標題。
  4)若是空白頁,無標題,以”none”表示。
 
D.<item n="4">g006p0978</item>
  1)頁碼:前3碼為志碼,後4碼為內文本身的頁碼。
  2)頁碼種類如下:
 
   a)書名頁頁碼(f+1碼數字):g***f*
   b)版本說明頁碼(無頁碼):g***p0000a 
   c)目錄頁碼(c+3碼數字):g***c***
   d)內文頁碼(p+4碼數字):g***p****
  
  注意:1)頁碼都以小寫表達,組成方式是:[志碼+頁碼]
    2)若插圖無頁碼,則以[前一頁的頁碼+英文字母]。
    3)需另外記錄插圖的數目,以作統計使用。
     4)無頁碼的編碼原則:前一頁頁碼+英文字母。
 
     a)舉例:
 
      g***p0011
      無頁碼-----------則編為:g***p0011a
      g***p0012
 
      b)版本說明,因無前一頁,故編為:g***p0000a  
 
E.<item n="5">放生池</item>
  1)"可辨識"的前三個字,從每一頁的右上角數過來。
  2)若無前3個字,如空白頁,則以"none"表示。
  3)若遇糢糊不清的字,則向下遞補,取可辨識的字。(Sophia 10-14-2009 updated according to小花's saying.)
 
(二)注意:
  1)每一個數位檔都需對照文本,以確定數位檔沒有lost,
   若有任何一個lost,則後面所有的metadata資料無法與圖檔對照起來。
  2)若有數位檔檔lost的部份,請與伯雍聯繫,請他更正補上。
 
(三)缺字:
1)至cbeta漢字工具,教育部異體字網站,unicode查找。
2)若無法貼上,需作缺字庫。(事後決議用通用字或組字式。updated by Sophia 2010-03)
 
(四)完成檔案:
1)以.txt 存於 Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff
  與佛寺志的數位圖檔放在一起。
2)每一個資料夾對應一個Metadata的檔案。
3)資料夾 1Book001 表佛寺志第一輯的第一本數位圖檔,對應1Book001.txt
  (updated by Sophia 2009-06-25)
 
</syntaxhighlight>
 
====Metadata 目錄處理原則====
1.皇明觀志metadata
  會議結論:將佛寺志序 前言及總目錄全拿掉,不放在metadata。(秀麗 99.03.17)
 
====Metadata 明丹本與廣陵本更正項目====
<syntaxhighlight lang="XML">
小花建議:
1)原稿缺須用中括號括起來,前面要加樹狀結構。(前三個字亦要用中括號括起來)
  ex:    <item n="1">1B043P290</item>
       <item n="2">內文</item>
       <item n="3">鶴林寺志-鶴林寺志卷之十二-[原槁缺]</item>
       <item n="4">g045p0005</item>
       <item n="5">[原稿缺]</item>
 
2)把分類"杜目錄"變更回"目錄"。如下:
<item n="2">杜目錄</item> -->  <item n="2">目錄</item>


3)空 的head <item n="3">none 亦須加上樹狀結構,不作none,
==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E5%B7%A5%E5%85%B7#.E5.B7.A5.E5.85.B7 參考工具]==
  用上 頁的head,如 :(共292個 + 非空頁但 題為none,僅限內 類。)
1 網 工具<br>
 1.1 文本介面<br>
 1.2 規範資料庫<br>
 1.3 工作手冊<br>
   1.4 TEI 網站<br>
 1.5 漢字處理<br>
 1.6 辭典類<br>
 1.7 標點符號 法<br>
 1.8 人名查詢<br>
 1.9 地名查詢<br>
 1.10 時間查詢<br>
 1.11 綜合查詢<br>
 1.12 古籍文獻資料庫<br>
 1.13 學校相關網頁<br>
 1.14 在Y公共磁碟區 的工具檔<br>
2 操作技巧<br>
 2.1 幾個快捷技巧<br>
 2.2 在Oxygen下<br>
 2.3 在Oxygen xpath <br>
 2.4 記元素中 化<br>
 2.5 wiki 語法<br>


       <item n="1">1B009P087</item>
==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%9F%B7%E8%A1%8C%E6%AD%A5%E9%A9%9F 前置作業]==
       <item n="2">空頁</item>
1 叢書目錄建立<br>
       <item n="3">重修普陀山志-普陀山志卷一-普陀寺殿圖</item>
2 地理資訊建立<br>
       <item n="4">g008p0068</item>
3 文字輸入<br>
       <item n="5">none</item>
4 文字校對<br>
    
5 掃描<br>
a)書名頁,目錄,及版本說明的<item n="3">none,由小花處理。
6 Metadata建置<br>
b)先search 空頁,再search none.(none有487個,空頁有292個 + 非空頁但標題為none,)


4)補上g027 xml (內文第一頁須加上 type="first)
==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%A8%99%E8%A8%98%E4%BD%9C%E6%A5%AD 標記作業]==
  <div n="1Book028/1B028P311" type="first">
1 工作準備<br>
     <list>
2 檔案架構<br>
       <item n="1">1B028P311</item>
3 加facs碼<br>
       <item n="2">內文</item>
4 段落形式<br>
       <item n="3">雲棲紀事</item>
5 標記元素<br>
       <item n="4">g027p0001</item>
6 字元層次<br>
       <item n="5"> 孝義無</item>
7 標記問答<br>
     </list>
8 佛寺志PDF版<br>
   </div>
9 佛寺志粗標<br>


5)內文的p.1 大部份皆為標題名,亦 加上樹狀結構,即 (type="first") ,約100+個。
==點校作業==
[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E9%BB%9E%E6%A0%A1 佛寺志點校]<br>
1. 佛寺志點校 知_Oxygen作業<br>
2. 佛寺 點校須知_txt作業<br>
3. 佛寺志異體字處理規則(2018年版)<br>


6)缺字的部份[?],補上通用字或組字 。若有脫字 部份 <gap/>表示。(明丹本共有880個缺字,其他符號表示的缺字約有400-500)
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97python%E7%A8%8B%E5%BC%8F%E7%9A%84%E6%87%89%E7%94%A8#python.E7.A8.8B.E5.BC.8F.E7.9A.84.E6.87.89.E7.94.A8 python程 式的 ]==


7)同一頁有不同層級的title,如下:
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 特字處理]==
  <item n="3">天童寺志-天童寺志卷三-先覺攷-宋-月窗圓禪師/ 元-環溪一禪師/ 月坡明禪師</item>
  <item n="4">g012p0231</item>


  改成:用半形的分號隔開,下面的標題作完整的樹狀結構。
==[http://wiki.dila.edu.tw/pages/%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E9%A9%97%E8%AD%89#.E8.A6.8F.E7.AF.84.E8.B3.87.E6.96.99.E9.A9.97.E8.AD.89 規範資料驗證]==


<item n="3">
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E4%B8%8A%E5%82%B3%E5%88%B0FTP 上傳到FTP]==
天童寺志-天童寺志卷三-先覺攷-宋-月窗圓禪師;
天童寺志-天童寺志卷三-先覺攷-元-環溪一禪師/ 月坡明禪師
</item>
<item n="4">g012p0231</item>


8)g056後之附編一梁京 記,頁碼為1-4;附編二寺塔記,頁碼為1-6。
==輸出佛 志的純文字檔==
 若照書編,會有頁碼double的問題,故將頁碼續編,為g056p0115~124。(小花建議, 2010/06/07)
1.在ruby資料夾下執行ruby x2t.rb
  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb


2.純文字檔將會產生在output資料夾內
  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text


小花需處理的問題:
3.將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。


1)書名頁,目錄及 版本說明 的<item n="3">none,由小花加上樹狀結構。
==Github 版本 管理操作 說明==
2)書名頁及目錄的title,小花要用程式加上志名。(每一筆資料皆須志名)
[http://wiki.dila.edu.tw/pages/Git 《Pro Git》繁體中文翻譯]
3)圖檔切太多:
  1B042107(頂頭,無匡線),108(少一個字),109(頂頭,無匡線),110(頂頭,無匡線),1B042P639(頂頭,無匡線) 3B023P289(少一個字),2B008P208(圖上面的title不見了)


===如何取得以前的某個版本===
1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
2.選擇想要的版本 => 按右鍵 => Create Branch at this version
3.輸入 branch 名稱 (自己可以訂) => ok => 可關掉這個視窗
4.回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
  (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
5.在branch欄點選想要的版本(切換branch)=> ok=> close
6.回到專案資料夾 => 將需要的文件複製出來
7.在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱(確定已切換回 master版本)
8.(若有必要時,可將複製出來的文件貼回master版本文件中。)


9)有插圖,貢碼為[ 前一 頁頁碼+英文字母] 部份,將<item n="2"> 內容 補上括號”( )” 以與版本說明 亦為[頁碼+英文字母]作為區別。
===如何取得以 的某個版本(單 檔案)===
1.在想要擷取 檔案或資料夾(例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
2.點選想要的版本
3.在下方欄位中會出現當次push的檔案,點選想要 檔案 再點滑鼠右鍵
4.點選Save revision to... 儲存到自己指定的路徑
5.關掉log messages 到自己指定的路徑去便可看到下載的檔案


<div n="1Book015/1B015P050">
===如何刪除某個 branch===
      <list>
1.在整個專案資料夾上按右鍵 => TortoiseGit => Git GUI =>
       <item n="1">1B015P050</item>
2.(功能列上)Branch => Delete => Local Branches欄內點選要刪除的分支名稱=> Delete => 關掉Git GUI視窗
       <item n="2">(圖)</item>
       <item n="3"> 七塔寺志-七塔寺志卷之一-志圖記-七墖報恩禪寺平面全圖</item>       <item n="4">g013p0036a</item>
       <item n="5">七墖報</item>


10)同一頁有兩個以上標題,而第二個標題的內容跨頁時,則目錄上的標題有double的現象。解決方式,第二個標題前加上分號”;”,且作一個完整的樹狀結構。
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97xml%E8%BD%89html xml轉html]==


<div n="1Book001/1B001P078">
==[http://wiki.dila.edu.tw/pages/%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E6%9B%B8%E7%9B%AE 建立參考書目]==
      <list>
       <item n="1">1B001P078</item>
       <item n="2">內文</item>
       <item n="3">洛陽伽藍記-洛陽城東伽藍記卷第二-莊嚴寺;洛陽伽藍記-洛陽城東伽藍記卷第二-莊嚴寺秦太上君寺</item>       <item n="4">g001p0069</item>
       <item n="5">以石為</item>


==Metadata==
*對外公開的 metadata: [[佛寺志 Metadata]]
*內部的 metadata: [[佛寺志 Content Metadata Version 2]]


11)組字式內有slash出現時,如:[*/*],將slash改成全形,以與標題的slash作為區別。
==發行==
====[http://buddhistinformatics.dila.edu.tw/fosizhi/ 佛寺志網路版]<br>====


<div n="1Book026/1B026P151">
====佛寺志紙本書====
      <list>
 中華佛寺志叢書〈12部寺志,共15冊〉<br>
       <item n="1">1B026P151</item>
 ISBN:978-957-17-2177-4<br>
       <item n="2"> 內文</item>
 出版社:新文豐<br>
<item n="3"> 上天竺講 寺志-杭 上天竺講 寺志 卷之五-尊宿住持品-別傳-[鼓/耳]菴法師/天岸法師</item>       <item n="4">g024p0128</item>
 出版日:2013/06/01<br>
       <item n="5"> 柳公貫</item>
 內容:<br>
    01. 清涼山志<br>
    02. 峨眉山志<br>
    03. 重修普陀山志<br>
    04. 普陀洛迦新志<br>
    05. 九華山志<br>
    06. 天台山方外志<br>
    07. 明.明 阿育王 寺志<br>
      清.明 阿育王續志<br>
    08. 寒山 寺志<br>
    09. 玉岑山慧因高麗華嚴教寺志<br>
    10. 黃檗山志<br>
    11. 泉州開元寺志<br>
    12. 雞足山志<br>


 
==一般 務==
</syntaxhighlight>
 
====Metadata 問題與解答====
<syntaxhighlight lang="XML">
 
1.目前的 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可,
  type多增加一個圖&空頁
2. 若內文的漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense)
3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?]表示
4.版本說明及內文插圖無頁碼?
  版本說明的頁碼:g***none; 內文插圖的頁碼:none (不作g,以跟版本說明作區別)(110冊約只有3~4個無頁碼)
5.若是空白頁,標題及末3個字處,統一以"none"表示。
 
6.在作metadata時,有些圖檔捨棄不用的原因有:
  如:g008中,內文頁碼的起始為p3,p3之前掃了4頁,有兩頁是title,另兩頁是空白頁。
   只能取用兩頁編為p1,p2,另兩頁的空白頁只好沒有編入metadata,原因是沒有頁碼
   可以使用。(Sophia 2010-3-16)
7.metadata中,佛寺志圖檔檔名流水號沒有連續的原因是,同一頁double掃瞄了二次,
 告知伯雍後,delete掉double的部份,故部份的流水號沒有連續。(約有十幾頁左右)(Sophia 2010-3-16)
8. 原稿缺的表遠方式:
   a)原稿缺的確不是一個tilte,所以最好是作none。
   b)但若想要表達出原稿缺這個問題,但它又不是
    一個tilte ,即不可作樹狀結構,所以我只作"
    原稿缺",而無樹狀結構。(Sophia 2010-3-16)
   A:開會討論如下,用中括號匡起來。
 
<div n="1Book043/1B043P345">
      <list>
       <item n="1">1B043P345</item>
       <item n="2">內文</item>
       <item n="3">﹝原稿缺﹞</item>
       <item n="4">g045p0060</item>
       <item n="5">﹝原稿缺﹞</item>
      </list>
     </div>
 
9.每一筆資料是否需加志名?(小花提的問題)
<div n="1Book023/1B023P021">
      <list>
       <item n="1">1B023P021</item>
       <item n="2">目錄</item>
       <item n="3">靈隱寺志詳目</item>  (靈隱寺志-靈隱寺志詳目)(小花建議)
       <item n="4">g021c018</item>
       <item n="5">靈隱寺</item>
      </list>
     </div>
a)請注意:只有內文的title才有樹狀結構,其他部份,如目錄,或書名頁並沒有作樹狀結構,
這是當初製作的標準,所以這並不是一個錯誤。目錄及書名頁並沒有第幾卷的問題,也就是說並
沒有繁複的層級問題,那是否有作樹狀結構的必要呢?(Sophia 2010-3-16)
 
 
10.metadata標題脫漏字的表達方式:(Sophia 3-23)
 a)用一個全形空格。(小花建議)
  b)用一個□。
  c)下標記<gap extent="1" unit="chars" reason="lost"/>
 
A:開會決議用c)  (小花事後建議用 <gap/> )
 
11.當文本屬性"不分卷"時,樹狀結構如何產出?
  (1)依內文屬性責成標題。
  (2)如無法責成標題,而自編標題,須加上括弧號{}註明,例如:
<div n="4Book002/4B002P005" type="first">
<list>
<item n="1">4B002P005</item>
<item n="2">內文</item>
<item n="3">北京廟宇征存錄-{李圓淨序}/{吳百之序}</item>
<item n="4">y003p0001</item>
<item n="5">北京廟</item>
</list>
</div>
(小花跑程式,將括弧號{}轉換中括號[])
  (3)文本"不分卷",因較難產出樹狀結構之層級。惟忠於文本架構,即使到第二層級,也可行。
 
 
12.標題如出現簡體字時,是以繁體字為準?
  不轉換繁體字,仍以簡體字為準。
 
 
13.內文同時附有圖表,如何處理?
  同時做內文與圖表之標題,但以"分號"區分。文本分類屬內文,例如:
<div n="4Book008/4B008P437">
<list>
<item n="1">4B008P437</item>
<item n="2">內文</item>
<item n="3">大同武州石窟寺記-支那山西雲岡石窟寺-第二章石窟寺之現狀-大佛殿窟;大同武州石窟寺記-支那山西雲岡石窟寺-第二章石窟寺之現狀-大佛殿平面圖</item>
<item n="4">y014p0035</item>
<item n="5">立千仞</item>
</list>
</div>
 
14.插圖與版本說明的頁碼"a"是如何作區別的?ex:g009p0030a為圖,但左方結構顯示為版本說明。(2010-9-8)
  加上括孤以為區別,如:<item n="2">(圖)</item> 
 
</syntaxhighlight>
 
====metadata 檔案匯入MIX標記架構內====
MIX架構含:head, mix, map
 處理人員:小花
 
===五、標記===
 
[[#執行步驟|返執行步驟]]
 
==標記作業==
===一、標記總說===
<syntaxhighlight lang="XML">
本專案將以TEI-XML格式進行作業,對於文本中的人名、地名、時間皆加以標記及建置資料庫,
旨在提供高質量的數位化全文。
數位化的文本也將加入新式標點符號。文本中的難檢字將採用Unicode字符,
若於Unicode字庫中尚未收錄的字,則將改以同義異體字代替,或者建立缺字檔。
TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。
「意義標記」著重在付予文字意義,例如:<persName>人名。
「樣式標記」著重在呈現的樣貌,例如:<lb/>(折行)。
TEI-XML標記著重於「意義標記」,而文本呈現的樣貌則多操縱於XSLT。
</syntaxhighlight>
 
===二、檔案架構===
 《中國佛寺史志》以「志」為單位,每一部志皆有一代碼(例:重修普陀山志代碼g008)。
 每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
 及數個小檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。
 主檔內寫有版本資訊及小檔的鍊結,小檔內則是各卷的內容。
 
===三、標記說明===
 
====(一)頁碼====
<syntaxhighlight lang="XML">
● 頁碼放置的位置
  置於<div>與<head>之間。
  例1:<div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0">
    <pb facs="1B009P003.jpg" n="0000a"/>
     <head resp="ddbc.da">普陀山志卷前</head>
  例2:<div>
    <pb facs="1B009P022.jpg" n="0003"/>
     <head>重修普陀志叙</head>
 
● 版本說明頁的頁碼;卷之前無頁碼的頁碼
  格式:第一頁0000a,第二頁0000b,第三頁0000c
  例:<div>
    <pb facs="1B009P003.jpg" n="0000a"/>
    <head resp="ddbc.da">版本說明</head>
  ps.由於卷首需要一個頁碼,因此「版本說明」的頁碼會被挪移到當卷第一個<head>之前。
   (見頁碼放置的位置例1)
 
● 插圖頁的頁碼
  格式:插圖前頁頁碼+a
  例:<pb facs="xBxxxPxxx n="0123a""/>
 
● 空白頁
  需標上當頁頁碼
  例:<pb facs="1B009P043.jpg" n="0024"/>
 
</syntaxhighlight>
 
====(二)標題====
<syntaxhighlight lang="XML">
● 若篇章缺乏標題者,可自訂標題。
  自加的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,
  以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。
  文本標記的格式:<head resp="ddbc.da">自加的標題</head>
  網頁樹狀目錄所呈現的樣式:(自加的標題)
 
● 標題亦可加新式標點符號。
 
</syntaxhighlight>
 
====(三)人名====
1 人名規範資料的建置(若欲建檔,請先以帳號密碼登入)
  ● 人名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/person/
  ● 人名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「人名規範資料庫」]
 
2 人名標記
<xml code>標法:
 ● <persName key="AXXXXXX">某某某</persName>
 ● <persName key="unknown">未知的人名</persName>
 ● <persName key="GXXXXXX">人名群組</persName></xml>
 
3 標記凡例
{| style="color:green;background-color:#ffffcc;" cellpadding="2" cellspacing="0" border="1"
!稱謂
! 凡例
! 標記
|-
|官稱
|<ul><li>韋左司</li><li>韋應物左司</li><li>杜副校長正民</li></ul>
|<ul><li><persName>韋<roleName>左司<roleName></persName></li>
<li><persName>韋應物<roleName>左司</roleName></persName></li>
<li><persName>杜<roleName>副校長</roleName>正民</persName></li></ul>
|-
|地名當人名
|<ul><li>韋蘇州</li><li>塩官國師</li><li>臨濟</li><li>天童圓悟大師</li></ul>
|<ul><li><persName>韋<placeName>蘇州</placeName></persName>(指韋應物)</li>
<li><persName><placeName>塩官</placeName><roleName>國師</roleName></persName></li>
<li><persName><placeName>臨濟</placeName></persName></li>
<li><persName><placeName>天童</placeName>圓悟<roleName>大師</roleName></persName></li></ul>
|-
|連名
|<ul><li>大鶴居士鄭文焯</li><li>花之寺僧羅聘</li><li>華陽眞人陶貞白先生宏景</li></ul>
|<ul><li><persName>大鶴<roleName>居士</roleName>鄭文焯</persName></li>
<li><persName>花之寺僧羅聘</persName>(不加roleName)</li>
<li><persName><placeName>華陽</placeName><roleName>眞人</roleName>陶貞白<roleName>先生</roleName>宏景</persName></li></ul>
|-
|子
|<ul><li>寒山子</li><li>殳子山夫</li><li>朱氏子</li></ul>
|<ul><li><persName>寒山<roleName type=”honorific”>子</roleName></persName></li>
<li><persName>孔<roleName type=”honorific”>子</roleName></persName></li>
<li><persName>朱</persName>氏子(陳述性的名詞不用標roleName)</li>
<li><persName>殳<roleName type=”honorific”>子</roleName>山夫</persName></li>
<li>寂窓照禪師,俗姓鄧。(鄧,指族姓,不用標persName)</li>
<li>寂窓照禪師,福之閩縣鄧氏子。(鄧氏子,指族姓,不用標persName)</li></ul>
|-
|兒
|<ul><li>陵兒</li></ul>
|<ul><li><persName>陵<roleName>兒</roleName></persName></li></ul>
|-
|公
|<ul><li>歐陽文忠公</li><li>忠定公燮元</li></ul>
|<ul><li><persName>歐陽文忠<roleName type=honorific>公</roleName></persName></li>
<li><persName>忠定<roleName type=honorific>公</roleName>燮元</persName></li></ul>
|-
|氏
|<ul><li>大雄氏(指佛)</li><li>孔雀氏(指阿育王)</li><li>俞氏</li></ul>
|<ul><li><persName>俞氏</persName>(皆直標persName,不用標roleName)</li></ul>
|-
|師、本師
|<ul><li>本師阿彌陀如來(「非人」名稱只單純標<persName>)</li></ul>
|<ul><li><persName>本師阿彌陀如來</persName></li>
<li><persName>阿彌陀佛</persName></li>
<li><persName>阿彌陀佛</persName>如來本地</li></ul>
|-
|大士、菩薩
|<ul><li>觀音大士</li><li>普賢菩薩(「非人」名稱只單純標<persName>)</li></ul>
|<ul><li><persName>觀音大士</persName></li>
<li><persName>普賢菩薩</persName></li></ul>
|-
|山人
|<ul><li>漁洋山人</li></ul>
|<ul><li><persName>漁洋山人</persName></li></ul>
|-
|上人
|<ul><li>悟上人</li></ul>
|<ul><li><persName>悟<roleName type=honorific>上人</roleName></persName></li></ul>
|-
|老
|<ul><li>印老法師</li><li>南亭老和尚</li></ul>
|<ul><li><persName>印<roleName type=honorific>老</roleName><roleName>法師</roleName></persName></li>
<li><persName>南亭<roleName type=honorific>老和尚</roleName></persName></li></ul>
|-
|老人
|<ul><li>南極老人</li><li>無著老人</li></ul>
|<ul><li><persName>南極老人</persName></li>
<li>惟我先師<persName>無著<roleName type=honorific>老人</roleName></persName>( 一般 稱謂、敬稱,標示<roleName>)</li>
<li>別號<persName>無著老人</persName>(專稱、別號,直用<persName>)</li></ul>
|-
|翁
|<ul><li>壑翁相國(賈秋壑)</li></ul>
|<ul><li><persName>壑<roleName type=honorific>翁</roleName><roleName>相國</roleName></persName></li></ul>
|-
|先生
|<ul><li>半農先生</li></ul>
|<ul><li><persName>半農<roleName type=honorific>先生</roleName></persName></li></ul>
|-
|夫人
|<ul><li>許夫人</li><li>秦國夫人計氏</li></ul>
|<ul><li><persName><roleName><placeName>秦國</placeName>夫人</roleName>計氏</persName></li></ul>
|-
|諡號
|<ul><li>謚「大悟禪師」</li><li>賜號「廣慧妙悟智寶宏教禪師」</li></ul>
|<ul><li><persName>大悟<roleName>禪師</roleName></persName></li>
<li><persName>廣慧妙悟智寶宏教<roleName>禪師</roleName></persName></li></ul>
|-
|皇帝(皇后)
|<ul><li>世宗憲皇帝</li><li>梁皇</li><li>慈寧皇太后</li></ul>
|<ul><li><persName>世宗憲<roleName>皇帝</roleName></persName></li>
<li><persName>慈寧<roleName>皇太后</roleName></persName></li></ul>
|-
|帥
|<ul><li>筱帥</li></ul>
|<ul><li><persName>筱<roleName>帥</roleName></persName></li></ul>
|-
|君
|<ul><li>須直君</li><li>葛君</li></ul>
|<ul><li><persName>葛<roleName type=honorific>君</roleName></persName></li></ul>
|-
|諱
|<ul><li>王諱舉(王舉)</li></ul>
|<ul><li><persName>王諱舉</persName></li></ul>
|-
|}
 
4 人名標記規則
  ● 文本中出現的人名,皆應標記。(包括書名號內的人名)
   例:《吳之佳傳》《物初賸語》
 
  ● 標題後的人名是「作者」時的標法
   <head>標題</head><byline><persName key="AXXXXXX">作者名</persname></byline>
  (<byline>:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
 
  ● 人名規範資料建檔注意事項
  ※名字:常名、別名請冠上姓氏,以便利檢索。
  ※缺字:人名中有缺字時,人名欄位以通用字表示。
  ※朝代:以此人的卒年為依。
  ※籍貫:其地名朝代以此人的生年為依。
  ※生年的計算:生年=卒年-歲壽+1
  ※生卒年的取捨:若資料來源有干支年及西元年,以取干支年為準。
   例:重顯,(980~1052)宋代雲門宗僧。於皇祐四年入寂。
   建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。
  ※是否為歷史人物:若非歷史人物,則在此欄位勾「否」。
  ※註解:以120個字為限(阿拉伯數字不算字數,標點符號算字數)。引用資料後需標明來源。
  ※註解:若此人查不到生卒年,則應在註解欄的資料中盡可能節錄有相關人事物的時間參考點。
  ※註解:僧人的基本資料,最好有師承、師兄弟、著作、法嗣、事件時間。
  ※註解:引用資料,盡量以紙本、藏經或佛學辭典為優先。
     使用網路資料時,應注意留存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。
  ※註解:引用的文獻查詢順序:1)宋僧錄 2)疑年錄 3)佛百、佛光 4)「佛學規範資料庫」的參考書目 5)網路資訊
  ※「佛學規範資料庫」對於經常使用的參考工具書編有「簡稱」,引用出處請以這些「簡稱」為依。
  ※Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。
  ※若是查詢不到任何資料的人名,請不用收錄至規範資料庫。
 
[[#(三)人名|返(三)人名]]
 
====(四)地名====
● 地名規範資料的建置(若欲建檔,請先以帳號密碼登入)
  地名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/place/
  地名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「地名規範資料庫」]
 
● 地名標記
  <xml code>標法:<placeName key="XXXXXXXXXXXXXX">地名</placeName>
    <placeName key="unknown">未知的地名</placeName>
    <placeName key="XXXXXXXXXGXXXX">地名群組</placeName></xml>
 
 
 
 
 
 
 * 確認查找古今地理位置: 安裝 Super GIS 軟體
  (利用Super GIS所提供的地理圖層可幫助確認古今地名正確位置)
 * 世界地圖: J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
 * ccts使用教學影片:J:\CND\Projects\2008AuthorityDB\SuperGIS2.2\CCTS\CCTS \ccts.swf
   (感謝GIS伯雍提供)
 * 中央研究院提供地圖工具 http://gis.rchss.sinica.edu.tw/google/?p=301
(一)內文標記方式
* 地名的標法
  例:<placeName key="Z13005440">雒邑</placeName>
* 地名群組的標法:
  例:<placeName key="CN0000000G01AA">...</placeName>
 
(二)新增/修改地名之介面說明
 
'''新增'''資料建檔方式
 ●第一步驟說明:
      1.進入"地名規範資料庫'''維護'''"http://authority.ddbc.edu.tw/login.html
      2.跳出「有問題的地名」頁面時-不理會請Delete(快速鍵:Ctrl+ W 鍵)即可進入「地名檢索」頁面
      3.地名檢索下方「管理功能」點選「新增地名」
        * 地名檢索條目說明如下:
                 地名檢索字串:提供任一關鍵字即可。
                 編號搜尋:以CN碼為主。
                 Z碼搜尋 :以Z碼為主(中研院所提供之編碼)。
                 複合搜尋:複合關鍵字搜尋(隔開標點符號為逗號,)以利更快速精準的查詢功能。
                      範例:浙江,四明山(此為複合關鍵字)
                 管理功能:僅提供有權限人員使用欄位。
      4.選擇「地理區域範圍」(三種區域包括:中國、中國境內跨區、其他國家)
  a)已知固定範圍之地理區域(中國)項目說明:    
   區 域:選擇地名之省、市、縣或區,確認最小範圍後點選「選取此地區」。(資料不足可選擇最大範圍-省)
   分 類:參考[http://wiki.ddbc.edu.tw/pages/%E5%9C%B0%E5%90%8D%E7%B7%A8%E7%A2%BC%E5%8E%9F%E5%89%87 地名編碼原則]之「屬性編碼」方式,選擇適當代碼。
   獲得編碼:選「按此取得編碼」(請再次檢查編碼的正確性)。
   編碼結果:選「使用此碼」(新增編碼成功後,不可隨意更改編碼。)
   清除資料:可重填(重點原則是'''尚未點選'''「使用此碼」之前)。
  b)跨區(中國)項目說明: 
   先選擇一個區域:參考[http://www.xzqh.org/QUHUA/index.htm 中華人民共和國行政區劃]之「中國政區」區域範圍說明。
   分 類:參考[http://wiki.ddbc.edu.tw/pages/%E5%9C%B0%E5%90%8D%E7%B7%A8%E7%A2%BC%E5%8E%9F%E5%89%87 地名編碼原則]之「屬性編碼」方式,選擇適當代碼。
 ●第二步驟說明:
      1.取得編碼後出現「修改地名」視窗
      2.繼續填寫「基本資料」欄
   Level:(不必填)
   朝 代:慣用名-使用條件為『不受年代變動的影響之地名』。(範例:長江、四明山..等)
   經緯度:座標來源可利用[http://maps.google.com/maps Google Map] 『我的地圖』之『[http://maps.google.com/gadgets/directory?synd=mpl&hl=zh-TW&gl=TW&backlink=http%3A%2F%2Fmaps.google.com%2Fmaps%2Fmm%3Ft%3Dh%26hl%3Dzh-TW%26ie%3DUTF8%26ll%3D30.229246%2C120.12768%26spn%3D0.006322%2C0.007671%26z%3D17&cat=new 更多小工具]』新增 getLatLongPlus2
   座標型態:選擇條件說明:
      1.已考定(精確)-已確定之精確座標位置
      2.已考定(預設值)-須進一步雙重確認
      3.待考-尚未考察或須待確認
      4.不可考-已考察並確定此地名不存在或無可考
   拼 音:(不必填)
   說 明:(可不必填)填寫須具備以下條件:
      1.簡潔說明(僅提供地名本身須註解部分,不提供文本相關資料。)
      2.使用全形標點符號,如下所示:,。、;:!?.「」『』()《》〈〉[]……
      3.提供來源出處(須參考[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 「專案整合權威資料庫」工作手冊 ]凡例之1.3 註解 note項目說明)
   加入超連結:引用網路資料之網址。
        操作方式說明:先置入網址於說明欄內,並複製全選網址後,再一次點選「加入超連結」貼上網址按確定即可。
 ●第三步驟說明:
      1.繼續填寫「地名部分」欄
      2.「常名」:須符合當時年代所常用之名稱(僅可提供一個常名),於「是否常名」欄中選「是」即可。    
 ●第四步驟說明:
      1.按「修改資料」即成功完成新增建檔。(切記:若沒有先按「修改資料」而繼續登錄以下之項目「新增來源資料」將面臨前功盡棄的殘酷事實。)
      2.其他別名:限定條件須為同年代(因特殊地理位置或其他原因而給予的名稱(可提供多個名稱)),均於「是否常名」欄中選「否」即可。
 ●第五步驟說明:
      1.再次新增/修改地名時,於"地名檢索結果"頁面,點選「修改這筆資料」即可。
      2.「新增來源資料」(source)僅須登錄一筆即可。範例:g017p0001
  ※'''基本資料欄'''中須注意事項:
  a)必備四樣資訊:朝代、經緯度、地名部分、來源資料。
  b)文本之寺院內建築必須給ID及經緯度。常名建置。範例:慧因寺妙應殿
   ex:<placeName key="CN××××××T××AB">寺院內建築</placeName>(ID=CN××××××T××AB)
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
  d)尋找網路資料時,優先採用順序以[http://share.foxmarks.com/folder/rss/osyCa6r9nX Authority]所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
  f)失落或無可考的建築物及地名可不提供經緯度,但'''文本須標記'''並於
   地名權威資料庫建置地名以供日後檢索。
 ※'''文獻查詢順序: 1)  [http://authority.ddbc.edu.tw/AuthorityBibl.html Authority]所提供的其他參考書目  2)  中國歷史地圖集  3)  網路資訊(維基等)'''
 
 
{| cellspacing="0" border="1"
!建築物
!XML(文本內文)
!地名基本資料欄
!經緯度
|-
|存在
|給I D 標<placeName key="×××">
|須建檔
|提供最大範圍 例如:省、區、寺院
|-
|不存在
|給I D 標<placeName key="×××">
|須建檔
|提供最大範圍 例如:省、區、寺院
|-
|無可考
|不給I D 文本標<placeName>以顏色區分
|須建檔
|不給
|}
 
'''修改'''資料建檔方式
     ●第一步驟說明:進入"地名檢索結果"頁面
     ●第二步驟說明:點選「修改這筆資料」(編碼和行政區不可修改)
     ●第三步驟說明:「地名部分」及「新增來源資料」僅開放新增或修改,無法執行刪除動作。
     ●第四步驟說明:新增別名時,於下方「新增其他別名」後,按「新增」即可。(限定條件須為同年代的別名)
 
 ※修改資料中須注意事項:
  a)編碼和地理區'''不輕易'''改編碼。
  b)地名尾碼非AA碼者,"不可重新編碼",若要改碼,要用"新增"。
  c)若需'''改編碼後 必登錄'''[http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com 權威碼修改]申請隱藏該筆資料,以利後端程式人員通告相關人員。
  d)資料庫無刪除動作,僅可向authority維護人員報修登錄[http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com 權威碼修改]隱藏該筆資料。
 
 ※註:
  地名範例:四川行都司(明) 
  a)編 碼: CN513401Z39AA
  PrjNo:Z02018021
  Class_id:02_ BF(BF表示軍地)
 
======● 有關地名的問與答======
 
  ※注意:Google上的地圖與衛星圖的經緯度不一致,有很大的落差,在標經緯度時以衛星圖為主,原Authority內定的Map是以地圖為主,現已將Map改成Mix。另外,因衛星圖沒有較小的市街道名,故無法精確將經緯度落在正確的位置上。(by Sophia 6-10)
 
  ※查不到的地名,不用建檔(98.09.28洪老師詢問馬老師決議)
 
  ※地名中的人名是否標記?
   例:g011_11_p666山門暨庫堂之"大權菩薩閣"已有成効
   A:凡文本中出現的人名,皆應標記。
 
  ※四川峨眉縣 的標法&地名專名號
 
a)<placeName key="CN0510000E07AA">四川</placeName><placeName key="CN0511181Z01AA">峨眉縣</placeName>
b)<placeName key="CN0511181Z01AA">四川峨眉縣</placeName>
c)四川<placeName key="CN0511181Z01AA">峨眉縣</placeName>
決議:採用 b)
 
 
 ※”中峯之寺”的標法。(指中峯寺)(sophia 2/23)
 
  道厚師建議標"中峯"即可.
 
 
[[#(2)地名<placeName>|返地名]]
 
====(五)時間====
<syntaxhighlight lang="XML">
● 查詢時間id碼網址:"時間規範資料庫"
  http://authority.ddbc.edu.tw/time/
 
● 時間的標法說明:
 
(a)可查知的時間,皆應標記;
  無法證知(從前後文或其他資料皆無法得知)的時間,
  則標記<date key="unknown">未知年的時間</date>。
 
(b)有些時間因文本錯誤以致無法找到id,以note註解,
  例:<note resp="ddbc.da">此段重複「文本重複的文字」</note>
 
(c)為明確時間點的標法(某年某月某日)(用when)
  <date when-iso="年-月-日" xml:id="j(此日id碼)(此日id碼)">文本時間</date>
  例:<date when-iso="1610-06-26" key="j23092772309277">萬曆庚戌年五月十六日</date>
 
(d)為區段時間點的標法(某年或某月中的某些日子)(用notBefore notAfter)
  例1:<date key="j21904412190794"
    notBefore-iso="1285-02-13" notAfter-iso="1286-02-01">至元廿二年</date>
  (notBefore:至元廿二年的第一天  notAfter:至元廿二年的最後一天)
  例2:<date key="j24059262418260" notBefore-iso="1875-02-06" notAfter-iso="1908-11-14">清光緒年間</date>
  (notBefore-iso:清光緒的第一天   notAfter-iso:清光緒的最後一天)
 
 
● 初年,末年時間的擷取原則
  取當朝、當年號、當年的前1/4或末1/4
 
● 時間為民國年的查法:
  登入網頁「兩千年中西曆轉換」http://sinocal.sinica.edu.tw/
  兌換出相對應的西元時間,再到時間規範資料庫換算ID碼即可。
  例:民國壬寅年
  兌換出為西元1962年2月5日~1963年1月24日
  再到時間規範資料庫以西元年查詢為5949266~5949619
  即<date key="d59492665949619"
    notBefore="1962-02-05" notAfter="1963-01-24">
 
● 有關時間的問與答
  ※時間屬性的變更:(2011.01.20)
   notBefore,notAfter,from,to,when,全要加上-iso(計算0年)
   如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso
   例:<date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13">哀帝元壽間</date>
 
  ※萬 丙子秋 (=萬曆丙子秋)
   A:照標時間,空格不再處理。例:<date> 萬 丙子秋</date>
 
  ※<date>: key notBefore notAfter  次序是否統一?
   A:不必統一。元素中若有多個屬性,其先後順序不會影響驗證或呈現。
 
  ※當時間年、歲次同時出現的標法
   例:時宣統三年,歲在<date>辛亥六月旣望</date>,長洲葉昌熾謹記
 
  ※朝代
   *東晉
   *十六國:成漢、前趙、後趙、前涼、前燕、前秦、後燕、後秦、
       西秦、後涼、南涼、西涼、北涼、南燕、北燕、胡夏
   *南朝:劉宋、南齊(蕭齊)、南梁(蕭梁)、陳
   *北朝:北魏(元魏)、東魏、西魏、北齊、北周
   *隋
   *唐
   *五代:後梁、後唐、後晉、後漢、後周
   *十國:前蜀、後蜀、吳、南唐、吳越、閩、楚、南漢、荊南、北漢
   *宋
   
* Datecode查詢為id碼(d59356235935651)返回查詢系統
</syntaxhighlight>
[[#(3)時間<date>|返時間]]
 
(4)"群組"的標記
 
 ●網底顏色區分:粉紅底→代表群組
       蘋果綠→代表個人
 
<syntaxhighlight lang="XML">
●規範資料"群組"的建置
  人名群組:<persName key="G000001">...</persName>
  地名群組:<placeName key="CN0000000G01AA">...</placeName>
</syntaxhighlight>
 
====建置【來源出處】注意事項====
 
  ● 出處在''' CBETA''' 者。請建置在「新增來源資料」''' CBeta''' Links欄位中
 例如:X65no1295_p716a23
 
  ● 出處在''' 文本''' 者。請建置在「新增來源資料」 ''' Source'''  Links欄位中
 例如:g017p0036
 
  ● 「註解」中來源出處請使用'''全形標點符號''',如下所示:
 ,。、;:!?.「」『』()《》〈〉…… 標點符號用法,可參  http://www.edu.tw/files/site_content/M0001/hau/c2.htm 。
'''注意事項''': 
1.生卒年中「-」連接號使用'''全形標點符號'''。例如:通容(1593-1661)。
2.每一個別名之間以「;」分號(半形或全形皆可)隔開。
 
  ● 「註解」內容之來源出處請使用'''全形標點符號''',並參照以下範例:
 一.同一來源出處請使用「全形'''、'''頓號」標點符號隔開
 例1:佛光:480、405
 例2:(http://baike.baidu.com/view/322497.html、http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw,2008.12.23)
 二.不同來源出處請使用「全形''';'''分號」標點符號隔開
 例1:佛光:480;佛百:4053.1
 例2:(http://baike.baidu.com/view/22260.html,2008.12.02;佛光:480;http://baike.baidu.com/view/1225413.html,2008.12.23)
 三.日期前的標點符號請使用「全形''','''逗號」隔開
 例1:(http://baike.baidu.com/view/22260.htm,2008.12.02)
'''注意事項''':
1.使用網路出處來源,需注意其穩定性及權威性。建議參照使用'''Authority'''所提供網路資料[http://share.foxmarks.com/folder/rss/osyCa6r9nX'''Authority''']。
2.出處來源中的網址,需注意其長短,避免網址太過隴長EX:短:http://zh.wikipedia.org/wiki/雷峰 EX:長:http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw
 
====代名詞==== 
<syntaxhighlight lang="XML">
1.標記時機:當詞意不明顯時才要標
 
2.代名詞的標法:<ref key="Axxxxxxx">代名詞</ref>
  例如:<ref key="A003940">余</ref>(A003940指徐時泰)
    
3.由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
  皆不用再重複標記。
</syntaxhighlight>
[[#簡介及目的(春玉)|返目錄]]
 
====註解==== 
<syntaxhighlight lang="XML">
1.純文字的註解
  標法:<note resp="ddbc.da">註解文字</note>
  例:崇禎乙亥仲春甲戌日<note resp="ddbc.da">據查,崇禎乙亥仲春無甲戌日。</note>(g086p0144)
 
2.文字加連結的註解(有做連結)
  標法:<note resp="ddbc.da">註解文字(<ptr target="網址"/>,日期)</note>
  例:應案<note resp="ddbc.da">「案」字,萬福禪寺網站此處作「索」。(<ptr target="http://www.huangboshan.com/zisusifu.htm"/>,2010.05.04)</note>屐而自潸。(g010p0445)
 
3.註解取自CBETA資料時
  標法:<note resp="ddbc.da">CBETA經文(資料擷取的起始行號)(<ptr target="CBETA此經網址"/>)
 例:其幹化機<note resp="ddbc.da">「其幹化機」,《補續高僧傳》卷15作:「共斡化機」(X77n1524_p0477a17)(<ptr target="http://www.cbeta.org/result/normal/X77/1524_015.htm"/>)</note>(g010p0400)
 
 
其他事項:
(1)標題內的註解,請置於<head>內。
  例:g086p0145<head>于黃檗丈室堂第三代隱元隆琦國師 入院法語五則 上堂九則 機緣三則 序二首 書啟五篇 規文一則<note resp="ddbc.da">按:標題為上堂法語九則,機緣三則;內文實則為上堂法語八則,機緣五則。</note></head>
</syntaxhighlight>
 
====內文漏字或難以辨認時====
 
* 標法參考以下網頁:
  http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/ref-gap.html#
  範例:2個圓圈刪去,輸入<gap extent="2" unit="chars" reason="lost"/>
     extent: 被省略的文字量  unit: 資料型態
 
 
====勘字====
<syntaxhighlight lang="XML">
(1)sic 訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
 
(2)reg 通用字標記:
A:(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
   (2)通用字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">通用字</reg></choice>
 
B: <reg>標記(打不出來的,unicode編碼系統字有的,或有通用字的字):
選字原則:1.義同、字形接近。2.部首接近。3.筆畫接近。
例:[王*尒]:<reg>珎</reg>珠色(珍珠色)
  [穴/怱]:<reg>窓</reg>子(窗子)
 
 
 
</syntaxhighlight>
 
====圖檔或圖檔內有文字標記法====
<syntaxhighlight lang="XML">
印章(視為圖檔)標記法如下:
<figure>
   <figDesc><signatures></signatures></figDesc>
   <graphic url="1B020P024.jpg"/>
</figure>
</syntaxhighlight>
 
<syntaxhighlight lang="XML">
<figure>
  <head>標題</head>
  <figDesc>讓此表可以檢索到的圖說,以半形標點符號間隔文字</figDesc>
   <graphic url="3B004P001.jpg"/>(註:圖檔檔名內之P為大寫,頁碼為三碼)
</figure>(己有掃瞄圖檔故圖不顯示)
</syntaxhighlight>
 
====內文去多餘空格或照書斷行的作法====
 
  * 照書斷行需去空白的作法(清除折行多餘空格):
   1.使用doConcat.py程式
   2.程式存放路徑:Y:\Projects\fosizhi\work\tools\cleanBK
   3.將要處理的檔案放在srcXml資料夾內(mian檔不須放)
   4.利用FreeComander內的"DOS視窗"執行doConcat.py程式
    Y:\CND\Projects\work\tools\cleanBK>doConcat.py(按Enter)
   5.再到output資料夾中,就可看到轉好的新檔案了
 
====表格====
<syntaxhighlight lang="XML">
*表格
  表格的標記,有:<table><head><row><cell>(<head>請包在<table>內)
  表格跨頁時:若有合併列,須加算1列合併,以安置頁碼。
  表格合併列:<cell rows="列數">
  表格合併欄:<cell cols="欄數">
 
*例子
<table><head>五時、四教、筌罤、魚兔</head>
<row><cell rows="2">一、約部義</cell><cell>前四時</cell><cell>筌罤</cell></row>
<row><cell>今法華</cell><cell>魚兔</cell></row>
<row><cell rows="2">二、約教義</cell><cell>前三教</cell><cell>筌罤</cell></row>
<row><cell>今圓教</cell><cell>魚兔</cell></row>
<row><cell rows="2">三、約解義</cell><cell>言說教</cell><cell>筌罤</cell></row>
<row><cell>契妙理</cell><cell>魚兔</cell></row>
<row><cell rows="2">四、約行義</cell><cell>玄句開解</cell><cell>筌罤</cell></row>
<row><cell>止觀立行</cell><cell>魚兔</cell></row>
<row><cell rows="2">五、約玄義</cell><cell>釋名宗用教</cell><cell>筌罤</cell></row>
<row><cell>諸部經體</cell><cell>魚兔</cell></row></table>
 
</syntaxhighlight>
[[#簡介及目的|返目錄]]
 
====標記問答====
 
=====標題<head>的標法=====
 
● 標題後有副標題的標法? 
  例:<head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
    註:seg(隨機分割) 包含文件中任何隨機字詞層次的單元。
      rend表示"如何呈現"
 
● 文本文章無標題時,自加標題的標法?
  <head resp="ddbc.da">自加標題</head>
 
=====其他標記=====
<syntaxhighlight lang="XML">
 
● 書法草書字體無法辨認時
  <gap extent="1" unit="chars" reason="illegible"/>
 
  gap: 文字漏字或漏段的標記
 漏字 <gap extent="1" unit="chars" reason="lost"/>
 漏段 <gap extent="unknown" unit="chars" reason="lost"/>
 
● <div></div>文本的正文前資訊、正文、及正文後資訊的分段
 
● <p></p>段落開始與結束
 
● <lb/>分行;新起行之意
 
● 宗派(例如賢首宗)及普門菩薩是否標記?
A:不標
 
● 寺院內建築(例如華嚴經閣)是否標記? 
A:重要者可標。
 
●名勝是否需建置? 如:潮音洞,蓮花洋。
A:可不標,但如找得到,亦可標。
 
● 內文中提到的相關「著作」是否標記?
A:不標。
 
● 格式問題:是否照書編排?
A:"敬格"統一都不須空格,而不需再標<space>。
 
● 文字出現於兩行的行中時,是否照文本排版標記?
A:不用照原文排版
 
● 並列文字的標法
A:不作並列處理。需要時可用()或標記縮小字<seg rend="font-size:small">。
 
● 文章中所有小字的標法?
A:全標以<seg rend="font-size:small">(小字)</seg>
ps. <seg>的標法,是著重在「樣式」(小字)上的呈顯,而非「意義」上的表示。
 
● 人名權威建檔,製作資料來源(source)是否登錄?
A:不必登錄,規範資料庫檢驗通過後,將自動冠上每志的第一筆出處。
 
● 引語是否需標<cit><quote>?
A:否
 
● <lg><l>的注意事項
A:<lg><l>與<p>是對等地位,故不可包在<p>中。應結束</p>後,再標<lg>。
 
● 遇人名不確定是否為某人時,可加屬性值標示。
 例:<persName key="A001606" cert="70%">
   cert 是表示標記者認為的正確度,是相對值,非絕對的。
 
● 文末的"印"是否需標記?
A:目前不標
 
● <author>與<docAuthor>之異同?
A:<author>在<body>內無法valid,可用<byline><persName type="author">唐王勃</persName></byline>標記作者
  suggest: <docAuthor>指題名頁的作者, <author>指內文的作者以為區別
 
● note: 若印刷錯誤,文字內容重複時
A:可用[註]標示。
 例:<note resp="ddbc.da">此段重複「文本重複的文字」</note>,但若有跨頁,頁碼要放在note的外面。
 
● 當詩詞跨頁時
A:照書換頁,不用顧及排版問題。
 
●文本若出現超出標記可處理的範圍,可不標句讀。
A:須於<teiHeader>作一個說明程式。例如:元朝蒙文語譯,未標句讀。
 
● 若無從考證的地名,是否建置地名規範資料?
A:若無從考證的人地名,不用建置人地名規範資料,但可標記<placeName key="unknown">。
 
● 「南海補陀山寶陀禪寺」的地名標記。
A:南海補陀山<placeName>寶陀禪寺</placeName>。
 
● 標點符號。
  a)經謂:「莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。」
  b)經謂:莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。
  c)經謂,莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。
A:若是經文原文引用,則用a,若是意義引用,則用b,不可用c。
 
● space的單位(chars)有2種:
  1) <space quantity="1" unit="chars"/>:表達的是一個英文半形的距離。 
  2) <space quantity="1" unit="chi_chars"/>:表達的是一個中文全形的距離。
 
● 若文內只有天干地支,但沒有年,是否須標記?
A:不用。
 
● 《昌國典詠》書名內的地名,是否需標記?
A:可不標。
 
● 同一頁出現第二次相同的人名、地名、時間時?
A:1)在同一段落內即不標,同一頁不同段落亦應標。
   2)可全標(此為馬老師後來開許的)
 
● 庵,堂,院,塔,閣,觀,館,以上是否為建築物?
  A:若找得到,盡量標。
 
● "隩"是否需標記,如:梵隩, 雨華隩, 吉祥隩?
   (隩:昔為淺海,後飛沙日積,漸成邱阜。)
  A:若找得到,盡量標。
 
● 光緒末年,應是德宗&恭宗加起來的末年,而不是各自分開的末年。
  a)光緒末年,指的是光緒年最後的1/4。
  b)志偉:若有數個,則取最長的那一個末年,如上則取德宗光緒的末年。
   (問題是:所標的末年無法包含到光緒的最後一天)
  c)阿賢:程式無法做到一個年號只有一個末年,請各位自己計算。
  A:b)通常指的年號,意指某皇帝的年號而言。
 
● <reg>(一般化)標誌一般化或規格化處理過的文字。
  非unicode的字,但可在教育部異體字網站找到它的通用字。
 
● CBETA資料的引用格式
 例:著作郎顧允祖文<note resp="ddbc.da">《集神州三寶感通錄》卷1:「著作郎顧胤祖文」
    (CBETA, T52, no. 2106, p. 405, a17)</note>
 
● 印章的標記
  <stamp> 包含一個字詞,描述一個印記或是類似圖案。
  例:乾隆御覽之寶<stamp>清乾隆玉璽</stamp>
 
 
 
 
 
 
</syntaxhighlight>
[[#標記問答|返標記問答-第一題]]
 
===缺字處理流程===
 
缺字定義:
 凡古字打不出來的,又非unicode編碼系統字者,則作缺字處理。
 台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
 別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml
 
 
#[[#1.判斷是否為缺字|判斷是否為缺字]]
#[[#2.圖檔處理|圖檔處理]]
#[[#3.缺字標記|缺字標記]]
#[[#4.介面輸入|介面輸入]]
#[[#5.缺字上傳|缺字上傳]]
#[[#6.相關知識|相關知識]]
 
====判斷缺字原則====
<syntaxhighlight lang="XML">
Unihan網站:http://www.unicode.org/charts/unihanrsindex.html
* utf-32:U+20000- U+2A6DF:中日韓統一表意文字擴展B區
* utf-32:U+2A700-U+2B73F:中日韓統一表意文字擴展C區
* utf-32:U+2B740- U+2B81F:中日韓統一表意文字擴展D區
. Decimal:6400以上
  (以上皆屬Extension B以上的字,可直接貼在文本。)
 
1. 如果一個字有不同寫法,具特別意義則要做缺字
2. 可判斷是那個字,只是寫法不同:
 2.1 字形略為有異,但筆順、筆劃、音、義皆與現行使用的字相同,則不作缺字,例:《阿育王山志》p.429指   p.431兩
 2.2 字型有異,其筆順及筆劃與現行使用的字不同,但音、義皆同,需作缺字,例:《阿育王山志》p.430尋  p.432瓦
3. 寫法很奇怪,但可判斷出是什麼字
例如:最p0101、投p0173、備p0124
==>用通用字
4. 為某種原因而做的文字,例如公諱或私諱字
==>以缺字處理
5. ==>書法字不用做缺字
 
</syntaxhighlight>
 
====尋找缺字順序====
 
1. 將[](代表所要處理的缺字)放進CBETA 漢字資料庫 查詢(以字查字)找到對應的異體字,連結到unihan網站,建立缺字檔。
 
2.若CBETA 漢字資料庫 查無此字時,則到unihan網站查詢。
(1) 選擇部首筆畫→點選部首→填上部首外筆畫→勾選Use text →submit
(2) 若找到符合的字,建立缺字檔。
 
3.若CBETA 漢字資料庫、unihan網站皆查無此字時,則到教育部異體字字典網站查詢。(先用通用字查詢,例:余)
(1) 選擇部首筆畫→點選部首→點選部首外筆畫
(2) 若找到符合的字, 建立缺字檔。
 
4.若前三個網站皆找不到此字時,則直接建立缺字檔。缺少的項目則不用填。
 
====圖檔處理====
  (1)unicode網站如果有圖檔,請第一優先download用此字圖。
  (2)不採用教育部異體字圖檔。
  (3)若此字為unicode所無,則用Gimp工具,裁切文本掃描原始檔(.tif)作為字圖。(作法如下)
=====利用Gimp軟體處理缺字圖檔=====
<syntaxhighlight lang="XML">
【98.01.19 Erica】
 *裁切掃瞄檔缺字步驟
(1)開啟Gimp功能表「檔案」.
(2)點選「開啟」.
(3)選擇掃瞄檔案ex:2Book022(路徑:Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff)中缺字頁碼.
(4)放大圖片以利裁切:點選「顯示」選擇「縮放1:1(100﹪)」.
(5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆).
(6)將「剪裁」圖形移至缺字字體,確認位置後在選取的字框內點選滑鼠左鍵2次,即出現裁切之缺字圖檔.
(7)設定圖片尺寸:點選「影像」選擇「縮放影像」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成.
 
 *針對已下載缺字圖片設定尺寸之轉檔步驟
(1)開啟Gimp功能表「檔案」
(2)點選「開啟」(路徑:先前已下載的缺字圖檔ex:btg×××××××××.jpg之資料夾)
(3)設定圖片尺寸--點選「圖片」選擇「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(4)點選「檔案」選擇「另存新檔」並提供檔名ex:btg×××××××××.gif再點選下方「Gif影像檔」按「儲存」後,即出現另一視窗請不要勾選任何選項按「儲存」即完成.
</syntaxhighlight>
 
 
 
[[#簡介及目的(春玉)|返目錄]]
 
====缺字標記====
<syntaxhighlight lang="XML">
●缺字標記(打不出來的,非unicode編碼系統字的,又無通用字的字):
<g ref="#btg086001701"/>
字圖檔案命名原則:btg+志碼3碼+頁碼4碼+序碼2碼(序碼:此頁第幾個缺字)
 
 
 
 
</syntaxhighlight>
 
====介面輸入====
(a)缺字id編碼原則: btg086(志名)0327(頁碼) 01(第幾個缺字)。目錄缺字id:btgcal(目錄)XXXX(頁碼)XX(第幾個)
(b)登入缺字網頁[http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020]
(c)取碼目的:取得缺字碼<g ref="#btg086001701"/>標記內文及建置缺字組
(d)建置步驟說明:
  (1)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (2)產生缺字id後,即可輸入缺字資訊(如e).
(e)完成後,按「更新資料庫」.
(f)輸入缺字資訊須知,說明如下:
  (1)<glyph xml:id="btg086033701">: 為缺字id碼。
  (2)<glyphName>: 為unicode編碼。
    ●到 [http://www.unicode.org/charts/unihanrsindex.html unicode網站 ]找cjk(Decimal)之下方編碼,例如:CJK IDEOGRAPH 15181
    ●其cjk(Decimal)之編碼=<mapping type="unicode">15181</mapping>
    ●若查無unicode編碼資料,請點選「Non Unicode Character」即可.
  (3)<charProp>: 標記<value>發音。
    ●到 [http://www.iq-t.com/SYSCOM/pingying2.asp 漢語拚音字典 ]找漢語拼語,一律小寫,第幾聲用數字表示(一聲、二聲、三聲、四聲、輕聲 = 1、2、3、4、5),不知發音者以問號表示。
    ●<charProp>表示字的屬性、表達方法。比如說注音、發音。
  (4)<mapping type="cbeta">: 為組字式。
    ●組字方式均由 CBETA maha 統一組字,請參閱 [http://dict.cbeta.org/word2/search.php CBETA漢字庫 ]打通用字或組字式以獲得組字式與CB碼。
  (5)<mapping type="cbetaNo"> : 為cbeta的CB碼。
    ●若查無CB碼資料,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入 maha 字樣即可.再以一志為單位,統一由程式人員:小花 處理.
    ●若 CBETA maha 回覆不收錄至CBETA漢字庫時,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入<不收錄至CBETA 漢字資料庫>字樣即可.
  (6)<mapping type="unicode"> : 為unicode編碼。
    ●Mapping說明:<mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、組字式、unicode碼。cjk與Unicode(id=decimal)的關係猶如cjk=一年甲班,Unicode=10號。
  (7)<mapping type="MoEvariant"> : 為教育部異體字編碼。
    ●到 [http://dict.variants.moe.edu.tw/suo.htm 教育部異體字網頁 ]找編碼。例如:b02420-001
    ●注意:沒有Undicode的字才要登錄教育部異體字編碼。
  (8)<add a note>: 為註記資訊用
    ●輸入 maha 字樣 : 申請缺字收錄至CBETA 漢字資料庫。目的:索取CB碼及組字式。
    ●maha回覆訊息後,提供註記「不收錄至CBETA漢字庫」或「這是BIG5系統字「丱」資訊用。
(e)完成後,按「更新資料庫」.
 
====缺字給 CBETA Maha製作流程====
(1)請Maha幫忙製作缺字 無CB碼、無組字式 者
(2)須製作(1)的二點資訊者,於缺字介面note註明maha
(3)小花再以note註明的maha 彙整送給maha
(4)缺字資訊的note寫法可參考缺字介面的(8)<add a note>: 為註記資訊用
 
====缺字上傳====
(1) FTP informations:
   session:fosizhi
   host name:10.10.0.49
   user name:april  
   password:m4tjp
 
(2)上傳位置 
  從 Y:\Projects\fosizhi\images\gword\
  到 0:/fosizhi/public_html/gword/
 
(3)從dev 到informatics 上傳時間為一週
 
====相關知識====
. 在unihan找到該字要貼到oxygen時
  將unihan找到該字以notepad++貼上,再以notepad++叫該檔即可
 
. 如果缺字在介面如法顯現,請安裝字型
  Y:\Projects\fosizhi\work\tools\字型\unicode字型\HAN NOM B(A).ttf
 
====缺字呈現順序====
‧unicode
 
‧通用字(異體字)
 
‧組字式
 
====關於EX_B在文本的處理方式====
<syntaxhighlight lang="XML">
 
1)直接貼在文本上,不作缺字庫。(非Ex_B的字,仍需作缺字庫。)
2)按oxygen上已設定好的gaijihandler。
 a)尋找所有的<g/> 並判斷它是否為unicode的缺字。(變更之前已標記的缺字。)
   * 如果有unicode,則換成<c/>。
   * 沒有的話就保持<g/>的形態。
  b)尋找文本中,所有標記人員編輯或貼上的ext-b uni-word,程式找到後會直接加上<c/>。
 c)在執行程式前會備份一次所有的xml。
3)ex:以<g ref="#btg008000701"/> 為例,會被變更為 <c n="U+223BF,btg008000701">𢎿</c>
 
 
</syntaxhighlight>
 
===驗證===
 
1. main的檔頭有用all.nrc刪除
2.schema路徑
  Y:\Projects\fosizhi\gazetteerSchema\schema\.rnc
3.設定Schema路徑操作說明如下:
  a)在Oxygen功能表上方,點選Document中valid--Exteral validation。
  b) 在validate with 視窗 選擇RelaxNG schema。
  c)於URL選擇設定schema路徑(參考2.)後按確定即可。
4.回到main檔按Oxygen功能表上方的紅勾勾驗證(沒有點點的)確認已valid及確認其他卷well formoed
5.開啟eXist程式上傳
6.若樹狀結構有變更,請先更新節點[http://10.10.0.49:8080/fosizhi_json/?更新節點頁面]
7.開啟佛寺志網頁,按重新整理即可。
 
====規範資料庫檢查(洪老師撰寫的程式)====
occured in 人名出現的原則
1. 不同志,有別名=每一筆都會出現
2. 不同志,同名=每一筆都會出現
3. 同志,有別名=每一筆都會出現
4. 同志,不同卷,同名=只會出現第一筆
 
===xml轉html===
 
安裝oxygen 9.1
由gxxx_main.xml主檔 呼叫html.xsl
 
1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形)
  進入轉檔介面,選New(第一次建立html檔後,
  若所設定的路徑都沒變動的話,以後直接點Transformation now即可;
  若有要更改路徑的話,點Edit進入介面去修改即可)
2.進入Edit scenario 介面
  a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl)
  b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK
3.此時進入到下一個介面,點Transform now,即可產生html檔案
4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾
 
安裝 exist.jnlp 上傳檔案
 
1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
   (1)main主檔要經valid驗證 --沒有點點的紅勾勾
   (2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
   請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(單卷)→Select files or directories store →Close
 
● 佛寺志網址: http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g008
 
 
● 更改節點網址: http://10.10.0.49:8080/fosizhi_json/
 
● HTML檔介面定案:人名/地名/時間 分三種顏色。
  例如:  地名 與 地名代名詞<ref>--------綠色
     時間 與 時間代名詞<ref>--------藍色
     別名 與 人名代名詞<ref>--------紅色
     人名(常名)--------------------加底線 (紅色)
 
 
 
 
===上傳===
<syntaxhighlight lang="XML">
使用方法:
(一)將欲上傳的檔案(連同整個資料夾),放在Y:\Projects\fosizhi\eXist_upload中
(二)打開上傳網頁http://dev.ddbc.edu.tw/fosizhi/upload/index.php
    1.填上帳號fosizhi,密碼amituofo
    2.點選"重新檢視"(將會看到預備上傳的檔案)
    3.點選"上傳XML"(不用理會之後出現的Validation Error! )
     Upload successful!
</syntaxhighlight>
 
===建立參考書目===
 
●中研院書目參考網址:http://74.125.95.132/search?q=cache:JpyJD9HKveUJ:saturn.ihp.sinica.edu.tw/~dahcr/916c5-b4.doc宋人傳記資料索引&cd=8&hl=zh-TW&ct=clnk
 
●參考書目人名與書名的中英文寫法<author><hi>Wei</hi> Songshan 魏嵩山</author><title>Zhong Guo Lishi Diming Dacidian 中國歷史地名大辭典</title>
 
●內文「註」的參考書目寫法(april 9/3)例如:趙一新總編。《杭州佛教文獻叢刊‧慧因寺志》卷七。 (杭州出版社,年代)  參考網址 http://www.ddbc.edu.tw/zh/academic_publishing/submissions_format.html
 
●存放路徑
Y:\Projects\fosizhi\gazetteerXml\bibliography\gazetteerBibl.XML
 
● 處理人員:參與此專案有參考到任何書籍者
 
==標逗==
<syntaxhighlight lang="XML">
 
●討論「書名」與「詩篇名」的標符樣式(雙《》與單〈〉)(miao 01/13)
 
  http://www.edu.tw/files/site_content/m0001/hau/h12.htm  (道厚2/23)
 四、歌曲名:
            
  (一)《臺灣民謠專輯.望春風》
  (二)〈望春風〉
  (三)〈四季紅〉
  (四)〈紅河谷〉
 
 五、詞牌、曲牌名
  (一)〈水調歌頭〉(詞牌名)
  (二)〈虞美人〉(詞牌名)
  (三)〈天淨沙〉(曲牌名)
  (四)〈一枝花〉(曲牌名)
決議:
1)若在句子內則要標上《》〈〉.
2)若在<head>內則不用標上《》〈〉
3)若在<head>內有除了書名及詩篇名以外的文字時,則書名或詩篇名則要標上《》〈〉.ex:論《論語》
 
●偈頌是否使用標點符號? (miao 01/13)
http://www.haoshici.com/  (道厚2/23)
回覆:需標點符號。
 
 
 
 
 
</syntaxhighlight>
 
==一般行政==
1. 電腦維修由春玉統一回報資訊組窗口
1. 電腦維修由春玉統一回報資訊組窗口
 報修人員並在google文件中,填妥報修情況資訊
 報修人員並在google文件中,填妥報修情況資訊
==待解決問題內部討論==
<syntaxhighlight lang="XML">
-------------------------------------------
以下為阿賢待處理事項:
sophia:
  1.metadata目錄介面有LOST。(sophia 10/15)
  g018p0001之前的資料皆未出現在左方樹狀結構,但有metadata資料。
  http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g018
  g037p0001,g051p0001亦然。
 
2.<closer>內頁碼需improve。 (sophia 1/20)
以下紅色字為p.0751的頁首,因整段全包在closer內,故在html上出現在p.0750。
http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g089&cpage=0751
咸[湻=淳]甲戌十月朔旦,迪功郎新寶應軍歲學教授石余亨記,朝奉大夫權戶部尚書兼詳定勅令官浙西安撫制置使兼和臨安府曾淵子篆蓋,當寺僧端楷集,元章米芾書。
p.0751
(元)僧梵琦〈娑羅軒記〉
<closer><date key="j21866902186690" when="1274-11-07">咸<choice><orig>湻</orig><reg>淳</reg></choice>甲戌十月朔旦</date>,迪功郎新寶應軍歲學教授<persName key="A018611">石余亨</persName>記,朝奉大夫權戶部尚書兼詳定勅令官浙西安撫制置使兼和臨安府<persName key="A018613">曾<pb facs="3B010P084.jpg" n="0751"/>淵子</persName>篆蓋,當寺僧<persName key="A018610">端楷</persName>集,<persName key="A004610">元章米芾</persName>書。</closer></div>
   <div><head>(元)僧<persName key="A001082">梵琦</persName>〈<placeName key="CN0331023T41AB">娑羅軒</placeName>記〉</head>
3.<figure>內的head無法顯示在左方樹狀結構。(sophia 1/29)
http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g049&cpage=0021
p.0021
普賢菩薩
p.0022
<div><pb facs="1B045P040.jpg" n="0021"/><figure><head>普賢菩薩</head><graphic url="1B045P040.jpg"/></figure></div>
</syntaxhighlight>
==最新公告==
&quot;請註明紀錄者姓名及日期&quot;
<syntaxhighlight lang="XML">
</syntaxhighlight>
[[#簡介及目的(春玉)|返目錄]]
==test==
===缺字應對處理表===
<xml code>
通識:對於所有難辦字,第一優先是尋查有無unicode字。而後,再根據文字本身
或搭配前後文判斷,若此字易於辨識者(不管有無unicode字),則不做任何標記。
反之,則需視情況而標記<reg>或<choice>。
若難辨字無unicode字,無通用字,則標<g>。
</xml>
{| border="1" cellpadding="2" cellspacing="0"
!文本狀況
!
!
!標記方式
!例字
|-
|易於辨識
|文字本身易於辨識
|少一撇、多一點
|不標記
|播,余
|-
|易於辨識
|文字本身易於辨識
|刻版慣例、書寫習慣
|不標記
|於,所
|-
|易於辨識
|搭配前後文易於辨識者
|
|不標記
|關,賴
|-
|不易於辨識
|文字本身不易辨識
|有unicode字,有通用字
|<choice><orig>㝎</orig><reg resp="ddbc.da">定</reg></choice>
|㝎=定
|-
|不易於辨識
|文字本身不易辨識
|無unicode字,有通用字
|標<reg>通用字</reg>
|[耳*力]<reg>助</reg>
|-
|不易於辨識
|文字本身不易辨識
|無unicode字,無通用字
|標<g ref="#圖檔檔名"/>
|
|-
|文字本身有歧義
|文字本身雖為一般字,但另有別義,非當一般字義解,易使讀者誤會句意者。
|
|標<choice><orig>縣</orig><reg resp="ddbc.da">懸</reg></choice>
|
|}

於 2021年4月27日 (二) 09:47 的最新修訂

《中國佛寺史志》數位典藏工作手冊
Archive of Buddhist Temple Gazetteers(Service manual)

簡介及目標

一、簡介:
  佛寺志是一種獨特而重要的文獻,其主要內容有:佛寺歷史沿革、建置、高僧行誼、語錄、法脈傳承、感應事跡、碑記詩賦藝文等。20世紀有兩大套木刻版寺志叢書印刷,此二套叢書所收之佛寺志,或為手抄本,或為各國圖書館唯一藏本,世所罕傳,彌足珍貴,被譽為「續大藏未竟之偉業,出佛教史料之遺珍,集寺院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻記載之不足,使漢傳佛教在時間、空間與內容的研究資源上更加完備。
  適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助,自2008年起開始著手以下二套叢書之數位化工作:
  1.《中國佛寺史志彙刊》(110冊;100志):台北.明文出版社、丹青圖書公司,1980-1994,杜潔祥主編
  2.《中國佛寺志叢刊》(130冊;197志):揚州.廣陵書社,2006,張智、白化文等主編

二、目標:
  本專案的數位化目標,乃欲將200多座寺志建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老寺志的新版本,運用科技得以長遠保存,而有助於佛法的弘化。

進程及人力

進程:
第一階段(97年~99年):
 1. 建置二套叢書後設資料庫(metadata)。
 2. 設立DILA中國佛寺志網頁(開發版和推廣版)。
 3. 二套叢書完整掃描,提供網頁瀏覽、下載。
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀,及相關人名、地名資料連結。

第二階段(100年~101年):
 1. 執行出版「中華佛寺志叢書」計畫。(12部寺志,共15冊)
 2. 複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇。

第三階段(102年):
 進行明丹本85部寺志之初階標記。

第四階段(103年~104年):
 進行廣陵本124部寺志之初階標記。

第五階段(105年~108年):
 進行明丹本寺志之點校,以製成更便利後人閱讀的版本。
 1. 105年:點校18部寺志,約120萬字。
 2. 106年:點校4部寺志,約60萬字。
 3. 107年:點校12部寺志,約71萬5千字。
 4. 108年:點校9部寺志,約60萬字。

人力:
 時程控管 1人
 程式設計 2人
 標記人員 3人
 後設資料建置人員 1人
 義工 1人

執行單位

執行單位:法鼓佛教學院數位典藏組
主持人:Marcus Bingenheimer 馬德偉博士(97年~102年)、洪振洲博士(102年~108年)
時程及預算控管:柯春玉(97年~102年)、林智妙(103年~108年)
程式及介面撰寫:花金地、李志賢、周邦信
標記技術人員:林智妙、林綉麗、王秀雯、游美燕、何易儒、詹麗春
新式標點人員:蔡謀芳、張革丰
佛學規範資料庫維護人員:闕慧貞、葛賢敏

參考工具

1 網頁工具
 1.1 文本介面
 1.2 規範資料庫
 1.3 工作手冊
 1.4 TEI 網站
 1.5 漢字處理
 1.6 辭典類
 1.7 標點符號用法
 1.8 人名查詢
 1.9 地名查詢
 1.10 時間查詢
 1.11 綜合查詢
 1.12 古籍文獻資料庫
 1.13 學校相關網頁
 1.14 在Y公共磁碟區上的工具檔
2 操作技巧
 2.1 幾個快捷技巧
 2.2 在Oxygen下
 2.3 在Oxygen xpath下
 2.4 標記元素中文化
 2.5 wiki 語法

前置作業

1 叢書目錄建立
2 地理資訊建立
3 文字輸入
4 文字校對
5 掃描
6 Metadata建置

標記作業

1 工作準備
2 檔案架構
3 加facs碼
4 段落形式
5 標記元素
6 字元層次
7 標記問答
8 佛寺志PDF版
9 佛寺志粗標

點校作業

佛寺志點校
1. 佛寺志點校須知_Oxygen作業
2. 佛寺志點校須知_txt作業
3. 佛寺志異體字處理規則(2018年版)

python程式的應用

特字處理

規範資料驗證

上傳到FTP

輸出佛寺志的純文字檔

1.在ruby資料夾下執行ruby x2t.rb

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb

2.純文字檔將會產生在output資料夾內

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text

3.將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。

Github版本管理操作說明

《Pro Git》繁體中文翻譯

如何取得以前的某個版本

1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
2.選擇想要的版本 => 按右鍵 => Create Branch at this version
3.輸入 branch 名稱 (自己可以訂) => ok => 可關掉這個視窗
4.回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
 (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
5.在branch欄點選想要的版本(切換branch)=> ok=> close
6.回到專案資料夾 => 將需要的文件複製出來
7.在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱(確定已切換回 master版本)
8.(若有必要時,可將複製出來的文件貼回master版本文件中。)

如何取得以前的某個版本(單一檔案)

1.在想要擷取的檔案或資料夾(例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
2.點選想要的版本
3.在下方欄位中會出現當次push的檔案,點選想要的檔案,再點滑鼠右鍵
4.點選Save revision to...,儲存到自己指定的路徑
5.關掉log messages,到自己指定的路徑去便可看到下載的檔案

如何刪除某個 branch

1.在整個專案資料夾上按右鍵 => TortoiseGit => Git GUI =>
2.(功能列上)Branch => Delete => Local Branches欄內點選要刪除的分支名稱=> Delete =>關掉Git GUI視窗

xml轉html

建立參考書目

Metadata

發行

佛寺志網路版

佛寺志紙本書

 中華佛寺志叢書〈12部寺志,共15冊〉
 ISBN:978-957-17-2177-4
 出版社:新文豐
 出版日:2013/06/01
 內容:
    01. 清涼山志
    02. 峨眉山志
    03. 重修普陀山志
    04. 普陀洛迦新志
    05. 九華山志
    06. 天台山方外志
    07. 明.明州阿育王寺志
      清.明州阿育王續志
    08. 寒山寺志
    09. 玉岑山慧因高麗華嚴教寺志
    10. 黃檗山志
    11. 泉州開元寺志
    12. 雞足山志

一般庶務

1. 電腦維修由春玉統一回報資訊組窗口 報修人員並在google文件中,填妥報修情況資訊