「名山古剎-《中國佛寺史志》數位典藏」:修訂間差異

出自DILA Wiki
imported>Ericayu0725
imported>Jiayu.xu
無編輯摘要
 
行 1: 行 1:
==[http://ybh.ddbc.edu.tw/tmp_projects/btg_project/public_html/ 名山古剎- 《中國佛寺史志》數位典藏] ==
 《中國佛寺史志》數位典藏 工作手冊<br/>
Archive of Buddhist Temple Gazetteers
Archive of Buddhist Temple Gazetteers (Service manual)


==簡介及目標==
一、簡介:<br>
  佛寺志是一種獨特而重要的文獻,其主要內容有:佛寺歷史沿革、建置、高僧行誼、語錄、法脈傳承、感應事跡、碑記詩賦藝文等。20世紀有兩大套木刻版寺志叢書印刷,此二套叢書所收之佛寺志,或為手抄本,或為各國圖書館唯一藏本,世所罕傳,彌足珍貴,被譽為「續大藏未竟之偉業,出佛教史料之遺珍,集寺院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻記載之不足,使漢傳佛教在時間、空間與內容的研究資源上更加完備。<br>
  適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助,自2008年起開始著手以下二套叢書之數位化工作:<br>
  1.《中國佛寺史志彙刊》(110冊;100志):台北.明文出版社、丹青圖書公司,1980-1994,杜潔祥主編<br>
  2.《中國佛寺志叢刊》(130冊;197志):揚州.廣陵書社,2006,張智、白化文等主編<br>


  工作手冊 (請勿更動編排版面)
  二、目標:<br>
  
    本專案的數位化 標,乃欲將200多座寺志建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老寺志的新版本,運用科技得以長遠保存,而有助於佛法 弘化。<br>
===簡介及 目的===


《中國佛寺志》由杜潔祥主編,從民國69年至74年彙編完成,全套共3輯110冊。此套書所收之佛寺志或為手抄本或為各國圖書館唯一藏本,是以某地、某山、某寺為範圍的佛教史籍,是研究佛教史的重要史料。
==進程及人力==


  
  進程:<br>
第一階段(97年~99年):<br>
 1. 建置二套叢書後設資料庫(metadata)。<br>
 2. 設立DILA中國佛寺志網頁(開發版和推廣版)。<br>
 3. 二套叢書完整掃描,提供網頁瀏覽、下載。<br>
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀,及相關人名、地名資料連結。<br>


  透過便利的使用介面一一呈現圖檔、後設資料、數位全文等資源。
  第二階段(100年~101年):<br>
  且將與 漢傳 教高僧傳之時空資訊系統研究之專案 計畫 」(GIS 專案和CBETA光碟結合
   1. 執行出版 中華 寺志叢書」 計畫 。(12部寺志,共15冊 <br>
 2. 複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇 <br>


===預算===
第三階段(102年):<br>
 進行明丹本85部寺志之初階標記。<br>


  此專案預計執行 度為97~99,共計3 ,由中華佛學研究所贊助。
  第四階段(103 ~104 ):<br>
  第一年經費57萬
   進行廣陵本124部寺志之初階標記 <br>


===執 單位 數位典藏組===
第五階段(105年~108年):<br>
 進 明丹本寺志之點校,以製成更便利後人閱讀的版本。<br>
 1. 105年:點校18部寺志,約120萬字。<br>
 2. 106年:點校4部寺志,約60萬字。<br>
 3. 107年:點校12部寺志,約71萬5千字。<br>
 4. 108年 點校9部寺志,約60萬字。<br>


  進度及預算 控管:柯春玉
  人力:<br>
 程式 及介面撰寫:花金地
 時程 控管 1人<br>
 標記:林智妙、游美燕、彭川芩、何易儒
    程式 設計 2人<br>
  權威 資料 庫:闕慧貞
    標記 人員 3人<br>
  網頁美 設計:李承崇
   後設 資料 建置人員 1人<br>
經驗指導:張伯雍
   義 1人<br>


==執行 方式== 
==執行 單位==
執行單位:法鼓佛教學院數位典藏組<br>
主持人:Marcus Bingenheimer 馬德偉博士(97年~102年)、洪振洲博士(102年~108年)<br>
時程及預算控管:柯春玉(97年~102年)、林智妙(103年~108年)<br>
程式及介面撰寫:花金地、李志賢、周邦信<br>
標記技術人員:林智妙、林綉麗、王秀雯、游美燕、何易儒、詹麗春<br>
新式標點人員:蔡謀芳、張革丰<br>
佛學規範資料庫維護人員:闕慧貞、葛賢敏<br>


==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E5%B7%A5%E5%85%B7#.E5.B7.A5.E5.85.B7 參考工具]==
1 網頁工具<br>
 1.1 文本介面<br>
 1.2 規範資料庫<br>
 1.3 工作手冊<br>
 1.4 TEI 網站<br>
 1.5 漢字處理<br>
 1.6 辭典類<br>
 1.7 標點符號用法<br>
 1.8 人名查詢<br>
 1.9 地名查詢<br>
 1.10 時間查詢<br>
 1.11 綜合查詢<br>
 1.12 古籍文獻資料庫<br>
 1.13 學校相關網頁<br>
 1.14 在Y公共磁碟區上的工具檔<br>
2 操作技巧<br>
 2.1 幾個快捷技巧<br>
 2.2 在Oxygen下<br>
 2.3 在Oxygen xpath下<br>
 2.4 標記元素中文化<br>
 2.5 wiki 語法<br>


==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%9F%B7%E8%A1%8C%E6%AD%A5%E9%A9%9F 前置作業]==
1 叢書目錄建立<br>
2 地理資訊建立<br>
3 文字輸入<br>
4 文字校對<br>
5 掃描<br>
6 Metadata建置<br>


===目錄建立===
==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%A8%99%E8%A8%98%E4%BD%9C%E6%A5%AD 標記作業]==
1 工作準備<br>
2 檔案架構<br>
3 加facs碼<br>
4 段落形式<br>
5 標記元素<br>
6 字元層次<br>
7 標記問答<br>
8 佛寺志PDF版<br>
9 佛寺志粗標<br>


  中國 佛寺 彙刊1-3 輯共110冊 Bibliography 目錄建立( 妙妙)
==點校作業==
[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E9%BB%9E%E6%A0%A1 佛寺志 點校]<br>
1. 佛寺志點校須知_Oxygen作業<br>
2. 佛寺志點校須知_txt作業<br>
3. 佛寺志異體字處理規則(2018年版)<br>


  ●xml檔頭宣告
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97python%E7%A8%8B%E5%BC%8F%E7%9A%84%E6%87%89%E7%94%A8#python.E7.A8.8B.E5.BC.8F.E7.9A.84.E6.87.89.E7.94.A8 python程式的應用]==


  符合tei 標準,兩個驗證程式Schema(rng、rnc),輸出程式stylesheet
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 特字處理]==


  ●登錄項目
==[http://wiki.dila.edu.tw/pages/%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E9%A9%97%E8%AD%89#.E8.A6.8F.E7.AF.84.E8.B3.87.E6.96.99.E9.A9.97.E8.AD.89 規範資料驗證]==
     <bibl>
      <title>
      <biblScope>
      <spanGrp>
      <respStmt><name><date>
     <edition><date when="">or<date notBefore="" notAfter="">


  ●加入kml於目錄中
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E4%B8%8A%E5%82%B3%E5%88%B0FTP 上傳到FTP]==
  於</bibl>結束前加
  <note type="place">河南洛陽</note>
  <note type="longlat">34.7203(緯度),112.6193(經度)</note>
  </bibl>


===共八個 Keying 外包打 加粗標 (春玉)===
== 輸出佛寺 的純文 ==
1.在ruby資料夾下執行ruby x2t.rb
  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb


  ●外包打 加粗標
2.純文 檔將會產生在output資料夾內
   * 明州阿育王山志一 N29.859 E121.745
    檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text
 
   * 明州阿育王山志二,續志
  
   * 重修普陀山志 N29.9835 E122.3795
  
   * 玉岑山慧因高麗華嚴教寺志 N30.2304 E120.1259
  
   * 泉州開元寺志N24.9232 E118.5837,
    
   * 廈門南普陀寺志N24.4424 E118.0929
  
   * 雞足山志 N25.9704 E100.3745
  
   * 雞足山志
  
   * 黃檗山寺志N25.5845 E119.2715


===轉粗標為正確的標記===
3.將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。
pb+p


=== 掃瞄檔列印(筆一校用)(小芩)===
==Github版本管理操作說明==
[http://wiki.dila.edu.tw/pages/Git 《Pro Git》繁體中文翻譯]
  ●開啟檔案,選取 Windows Picture and  Fax Viewer(山水圖案)
   
  ●點擊列印
|相片精靈(請耐心等待 約20秒~60秒後出現)
|圖片選項
|選取張數(佛寺志專案掃瞄列印通常為整本所以是全選)
|列印選項
|列印喜好設定
|原稿型態:雙面書本
|選取版面設定:二合一
|順序:由右至左 
|選取版面設定
  |全頁傳真列印完成


=== 共110冊 Scanning 掃瞄 ( 伯雍,Simon)===
=== 如何取得以前的某個版本===
1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
2.選擇想要的版本 => 按右鍵 => Create Branch at this version
  3.輸入 branch 名稱 ( 自己可以訂) => ok => 可關掉這個視窗
4.回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
  (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
5.在branch欄點選想要的版本(切換branch)=> ok=> close
6.回到專案資料夾 => 將需要的文件複製出來
7.在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱(確定已切換回 master版本)
8.(若有必要時,可將複製出來的文件貼回master版本文件中。)


   * 選擇掃瞄檔案儲存為Tiff
=== 如何取得以前的某個版本(單一檔案)===
   * 解析度為400dpi
  1.在想要擷取 的檔 案或 資料夾 (例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
   * 8 bits 灰階。( 不是黑白 )
  2.點選想要的版
   * Tiff 轉 jpg
  3.在下方欄位中會出現當次push 的檔案 ,點選想要的 檔案 ,再點滑鼠右鍵
  4.點選Save revision to...,儲存到自己指定 路徑
=== 共110冊 Metadata 建立 (家名,秀雯,Simon)===
  5. 掉log messages,到自己指定的路徑去便可看到下載的
* 建立掃瞄 Tiff 數位圖檔的 Metadata
* 一本佛寺志各頁 掃瞄圖 放在同一 資料夾
* 佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
* Metadata 檔案 內依序記錄每張掃瞄圖檔之資訊
* 每張圖檔資訊記於一組<img></img>內
   
<img>內容範例:
<img>1B005P011(數位圖檔 檔名)
|內文( type 分4種 : 書名頁 ; 版本說明 ; 目錄 ; 內文 )
|金陵梵剎志-金陵梵剎志卷二十二-放生池記
  |( title : 以 「-「 dash 表達漸層 係,同一頁若有2個標題以上則以「/」slash 隔開
|舉例:金陵梵剎志-金陵梵剎志卷二十二-千佛寺/金陵梵剎志-金陵梵剎志卷二十二-大中正覺菴)
|978 (圖 之原書頁數)
|放生池(圖檔內容的前三個字)</img>


* 缺字至cbeta查找組合字[], 若沒有則回報 cbeta小組,異體字至教育部異體字字典的網站查詢,遇到空白頁,則標題延續 一頁 標題,「前三個字」則空白處理.<br/><br/>
===如何刪除某個 branch===
  1.在整個專案資料夾上按右鍵 => TortoiseGit => Git GUI =>
  2.(功能列 )Branch => Delete => Local Branches欄內點選要刪除 分支名稱=> Delete => 關掉Git GUI視窗


* 將完成的檔案以 txt 存於 ftp: 10.10.1.11/Buddhist temple's Gazetteers Tiff與佛寺志的數位圖檔放在一起,每一個資料夾對應一個Metadata的檔案 ( 資料夾 1Book001 表佛寺志第一輯的第一本,對應1Book001.txt )<br/><br/>
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97xml%E8%BD%89html xml轉html]==


===metadata 檔案匯入MIX標記架構內(小花)===
==[http://wiki.dila.edu.tw/pages/%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E6%9B%B8%E7%9B%AE 建立參考書目]==
MIX架構含:head, mix, map


====Metadata 問題與解答====
==Metadata==
1.目前 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可,
*對外公開 metadata: [[佛寺志 Metadata]]
  type多增加一個圖&空頁
* metadata: [[ 佛寺志 Content Metadata Version 2]]
2. 若 漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense)
3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?] 表示


=== 的文本標記(April, 妙妙,美燕,小芩,易儒,秀雯)===
== 發行==
====[http://buddhistinformatics.dila.edu.tw/fosizhi/ 佛寺 網路版]<br>====


==== 資料路徑與操作技巧==== 
==== 佛寺志紙本書====
 中華佛寺志叢書〈12部寺志,共15冊〉<br>
 ISBN:978-957-17-2177-4<br>
 出版社:新文豐<br>
 出版日:2013/06/01<br>
 內容:<br>
    01. 清涼山志<br>
    02. 峨眉山志<br>
    03. 重修普陀山志<br>
    04. 普陀洛迦新志<br>
    05. 九華山志<br>
    06. 天台山方外志<br>
    07. 明.明州阿育王寺志<br>
      清.明州阿育王續志<br>
    08. 寒山寺志<br>
    09. 玉岑山慧因高麗華嚴教寺志<br>
    10. 黃檗山志<br>
    11. 泉州開元寺志<br>
    12. 雞足山志<br>


=====●工具=====
== 一般庶務==
    
1. 電腦 由春玉統 回報 資訊
 *中國基本古籍庫 http://10.10.1.20/%E4%B8%AD%E5%9C%8B%E5%9F%BA%E6%9C%AC%E5%8F%A4%E7%B1%8D%E5%BA%AB/
 報修人員並 在google 文件中, 填妥報 情況
 * unicode 網址: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35
 * 漢語拼音: http://www.iq-t.com/SYSCOM/pingying2.asp
 * 教育部異體字字典:  http://dict.variants.moe.edu.tw/suo.htm
 * 標點符號用法:http://dict.variants.moe.edu.tw/main.htm
 * 國語辭典:http://dict.revised.moe.edu.tw/index.html
 * 漢典:http://www.zdic.net/cd/
 * TEI: http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html
 * 二十五史http://www.sinica.edu.tw/ftms-bin/new/ftmsw3?tdb=%A4G%A4Q%A4%AD%A5v
 * 呼嚕嚕 hoolulu:http://www.hoolulu.com/core_zh/
 * MapABC地圖搜索:http://www.mapabc.com/localsearch.shtml
 * Google地圖:http://ditu.google.com/
 * 搜狗Sogou地圖:http://map.sogou.com/new/#c=13222250,3747750,11
 * 維基百科:http://zh.wikipedia.org/w/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh-hant
 * 法鼓維基首頁:http://wiki.ddbc.edu.tw/pages/%E9%A6%96%E9%A0%81
 * 批次改檔名工具:UltraRename28b.exe
 * 批次改檔名路徑J:\CND\Projects\2008BTG佛寺志\work\工具\UltraRename28b.exe
 * 同文堂(網頁簡繁體轉換):http://of.openfoundry.org/projects/333/download
 * 復旦版歷史地名資料庫有歷史地名釋文  http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp
 * cbeta網站 http://www.cbeta.org/download/cbreader.htm
 * 台北版佛典集成 缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php* 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw
 * 吳疆教授(亞利桑那大學東亞研究所,對中國佛寺志有鑽研)
   網址:  http://bgis.coh.arizona.edu/
   聯絡信箱: jiangwu@email.arizona.edu
 
=====● 資料路徑=====
 
  ● 缺字輸入介面 http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
  ● 首頁 http://10.10.0.49/fosizhi/index.html
  ● 中國佛寺史志內部網址  http://10.10.0.49/fosizhi/ui.html
  ● 中國佛寺史志外部網址  http://140.131.254.11/fosizhi/ui.html
  ● 節點頁面網址: http://10.10.0.49:8080/fosizhi_json/
  ● 總目錄標記問與答,存放路徑  J:\CND\Projects\2008BTG佛寺志\work\標記\目錄\目錄標記問與答.odt
  ● 佛寺志作業時程 http://spreadsheets.google.com/ccc?key=py-MCl83eYhHl-WYd8FBcFA&hl=zh_TW
  ● 掃瞄檔 http://10.10.1.11/Temple_Gazetteers_Tiff/    密碼:tg_project
  ● 佛寺志專案工作檔: J:\CND\Projects\2008BTG佛寺志\work\
  ● 工作時數登記表  J:\CND\Projects\2008BTG佛寺志\行政\人事\工讀金\
  ● DDBC 檢索網址 http://isearch.ddbc.edu.tw/
  ● 人名、地名、時間權威檔login: http://authority.ddbc.edu.tw/login.html
  ● 人名權威檢索查詢:http://authority.ddbc.edu.tw/person/ 
  ● 地名權威檢索查詢: http://authority.ddbc.edu.tw/place/
  ● 時間權威檢索查詢: http://authority.ddbc.edu.tw/time/index1.html
  ● 權威檔修改-Google文件:http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com
  ● GIS專案 http://buddhistinformatics.ddbc.edu.tw/gaosenggis
 
=====● 操作技巧=====
   幾個快捷技巧:
   Alt+ Tab  切換文件
   Ctrl+ R  html重新整理
 
   在Oxygen下:
   Ctrl+ E  下標記
   Ctrl+Shift+ V  valid
   Ctrl+Shift+ W  well form
   Ctrl+Shift+ <  加註;取消註
 
   在Oxygen xpath下:(Perspective → Show Toolbar → XPath)
   //pb → 找所有<pb>(同理可推:找placeName---)
   //pb[@='0100'] → 找第100頁
   //persName[.='名字'] → 找出某人名
 
=====● 觀念:=====
 
'''凡用 電腦 可一併處理的,就不一一標記'''
 
 
====二、檔案架構說明====
 
  *  J:\CND\Projects\2008BTG佛寺志\work\標記\標記範本\併檔範本\併檔架構說明
 
====三、用轉好的檔案作業====
 
  *  J:\CND\Projects\2008BTG佛寺志\work\database\原始檔\BTG加p加pb\output\
 
====四、xml轉html步驟====
 
安裝oxygen 9.1
 
=====由gxxx_main.xml主檔 呼叫html.xsl=====
 
1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形)
  進入轉檔介面,選New(第一次建立html檔後,
  若所設定的路徑都沒變動的話,以後直接點Transformation now即可;
  若有要更改路徑的話,點Edit進入介面去 改即可)
2.進入Edit scenario 介面
  a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl)
  b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK
3.此時進入到下 個介面,點Transform now,即可產生html檔案
4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾
 
安裝 exist.jnlp 上傳檔案
 
1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
   (1)main主檔要經valid驗證 --沒有點點的紅勾勾
   (2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
   請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(單卷)→Select files or directories store →Close
 
=====佛寺志網頁=====
● 編輯網址: http://dev.ddbc.edu.tw/fosizhi/index.html
 
● 節點頁面網址: http://10.10.0.49:8080/fosizhi_json/
 
● HTML檔介面定案:人名/地名/時間 分三種顏色。
  例如:  地名 與 地名代名詞<ref>--------綠色
     時間 與 時間代名詞<ref>--------藍色
     別名 與 人名代名詞<ref>--------紅色
     人名(常名)--------------------加底線 (紅色)
 
=====介面程式撰寫 (小花)=====
 
===建立參考書目(妙妙,美燕,秀雯)===
 ●存放路徑 J:\CND\Projects\2008BTG\work\reference\參考書目
 ●gazetteerBibl.XML
 
==標記內容(+電1校)==
 
===標記重點:人名、地名、時間===
建置說明請參照凡例: [http://wiki.ddbc.edu.tw/pages/「專案整合權威資料庫」工作手冊 專案整合權威資料庫工作手冊]
====(1)人名<persName>====
 
  * '''查詢'''人名id碼網址:"人名權威資料庫" http://authority.ddbc.edu.tw/person/
  * '''新增'''人名id碼:"人名權威資料庫'''維護'''" http://authority.ddbc.edu.tw/login.html
  (e-lib→佛學研究平台→佛學古典文獻人名權威檢索→輸入人名後,按submit→取權威碼作為xml:id碼)
 
* 第一次出現人名時的標法
 
    例:<persName '''xml:id'''="A000883">攝摩騰</persName>
 
* 以後出現此人的同名及異名時的標法:
 
   例:<persName '''corresp'''="A000883">騰</persName>
   說明:'''corresp''' 是correspondence的縮寫,意為''相當或等於''
 
* 介面說明:
 
  新增資料建檔方式
   人 名:新增人名;別名(用半形分號分隔,越詳盡越好,但不用帶上稱謂如"禪師"等)
   類 別:(GIS專用)
   註 解:可辦認此人是誰的 資訊 (最好能標出生卒年。標點符號用全形)
   生卒年:(不用填)
   朝 代:(必填)
 
 ※'''註解欄'''中填寫須注意事項:
  a)必備四樣資訊:朝代、出生地、生卒年、著作。
  ●若缺少這些資料,則可放與時間參照點有關的人、事、物的資料,例如此人曾於某年某地做某事。 
  ●佛寺志文本若已具備這些條件,就不必找其他工具書。
  b)生卒年(西元-西元)中間用半形連接號分隔。
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
  d)尋找網路資料時,優先採用順序以authority所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
  ●示範'''註解欄'''說明:
  (一)福州福清何氏子,年十四依鎮東慧山祝髮,著有舍利記、語錄二十捲、五燈嚴統二十五
     卷。為密雲圓悟法嗣。(g086p0119)
  (二)(1593-1661)明末清初臨濟宗僧。福建省福州府福清縣人,俗姓何,號費隱。生於明神
     宗萬曆21年,卒於清順治18年。(佛光:4802;佛百:4053)
   
  ●示範'''文本標記'''說明:
  例:衍勤禪師,幼從莆田西來寺純證禪德脫白,嗣仲祺和尚法。
  標法:1. 幼從<placeName xml:id="CN">莆田西來寺</placeName>
      <persName xml:id="A004122">純證<roleName>禪德</roleName>
      </persName>脫白,嗣<persName corresp="A004085">仲祺<roleName>
      和尚</roleName></persName>法。
  標法 2. 幼從<name><placeName xml:id="CN">莆田西來寺</placeName>
      <persName xml:id="A004122">純證<roleName>禪德</roleName>
      </persName></name>脫白,嗣<persName corresp="A004085">仲祺<roleName>
      和尚</roleName></persName>法。
  標法 3. 幼從<persName xml:id="A004122"><placeName xml:id="CN">莆田西來寺
      </placeName>純證<roleName>禪德</roleName></persName>脫白,嗣
      <persName corresp="A004085">仲祺<roleName>和尚</roleName></persName>
      法。
 
====(2)地名<placeName>====
 
 * '''查詢'''地名id碼網址:"地名權威資料庫" http://authority.ddbc.edu.tw/place/
 * '''新增'''地名id碼:"地名權威資料庫'''維護'''"http://authority.ddbc.edu.tw/login.html
   (e-lib→佛學研究平台→佛學地理名詞權威檢索→輸入地名後,按submit→取Project­_No碼
   作為xml:id碼) 
 * 確認查找古今地理位置: 安裝 Super GIS 軟體
  (利用Super GIS所提供的地理圖層可幫助確認古今地名正確位置)
 * 世界地圖: J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
 * ccts使用教學影片:J:\CND\Projects\2008AuthorityDB\SuperGIS2.2\CCTS\CCTS \ccts.swf
   (感謝GIS伯雍提供)
 * 中央研究院提供地圖工具 http://gis.rchss.sinica.edu.tw/google/?p=301
=====(一)內文標記方式=====
* 第一次出現地名時的標法
  例:<placeName xml:id="Z13005440">雒邑</placeName>
 
* 以後出現同地名或別名時的標法
  例:<placeName corresp="Z13005440">雒陽</placeName>
  說明別名(異名):同地卻因朝(年)代不同而出現別名時,須於Super GIS用『同地名id碼』另建置
  新增地方別名
 
=====(二)新增/修改地名之介面說明=====
 
'''新增'''資料建檔方式
 ●第一步驟說明:
      1.進入"地名權威資料庫'''維護'''"http://authority.ddbc.edu.tw/login.html
      2.跳出「有問題的地名」頁面時-不理會請Delete(快速鍵:Ctrl+ W 鍵)即可進入「地名檢索」頁面
      3.地名檢索下方「管理功能」點選「新增地名」
      4.選擇「地理區域範圍」(三種區域包括:中國、中國境內跨區、其他國家)
  a)已知固定範圍之地理區域(中國)項目說明:    
   區 域:選擇地名之省、市、縣或區,確認最小範圍後點選「選取此地區」。(資料不足可選擇最大範圍-省)
   分 類:參考[http://wiki.ddbc.edu.tw/pages/%E5%9C%B0%E5%90%8D%E7%B7%A8%E7%A2%BC%E5%8E%9F%E5%89%87 地名編碼原則]之「屬性編碼」方式,選擇適當代碼。
   獲得編碼:選「按此取得編碼」(請再次檢查編碼的正確性)。
   編碼結果:選「使用此碼」(新增編碼成功後,不可隨意更改編碼。)
   清除資料:可重填(重點原則是'''尚未點選'''「使用此碼」之前)。
  b)跨區(中國)項目說明: 
   先選擇一個區域:參考[http://www.xzqh.org/QUHUA/index.htm 中華人民共和國行政區劃]之「中國政區」區域範圍說明。
   分 類:參考[http://wiki.ddbc.edu.tw/pages/%E5%9C%B0%E5%90%8D%E7%B7%A8%E7%A2%BC%E5%8E%9F%E5%89%87 地名編碼原則]之「屬性編碼」方式,選擇適當代碼。
 ●第二步驟說明:
      1.取得編碼後出現「修改地名」視
      2.繼續填寫「基本資料」欄
   Level:(不必填)
   朝 代:慣用名-使用條件為『不受年代變動的影響之地名』。(範例:長江、四明山..等)
   經緯度:座標來源可利用[http://maps.google.com/maps Google Map] 『我的地圖』之『[http://maps.google.com/gadgets/directory?synd=mpl&hl=zh-TW&gl=TW&backlink=http%3A%2F%2Fmaps.google.com%2Fmaps%2Fmm%3Ft%3Dh%26hl%3Dzh-TW%26ie%3DUTF8%26ll%3D30.229246%2C120.12768%26spn%3D0.006322%2C0.007671%26z%3D17&cat=new 更多小工具]』新增 getLatLongPlus2
   座標型態:選擇條件說明:
      1.已考定(精確)-已確定之精確座標位置
      2.已考定(預設值)-須進一步雙重確認
      3.待考-尚未考察或須待確認
      4.不可考-已考察並確定此地名不存在或無可考
   拼 音:(不必填)
   說 明:(可不必填)填寫須具備以下條件:
      1.簡潔說明(僅提供地名本身須註解部分,不提供文本相關資料。)
      2.使用全形標點符號,如下所示:,。、;:!?.「」『』()《》〈〉[]……
      3.提供來源出處(須參考[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 「專案整合權威資料庫」工作手冊 ]凡例之1.3 註解 note項目說明)
   加入超連結:引用網路資料之網址。
        操作方式說明:先置入網址於說明欄內,並複製全選網址後,再一次點選「加入超連結」貼上網址按確定即可。
 ●第三步驟說明:
      1.繼續填寫「地名部分」欄
      2.常名:須符合當時年代所常用之名稱(僅可提供一個常名),於「是否常名」欄中選「是」即可。
      3.其他名稱:限定條件須為同年代(因特殊地理位置或其他原因而給予的名稱(可提供多個名稱)),均於「是否常名」欄中選「否」即可。
 ●第四步驟說明:按「修改資料」即成功完成新增建檔。(切記:若沒有先按「修改資料」而繼續登錄以下之項目「新增來源資料」將面臨前功盡棄的殘酷事實。)
  ※'''基本資料欄'''中須注意事項:
  a)必備四樣資訊:朝代、經緯度、地名部分、來源資料。
  b)文本之寺院內建築必須給ID及經緯度。常名建置。範例:慧因寺妙應殿
   ex:<placeName xml:id="CN××××××T××AB">寺院內建築</placeName>(ID=CN××××××T××AB)
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
  d)尋找網路資料時,優先採用順序以[http://share.foxmarks.com/folder/rss/osyCa6r9nX Authority]所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
  f)失落或無可考的建築物及地名可不提供經緯度,但'''文本須標記'''並於
   地名權威資料庫建置地名以供日後檢索。
 
{| cellspacing="0" border="1"
!建築物
!XML(文本內文)
!地名基本資料欄
!經緯度
|-
|存在
|給I D 標<placeName xml:id="×××">
|須建檔
|提供最大範圍 例如:省、區、寺院
|-
|不存在
|給I D 標<placeName xml:id="×××">
|須建檔
|提供最大範圍 例如:省、區、寺院
|-
|無可考
|不給I D 文本標<placeName>以顏色區分
|須建檔
|不給
|}
 
'''修改'''資料建檔方式
●第一步驟說明:
      1.進入"地名權威資料庫維護"http://authority.ddbc.edu.tw/login.html
      2.
 
 ※修改資料中須注意事項:
  a)編碼和地理區'''不輕易'''改編碼。
  b)若需'''改編碼後務必登錄'''[http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com 權威碼修改]申請隱藏該筆資料。以利後端程式人員通告相關人員。
  c)資料庫無刪除動作,僅可向authority維護人員 報修 登錄[http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com 權威碼修改]google文件隱藏該筆資料。
 
====(3)時間<date>====
 
* 年初,年末期間的取法原則:1/4
 
 *'''查詢'''時間id碼網址:"時間權威資料庫" http://authority.ddbc.edu.tw/time/
 (e-lib→佛學研究平台→中西時間對照權威檢索→輸入檢索資料後,按submit→取Project-_No碼作為xml:id碼)
 
* 時間點的標法說明:
(a)有年月日的標法,用 ''' when ''':
  <date when="西元年-月-日" xml:id="d(起始id碼)(終尾id碼)">內文時間</date>
   例:<date when="1610-西元月-西元日" xml:id="d58208525820852">萬曆庚戌年
    五月十六日</date>
 
(b)有年或月的標法
  1年(1月)的標法:<date corresp="d57020065702359" notBefore="1285-02-06"
       notAfter="1286-01-25">至元廿二年</date>。 
 
(c)第二次以上出現時間的同名或異名時的標法:
  例: <date when="1610" corresp=" d58206905821073">同年</date>
  PS:將xml:id改為corresp
 
* 為『不明確』(某區段內)時間的標法說明:
(a)事件發生於區段內的'''某一時段''',用 '''notBefore  notAfter  年代為四碼'''
  例:清光緒年間,錢塘丁丙刻「武林掌故叢編」時,...。
    <date notBefore="1875" notAfter="1909" xml:id="d59174915929893">清光緒年間</date>
(b)事件進行為'''持續整個區段'''時間(且時間點明確),用 '''from  to '''
  例:明逕壁立禪師,生崇禎壬午年五月念七日寅時。雍正甲辰四月十二日說偈訣眾,
    而化塔本寺頭亭。壽<date from="1642-06-23" to="1724-05-04"xml:id=
    "d58325275862427">八十三</date>。
  
 
* 時間為民國的標法說明:
 * 查詢ID: 用檔案 GISapD\資料表\ADDate&SB西元與日干支
  例: 民國十三年甲子九月 (出自 : 泉州開元寺志  第十一頁  第二行 )
  步驟一 : 至 http://destiny.xfiles.to/tools/calendarVS.html 查詢西元日期;
      結果為 西元 1924年9月29日至 1924 年10月27日
  步驟二 : 開啟GISapD\資料表\Addate&SB西元與日干支;
      找 ADDate中 +1924-09-29 的日期 ;
      得到 DateID 為5935623查詢 +1924-10-27 則得到DateID碼為5935651
  步驟三 : 得到ID碼後則可標記為<date when="1924" xml:id="d59356235935651">
      第二次出現及以後 , 則標為<date when="1924" corresp="d59356235935651">
 
* Datecode查詢為id碼(d59356235935651)返回查詢系統
 
===建置【來源出處】注意事項===
 
  ● 出處在''' CBETA''' 者。請建置在「新增來源資料」''' CBeta''' Links欄位中
 例如:X65no1295_p716a23
 
  ● 出處在''' 文本''' 者。請建置在「新增來源資料」 ''' Source'''  Links欄位中
 例如:g017p0036
 
  ● 「註解」中來源出處請使用'''全形標點符號''',如下所示:
 ,。、;:!?.「」『』()《》〈〉…… 標點符號用法,可參  http://www.edu.tw/files/site_content/M0001/hau/c2.htm 。
'''注意事項''': 
1.生卒年中「-」連接號使用'''半形標點符號'''。例如:通容(1593-1661)。
2.每一個別名之間以「;」分號(半形或全形皆可)隔開。
 
  ● 「註解」內容之來源出處請使用'''全形標點符號''',並參照以下範例:
 一.同一來源出處請使用「全形'''、'''頓號」標點符號隔開
 例1:佛光:480、405
 例2:(http://baike.baidu.com/view/322497.html(烏墩)、http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw(烏鎮),日期:2008.12.23)
 二.不同來源出處請使用「全形''';'''分號」標點符號隔開
 例1:佛光:480;佛百:4053
 例2:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02;佛光:480;http://baike.baidu.com/view/1225413.htm(夕照山),日期:2008.12.23)
 三.日期前的標點符號請使用「全形''','''逗號」隔開
 例1:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02)
'''注意事項''':
1.使用網路出處來源,需注意其穩定性及權威性。建議參照使用'''Authority'''所提供網路資料[http://share.foxmarks.com/folder/rss/osyCa6r9nX'''Authority''']。
2.網址中出處來源的條目,其目的是利於日後方便搜尋。EX:(雷峰)
 
===代名詞=== 
<syntaxhighlight lang="XML">
1.須標記且詞意不明顯時才要標
</syntaxhighlight>
<syntaxhighlight lang="XML">
2.代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
  例如:<ref corresp="A003940">余</ref>
</syntaxhighlight>
<syntaxhighlight lang="XML">
3.由於頁面太多超連結,請各位標記 人員 以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
  皆不用再重複標記。
</syntaxhighlight>
 
===內文字體缺少或難以辨認時===
 
* 標法參考以下網頁:
  http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html#
  範例:2個圓圈刪去,輸入<gap extent="2" unit="chars" reason="lost"/>
     extent: 被省略的文字量  unit: 資料型態
 
 
===缺字與通用字===
====缺字與通用字的定義====
定義:
  ●  凡於unicode網站找不到者,或古字打不出來的,皆作缺字處理。
 台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
 別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml
 
  ●  通用字:古今通用,例如價值的值,古字用直,今用值。參考網頁
http://big5.ce.cn/gate/big5/cathay.ce.cn/file/200704/25/t20070425_11166721.shtml
 異體字:例如寧,可寫成寶蓋頭下加血
 
====異體字(通用字)與缺字處理流程====
#[[#1.判斷異體字(通用字)或缺字|判斷異體字(通用字)或缺字]],(用教育部異體字典)
#[[#2.圖檔處理|圖檔處理]]
#[[#3.內文標記|內文標記]]
#[[#4.介面輸入|介面輸入]]
 
=====1.判斷異體字(通用字)或缺字,(用教育部異體字典)=====
http://www.zdic.net/zd/zi/ZdicE9ZdicBBZdic8E.htm
 
=====2.圖檔處理=====
<syntaxhighlight lang="XML">
(1) 是異體字時:
 
1.於教育部異體字典網站download(手寫字體)或unicode 網站download圖檔(正寫字體)
unidoce download 的圖檔背景是透明的,教育部異體字典download圖檔是背景是白的,用文本掃瞄的.tif背景是灰的,此背景色不同無仿
 
2.於缺字介面新增一筆以獲得檔名.gif
用gimp縮放尺寸, 尺寸45x47 72dpi,作法如下
或以xview批次處理尺寸及dpi
 
(2) 是缺字時:
於原始檔.tif用gimp剪下,作法如下
</syntaxhighlight>
 
======利用Gimp軟體處理缺字圖檔======
<syntaxhighlight lang="XML">
【98.01.19 Erica】
 *裁切掃瞄檔缺字步驟
(1)開啟Gimp功能表「檔案」
(2)點選「開啟圖片檔案」
(3)選擇掃瞄檔案ex:2Book022(路徑:J:\CND\Projects\2008BTG\work\掃瞄)中缺字頁碼
(4)放大圖片以利裁切--點選功能表「顯示」選擇「縮放2:1(200﹪)」
(5)點選功能表「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆)
(6)將「剪裁」圖形移至缺字字體,確認位置後點選滑鼠左鍵2次,即可裁切缺字圖檔.
(7)設定圖片尺寸--點選功能表「圖片」選擇「縮放圖片」( 尺寸:45X47 解析度:72DPI)完成後點選下方「縮放」即完成
(8)另存新檔--開啟Gimp功能表「檔案」存新檔 提供檔名ex:btg0077009601.gif再點選下方「Gif影像檔」點選「儲存」即完成即完成
 
 *針對已下載缺字圖片設定尺寸之轉檔步驟
(1)開啟Gimp功能表「檔案」
(2)點選「開啟圖片檔案」
(3)設定圖片尺寸--點選功能表「圖片」選擇「縮放圖片」( 尺寸:45X47 解析度:72DPI)完成後點選下方「縮放」即完成
(4)另存新檔--開啟Gimp功能表「檔案」存新檔並提供檔名ex:btg0077009601.gif再點選下方「Gif影像檔」點選「儲存」即完成
 
</syntaxhighlight>
 
=====3.內 標記=====
<syntaxhighlight lang="XML">
異體字(通用字):
<choice><orig><g ref="#btg086001701"/></orig>
<reg resp="ddbc.da">一般化的字</reg></choice>
 
缺字:
<g ref="#btg086001701"/>
以上檔案命名原則:btg+志碼+頁碼4碼+序碼2碼(此頁第幾個缺字)
</syntaxhighlight>
 
=====4.介面輸入=====
<syntaxhighlight lang="XML">
(a)登入網頁http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
(b)取碼目的:取得缺字檔名及建置缺字組
(c)建置步驟說明:
  (1)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (2)產生缺字id後,即可輸入缺字資訊(如e).
(d)完成後,按「更新資料庫」.
(e)輸入缺字資訊
charName:
<charName>
到unicode網站找cjk(decimal), CJK IDEOGRAPH 15181=Unicode
使用 Unicode,不用utf-8
<charProp/>
表示字的屬性、表達方法。比如說注音、發音。
Mapping:
<mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、組字式、unicode碼。
至CBETA漢字庫打通用字或組字式以獲得組字式或CB碼
標記發音: 漢語拚音字典找漢語拚語
</syntaxhighlight>
 
===勘字===
<syntaxhighlight lang="XML">
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
  <reg> (一般化) 標誌一般化或規格化處理過的文字。
</syntaxhighlight>
 
===圖檔或圖檔內有文字標記法===
<syntaxhighlight lang="XML">
印章(視為圖檔)標記法如下:
<figure>
   <figDesc><signatures></signatures></figDesc>
   <graphic url="1B020P024.jpg"/>
</figure>
</syntaxhighlight>
 
<syntaxhighlight lang="XML">
<figure>
  <head>標題</head>
  <figDesc>讓此表可以檢索到的圖說,以半形標點符號間隔文字</figDesc>
   <graphic url="cwdc01p085a.jpg"/>
</figure>(己有掃瞄圖檔故圖不顯示)
</syntaxhighlight>
 
===在文本標完後,建立事件<linkGrp>===
 
  ※ 暫先不建立此事 <linkGrp>,馬老師將找專家做)
    說明:辨識文本中的事件,建立其「人、時、地」的連結群組
   例:
   <linkGrp>
    <ptr type="person" target="#G0292"/>
    <ptr type="person" target="#G1273"/>
    <ptr type="place" target="#TX5132241"/>
    <ptr type="time" target="#d405666405666"/>
   </linkGrp>
 
 
===標記問答===
● 宗派(例如賢首宗)及普門菩薩是否標記?
 
A:不標
 
● 寺院內建築(例如華嚴經閣)是否標記? 
A:要標。
 
● 高麗國王,「國王」是否標記?  
A:稱謂,不用標。
● 代名詞要不要標?
A:原則第一次出現要標,明者不標,不明者要標。
 
● 內文中提到的相關「著作」是否標記?
A:不標。
● 唐之垂拱(垂拱是年號)的標法?
A:<date from="垂拱的第一天" to="垂拱的最後一天" xml:id="id碼">唐之垂拱</date>
 
● 格式問題:是否照書編排?
A:可依文本實際內容調整標記。
● 並列文字的標法?
A:例:副寺<list rend="inline"> <item>惠秀</item>  <item>舜普</item>
    <item>永施 </item></list>校刊 (註:rend表示"如何呈現")
 
● 標題(head)+作者(persname)於同一行的標法?
A:<head>標題</head>  <byline><persname>作者</persname></byline>
   (註:<byline> 包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
 
● 標題後有副標題的標法?
<syntaxhighlight lang="XML">  
例:<head>大安禪師<seg type="toc" rend="smallType">上堂一則 機緣二則</seg>
    </head>(註:<seg> (隨機分割) 包含文件中任何隨機字詞層次的單元。
    toc=table and content)<br/>
</syntaxhighlight>
 
● 於黃檗丈室堂第三代隱元隆琦國師入院法語五則上堂九則機緣三則,文中可否自添標題?
<syntaxhighlight lang="XML"> 
A:否。可於段落中加屬性<div type="入院法語一">區分
</syntaxhighlight>
 
● 人名權威建檔,同一人名有多筆出處時,製作資料來源是否一一出處皆登錄?
A:只須登記第一筆
 
● 王居士、母龔氏等是否標記?
A:是,請儘量在註解欄提供相關可辨識的訊息。
 
● 幾個關於人名標記的用法
   <addName> (附加名稱) 附加的名稱,例如綽號、稱號、或別名,或是在人名中出現的其他
        描述性措辭。  
   <roleName> 包含一個身份名稱,代表個人在社會上所扮演的特殊角色或所處地位,例如:
        官方頭銜或地位。
   <surname> 包含一個家族姓氏,並非名字、教名、或綽號。
   <forename> 包含名字或教名。
   <genName> 該名稱用來和其他相似名稱做區別,以個人的相對年紀或隸屬世代作依據。
   <geogName> (地理名稱) 與地形名稱結合的地名,例如威拉索溪谷、西奈山等。
 範例1.:
  <persName xml:id="A001873"><addName>佛慈廣鑑慧光普照</addName>
    隱元隆琦<roleName>國師</roleName></persName>
 範例2.:
  <persName xml:id="A001150"><roleName type=""school>臨濟</roleNname><addName>開法</addName>費隱通容<roleName>禪師</roleName></persName>
 範例3.悟公的"公"標法?
  <persName corresp="A003688">悟<roleName type="honorific">公</roleName> </persName>
 
● 引語是否需標<cit><quote>?
A:否
 
● <lg><l>的注意事項
<syntaxhighlight lang="XML">
<lg><l>與<p>是對等地位,故不可包在<p>中。應結束</p>後,再標<lg>。
</syntaxhighlight>
 
● 行後有小字的標法? 例:寶慶三年正月日牒尚書省印#行書
A:寶慶三年正月日<note rend="smallType" type="toc">牒尚書省印行書</note>
 
● pb放置的位置?
A:放<div>與<head> 間。例:<div><pb n="0095"/><head>
 
● 文字出現於兩行的行中時,是否照文本排版標記?
A:不用照原文排版
  
● 文本中人名資料中的<字號或別名>無法確實查證時,該如何標記?
  例:<persName xml:id="A003937">姚二煜葆明</persName>甫
A:無論是別名或字均以<addName></addName>包起來即可.
  例:<persName xml:id="A003937">姚二煜<addName>葆明</addName> </persName>甫
 
● 遇人名不確定是否為某人時,可加屬性值標示。
 例1:<persName type="unknown">某某某</persName>此為完全不明或查找不到確認
   此人身份資料時用
 例2:<persName xml:id="A001606" cert="70%">cert 是表示標者自認為的正確度,
   是相對的,非絕對的。
 
● 作者標記<byline type="Author">無法驗證通過?
<syntaxhighlight lang="XML">
A:可試試另兩種標法
(1)<byline><docAuthor>作者名</docAuthor></byline>
(2)<persName type="Author">作者名</persName>
</syntaxhighlight>
 
● 圖檔標記:url 圖檔檔名?
  <figure><figDesc>圖說</figDesc><graphic url="掃瞄檔檔名.jpg"/></figure>
 例:<graphic url="3B004P001.jpg"/>(註:P為大寫,頁碼為三碼)
 
● 空白頁的處理
A:只需標上頁碼
 例:<pb n="0248"/>
 
● 人名、地名等跨頁時的標記
A:將 pb移到name 之後(以程式處理)
 
● 人名標記:稱謂(如:公,和尚,禪師---等)是否包進人名,再確認?
A:稱謂須包進人名,並標以<roleName>等元素。
 
● 某仙人,是否標人名、是否給id碼?
A:否
 
==驗證==
 
1. main的檔頭有用all.nrc刪除
 
2.需要的schema路徑
  J:\CND\Projects\2008BTG\work\markup\標記進行中\schema\.rnc
 
3.設定Schema路徑 按configure validation scenario \Add
 
4.於main檔按紅勾勾驗證(沒有點點的)
 
==待解決內部問題討論==
<syntaxhighlight lang="XML">
●文末的"印"是否需標記? (秀雯 2009-2-4)
</syntaxhighlight>
<syntaxhighlight lang="XML">
●<head> <item>標題, 項目有跨頁時,是否可把標題,項目記在第一頁?(秀雯 2009-2-6)
(樹狀結構會不完整)
ex:
<head>華
<pb n="100">
嚴菴>
 
樹狀結構如下:
item  華
</syntaxhighlight>
 
 ●討論權威碼改碼後如何通知大家?(Erica;2009/02/10)
 
 ●討論地名權威 改權限問題.(Erica;2009/02/10)
 
<syntaxhighlight lang="XML">
 
<author>與<docAuthor>之異同? (<author>沒有在schema) (秀雯,2009-02-11)
suggest: <docAuthor>指題名頁的作者, <author>指內文的作者以為區別
 
</syntaxhighlight>
 
 
<syntaxhighlight lang="XML">
 
若印刷錯誤,這頁的內容與上頁相同,tag? (p.218-p219)(秀雯,2009-02-11)
  是否可用<note rend="duplicate"></note>?
      <del rend="duplicate"></del> or <del type="duplicate"></del>
  rend 與 type 的異同?
 
  <del> (刪除) 標記在文本中,由作者、抄寫者、註解者、或更正者刪除、標上刪除記號、或者標明為多餘或偽造的字母或單字。
 
</syntaxhighlight>
 
==最新公告==
&quot;請註明紀錄者姓名及日期&quot;
<syntaxhighlight lang="XML">
●g0××_00.xm之檔頭宣告 與 <div>檔,均須提供元素類型名稱<div type="××××">目的:建置佛寺志網頁卷之節點名稱.(Erica;2009/01/19)
ex:<div xml:id="g077_00.xml" xmlns="http://www.tei-c.org/ns/1.0" type="九華山志"> 及<div type="圖文">.
</syntaxhighlight>
<syntaxhighlight lang="XML">
●卷前之【版前說明】或【卷前圖說】均放置g0××_00.xml檔案裡,以<div></div>包起來.(Erica;2009/01/19)
</syntaxhighlight>
<syntaxhighlight lang="XML">
●用 Gimp 處理缺字圖檔的方法, 己放入缺字目錄中  98.01.15 April
</syntaxhighlight>
<syntaxhighlight lang="XML">
●用 Gimp 處理缺字圖檔的方法, 己放入缺字目錄中  98.01.15 April
</syntaxhighlight>
<syntaxhighlight lang="XML">
●代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
  例如:<ref corresp="A003940">余</ref>
</syntaxhighlight>
<syntaxhighlight lang="XML">
●由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
  皆不用再重複標記。
</syntaxhighlight>
<syntaxhighlight lang="XML">
●註解內容要呈現,內容主要放:生卒年、出生地、別名。若這些 料缺少,則可放與時間參照點有關
  的資料,例如此人曾於某年某地做某事。
</syntaxhighlight>
<syntaxhighlight lang="XML"> 
●html檔介面定案:人名/地名/時間 分三種顏色。
  例如: 
    地名 與 地名代名詞<ref>--------綠色
    時間 與 時間代名詞<ref>--------藍色
    別名 與 人名代名詞<ref>--------紅色
    人名------------------------加底線 (紅色)
</syntaxhighlight>
<syntaxhighlight lang="XML">
●缺字處理決議為若無 unicode 字型均採用組字式處理(ex: 羅[目*侯])(Erica;2008/11/17)
</syntaxhighlight>
<syntaxhighlight lang="XML">
●文本若出現非標記可處理的範圍,可不標句讀。但是須於<teiHeader>作一個說明程式。(Erica;2008/11/17)
  例如:元朝蒙文文言文,可不標句讀。
</syntaxhighlight>
<syntaxhighlight lang="XML">  
●通用字與古字TEI標記舉例如下:(Erica;2008/11/17)
      通用字--值
      古字-----直
  TEI標記:         
      <choice>
          <orig>直</orig>
          <reg>值</reg>  (reg = 標準化/一般化)
      </choice>       
</syntaxhighlight>
<syntaxhighlight lang="XML">
●Authority人名/地名/時間權威網址變更並已更正完成(Erica;2008/11/27)
</syntaxhighlight>
<syntaxhighlight lang="XML">
●地名權威資料的建置,寺裡建築物若已無存或無從考證,則可只標<placeName>,而不標id碼及經緯度。(智妙2008.12.01)
</syntaxhighlight>
 
●缺字組<charName>內容決議:
(1)主檔標記:<charName>CJK IDEOGRAPH 148564</charName>
(2)使用 Unicode
(3)XML 檔案的內文標記為<g ref="×××"/>並參照《別譯雜阿含經》 (BZA)的數位版本\「缺字發音表」\中將異體字轉成 HTML 的組字型態並呈現「缺字圖檔」。(Erica;2008/12/08)
</syntaxhighlight>
<syntaxhighlight lang="XML">
●訛字標記修正,原<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>(智妙2008.12.11)
修訂為:
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
  <reg> (一般化) 標誌一般化或規格化處理過的文字。
</syntaxhighlight>
<syntaxhighlight lang="XML">
●缺字組的內容 2008.12.29 妙妙
<encodingDesc>
    <charDecl>    
     <glyph xml:id="g0001">
      <glyphName>CJK IDEOGRAPH 15729</glyphName>
      <charProp>
       <localName>pronunciation</localName>
       <value>piao3</value>
      </charProp>
      <mapping type="cbeta">[漂*寸]</mapping>
      <mapping type="cbetaNo">CB00579</mapping>
      <mapping type="unicode">15729</mapping>
      <graphic url="btg086012301.gif"/>
     </glyph>
     <glyph xml:id="g0002">
      <glyphName>Non Unicode Character</glyphName>
      <charProp>
       <localName>pronunciation</localName>
       <value>wu4?</value>
      </charProp>
      <mapping type="cbeta">[寤-吾+告]</mapping>
      <mapping type="cbetaNo">CB00854</mapping>
      <graphic url="btg086045601.gif"/>
     </glyph>  
    </charDecl>
  </encodingDesc>
</syntaxhighlight>
 
 ●新增DDBC檢索網址 http://isearch.ddbc.edu.tw/ 2009.01.13 erica
 
 ●缺字登入網頁 http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020 2009.01.14 erica
 
 ●變更標記事項說明:2009.01.14 erica
1.xml:id 及 corresp 均修訂為 key
2.修訂範圍包括:人(persName)時(date)地(placeName)及代名詞(ref)標記xml:id 及 corresp
3.範例說明:
(1)原標記
  <persName xml:id="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>
(2)原標記
  <persName corresp="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>

於 2021年4月27日 (二) 09:47 的最新修訂

《中國佛寺史志》數位典藏工作手冊
Archive of Buddhist Temple Gazetteers(Service manual)

簡介及目標

一、簡介:
  佛寺志是一種獨特而重要的文獻,其主要內容有:佛寺歷史沿革、建置、高僧行誼、語錄、法脈傳承、感應事跡、碑記詩賦藝文等。20世紀有兩大套木刻版寺志叢書印刷,此二套叢書所收之佛寺志,或為手抄本,或為各國圖書館唯一藏本,世所罕傳,彌足珍貴,被譽為「續大藏未竟之偉業,出佛教史料之遺珍,集寺院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻記載之不足,使漢傳佛教在時間、空間與內容的研究資源上更加完備。
  適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助,自2008年起開始著手以下二套叢書之數位化工作:
  1.《中國佛寺史志彙刊》(110冊;100志):台北.明文出版社、丹青圖書公司,1980-1994,杜潔祥主編
  2.《中國佛寺志叢刊》(130冊;197志):揚州.廣陵書社,2006,張智、白化文等主編

二、目標:
  本專案的數位化目標,乃欲將200多座寺志建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老寺志的新版本,運用科技得以長遠保存,而有助於佛法的弘化。

進程及人力

進程:
第一階段(97年~99年):
 1. 建置二套叢書後設資料庫(metadata)。
 2. 設立DILA中國佛寺志網頁(開發版和推廣版)。
 3. 二套叢書完整掃描,提供網頁瀏覽、下載。
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀,及相關人名、地名資料連結。

第二階段(100年~101年):
 1. 執行出版「中華佛寺志叢書」計畫。(12部寺志,共15冊)
 2. 複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇。

第三階段(102年):
 進行明丹本85部寺志之初階標記。

第四階段(103年~104年):
 進行廣陵本124部寺志之初階標記。

第五階段(105年~108年):
 進行明丹本寺志之點校,以製成更便利後人閱讀的版本。
 1. 105年:點校18部寺志,約120萬字。
 2. 106年:點校4部寺志,約60萬字。
 3. 107年:點校12部寺志,約71萬5千字。
 4. 108年:點校9部寺志,約60萬字。

人力:
 時程控管 1人
 程式設計 2人
 標記人員 3人
 後設資料建置人員 1人
 義工 1人

執行單位

執行單位:法鼓佛教學院數位典藏組
主持人:Marcus Bingenheimer 馬德偉博士(97年~102年)、洪振洲博士(102年~108年)
時程及預算控管:柯春玉(97年~102年)、林智妙(103年~108年)
程式及介面撰寫:花金地、李志賢、周邦信
標記技術人員:林智妙、林綉麗、王秀雯、游美燕、何易儒、詹麗春
新式標點人員:蔡謀芳、張革丰
佛學規範資料庫維護人員:闕慧貞、葛賢敏

參考工具

1 網頁工具
 1.1 文本介面
 1.2 規範資料庫
 1.3 工作手冊
 1.4 TEI 網站
 1.5 漢字處理
 1.6 辭典類
 1.7 標點符號用法
 1.8 人名查詢
 1.9 地名查詢
 1.10 時間查詢
 1.11 綜合查詢
 1.12 古籍文獻資料庫
 1.13 學校相關網頁
 1.14 在Y公共磁碟區上的工具檔
2 操作技巧
 2.1 幾個快捷技巧
 2.2 在Oxygen下
 2.3 在Oxygen xpath下
 2.4 標記元素中文化
 2.5 wiki 語法

前置作業

1 叢書目錄建立
2 地理資訊建立
3 文字輸入
4 文字校對
5 掃描
6 Metadata建置

標記作業

1 工作準備
2 檔案架構
3 加facs碼
4 段落形式
5 標記元素
6 字元層次
7 標記問答
8 佛寺志PDF版
9 佛寺志粗標

點校作業

佛寺志點校
1. 佛寺志點校須知_Oxygen作業
2. 佛寺志點校須知_txt作業
3. 佛寺志異體字處理規則(2018年版)

python程式的應用

特字處理

規範資料驗證

上傳到FTP

輸出佛寺志的純文字檔

1.在ruby資料夾下執行ruby x2t.rb

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb

2.純文字檔將會產生在output資料夾內

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text

3.將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。

Github版本管理操作說明

《Pro Git》繁體中文翻譯

如何取得以前的某個版本

1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
2.選擇想要的版本 => 按右鍵 => Create Branch at this version
3.輸入 branch 名稱 (自己可以訂) => ok => 可關掉這個視窗
4.回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
 (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
5.在branch欄點選想要的版本(切換branch)=> ok=> close
6.回到專案資料夾 => 將需要的文件複製出來
7.在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱(確定已切換回 master版本)
8.(若有必要時,可將複製出來的文件貼回master版本文件中。)

如何取得以前的某個版本(單一檔案)

1.在想要擷取的檔案或資料夾(例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
2.點選想要的版本
3.在下方欄位中會出現當次push的檔案,點選想要的檔案,再點滑鼠右鍵
4.點選Save revision to...,儲存到自己指定的路徑
5.關掉log messages,到自己指定的路徑去便可看到下載的檔案

如何刪除某個 branch

1.在整個專案資料夾上按右鍵 => TortoiseGit => Git GUI =>
2.(功能列上)Branch => Delete => Local Branches欄內點選要刪除的分支名稱=> Delete =>關掉Git GUI視窗

xml轉html

建立參考書目

Metadata

發行

佛寺志網路版

佛寺志紙本書

 中華佛寺志叢書〈12部寺志,共15冊〉
 ISBN:978-957-17-2177-4
 出版社:新文豐
 出版日:2013/06/01
 內容:
    01. 清涼山志
    02. 峨眉山志
    03. 重修普陀山志
    04. 普陀洛迦新志
    05. 九華山志
    06. 天台山方外志
    07. 明.明州阿育王寺志
      清.明州阿育王續志
    08. 寒山寺志
    09. 玉岑山慧因高麗華嚴教寺志
    10. 黃檗山志
    11. 泉州開元寺志
    12. 雞足山志

一般庶務

1. 電腦維修由春玉統一回報資訊組窗口 報修人員並在google文件中,填妥報修情況資訊