「名山古剎-《中國佛寺史志》數位典藏」:修訂間差異

出自DILA Wiki
imported>Miaomiao
imported>Jiayu.xu
無編輯摘要
 
行 1: 行 1:
==[http://dev.ddbc.edu.tw/fosizhi/ui.html 名山古剎- 《中國佛寺史志》數位典藏] ==
 《中國佛寺史志》數位典藏 工作手冊<br/>
Archive of Buddhist Temple Gazetteers
Archive of Buddhist Temple Gazetteers (Service manual)


==簡介及目標==
一、簡介:<br>
  佛寺志是一種獨特而重要的文獻,其主要內容有:佛寺歷史沿革、建置、高僧行誼、語錄、法脈傳承、感應事跡、碑記詩賦藝文等。20世紀有兩大套木刻版寺志叢書印刷,此二套叢書所收之佛寺志,或為手抄本,或為各國圖書館唯一藏本,世所罕傳,彌足珍貴,被譽為「續大藏未竟之偉業,出佛教史料之遺珍,集寺院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻記載之不足,使漢傳佛教在時間、空間與內容的研究資源上更加完備。<br>
  適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助,自2008年起開始著手以下二套叢書之數位化工作:<br>
  1.《中國佛寺史志彙刊》(110冊;100志):台北.明文出版社、丹青圖書公司,1980-1994,杜潔祥主編<br>
  2.《中國佛寺志叢刊》(130冊;197志):揚州.廣陵書社,2006,張智、白化文等主編<br>


  工作手冊 (請勿更動編排版面)
  二、目標:<br>
  
    本專案的數位化 標,乃欲將200多座寺志建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老寺志的新版本,運用科技得以長遠保存,而有助於佛法 弘化。<br>
===簡介及 目的(春玉)===


地方志或地方性歷史在中國史料中是一個很獨特的文體,通常是對於區域、城市或寺院有興趣的學者寫成。地方志由各式各樣的文本編輯而成,是很重要的珍藏,其中包含了地方的描述、傳記、詩集、地圖、 像及感應故事等。此專案的目的,是藉由接觸這些珍貴資訊,以便對中國佛教歷史有更深的瞭解。
==進程及 力==


  地方 的收藏主要由2個20世紀木刻 的編輯 叢書 組成:
  進程:<br>
第一階段(97年~99年):<br>
 1. 建置二套叢書後設資料庫(metadata)。<br>
 2. 設立DILA中國佛寺 網頁(開發版和推廣 )。<br>
 3. 二套 叢書 完整掃描,提供網頁瀏覽、下載。<br>
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀,及相關人名、地名資料連結。<br>


   * Zhongguo Fosi Shizhi Huikan 中國佛寺史志彙刊. Taipei, 1980-1985. Compiled by Du Jiexiang 杜潔祥. 110 vols
  第二階段(100年~101年):<br>
   * Zhongguo fosizhi congkan 佛寺志叢 刊. Hangzhou: Guangling shushe 廣陵書社 2006 . Compiled by Zhang Zhi 張智. 130 vols.
   1執行出版「 佛寺志叢 書」計畫。(12部寺志,共15冊)<br>
   2複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇。<br>


  其目標在於至2010 完成數位化200多個佛 寺志 ,並使其圖檔資料庫得以免費公開使用。另外,尚有10志全文資料處理了時間、人物及地點的標記。此一專案能本校其他專案——佛學規範資料庫專案相結合 Buddhist Authority Database Project(http://authority.ddbc.edu.tw/)。該數位典藏的工作將持續至2011年,除進一步數位化 外,也透過書目研究和 標記 能使價值提升
  第三階段(102 ):<br>
 進行明丹本85部 寺志之 初階 標記。<br>


===預算===
第四階段(103年~104年):<br>
 進行廣陵本124部寺志之初階標記。<br>


  此專案預計執 行年 度為97~99 共計3 年, 由中華佛學研究所贊助
  第五階段(105年~108年):<br>
  第一 經費57 萬。
 進 明丹本寺志之點校,以製成更便利後人閱讀的版本。<br>
 1. 105 :點校18部寺志 約120萬字。<br>
 2. 106年:點校4部寺志,約60萬字。<br>
 3. 107 :點校12部寺志 約71萬5千字 <br>
   4. 108 :點校9部寺志,約60 <br>


===執行單位 數位典藏組===
人力 <br>
 時程控管 1人<br>
 程式設計 2人<br>
 標記人員 3人<br>
 後設資料建置人員 1人<br>
 義工 1人<br>


  進度 及預算控管: 柯春玉
==執行單位==
 程式及介面撰寫: 花金地
執行單位:法鼓佛教學院數位典藏組<br>
 標記: 林智妙、游美燕 、彭川芩 、何易儒、 王秀雯.
主持人:Marcus Bingenheimer 馬德偉博士(97年~102年)、洪振洲博士(102年~108年)<br>
  權威 資料庫: 闕慧貞
  時程 及預算控管 柯春玉 (97年~102年)、林智妙(103年~108年)<br>
網頁美工設計:李承崇.
 程式及介面撰寫 花金地 、李志賢、周邦信<br>
經驗指導:張伯雍
 標記 技術人員: 林智妙 、林綉麗、王秀雯 、游美燕、何易儒、 詹麗春<br>
新式標點人員:蔡謀芳、張革丰<br>
  佛學規範 資料庫 維護人員: 闕慧貞 、葛賢敏<br>


== 執行步驟== 
==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E5%B7%A5%E5%85%B7#.E5.B7.A5.E5.85.B7 參考工具]==
1 網頁工具<br>
 1.1 文本介面<br>
 1.2 規範資料庫<br>
 1.3 工作手冊<br>
 1.4 TEI 網站<br>
 1.5 漢字處理<br>
 1.6 辭典類<br>
 1.7 標點符號用法<br>
 1.8 人名查詢<br>
 1.9 地名查詢<br>
 1.10 時間查詢<br>
 1.11 綜合查詢<br>
 1.12 古籍文獻資料庫<br>
 1.13 學校相關網頁<br>
 1.14 在Y公共磁碟區上的工具檔<br>
2 操作技巧<br>
 2.1 幾個快捷技巧<br>
 2.2 在Oxygen下<br>
 2.3 在Oxygen xpath下<br>
 2.4 標記元素中文化<br>
 2.5 wiki 語法<br>


==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%9F%B7%E8%A1%8C%E6%AD%A5%E9%A9%9F 前置作業]==
1 叢書目錄建立<br>
2 地理資訊建立<br>
3 文字輸入<br>
4 文字校對<br>
5 掃描<br>
6 Metadata建置<br>


==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%A8%99%E8%A8%98%E4%BD%9C%E6%A5%AD 標記作業]==
1 工作準備<br>
2 檔案架構<br>
3 加facs碼<br>
4 段落形式<br>
5 標記元素<br>
6 字元層次<br>
7 標記問答<br>
8 佛寺志PDF版<br>
9 佛寺志粗標<br>


===目錄建立===
== 點校作業==
[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E9%BB%9E%E6%A0%A1 佛寺志點校]<br>
1. 佛寺志點校須知_Oxygen作業<br>
2. 佛寺志點校須知_txt作業<br>
3. 佛寺志異體字處理規則(2018年版)<br>


中國佛寺史志彙刊1-3輯共110冊 Bibliography 目錄建立(妙妙)
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97python%E7%A8%8B%E5%BC%8F%E7%9A%84%E6%87%89%E7%94%A8#python.E7.A8.8B.E5.BC.8F.E7.9A.84.E6.87.89.E7.94.A8 python程式的應用]==


  ●xml檔頭宣告
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 特字處理]==


  符合tei 標準,兩個 驗證 程式Schema(rng、rnc),輸出程式stylesheet
==[http://wiki.dila.edu.tw/pages/%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E9%A9%97%E8%AD%89#.E8.A6.8F.E7.AF.84.E8.B3.87.E6.96.99.E9.A9.97.E8.AD.89 規範資料 驗證]==


  ●登錄項目
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E4%B8%8A%E5%82%B3%E5%88%B0FTP 上傳到FTP]==
     <bibl>
      <title>
      <biblScope>
      <spanGrp>
      <respStmt><name><date>
     <edition><date when="">or<date notBefore="" notAfter="">


  ●加入kml於目錄中
==輸出佛寺志的純文字檔==
  於</bibl>結束前加
1. 在ruby資料夾下執行ruby x2t.rb
  <note type="place">河南洛陽</note>
  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb
  <note type="longlat">34.7203(緯度),112.6193(經度)</note>
  </bibl>


===共八個志 Keying 外包打 加粗標(春玉)===
2.純文 檔將會產生在output資料夾內
  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text


3.將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。


  ●外包打字加粗標
==Github版本管理操作說 ==
   *  州阿育王山志一 N29.859 E121.745
[http://wiki.dila.edu.tw/pages/Git 《Pro Git》繁體中文翻譯]
 
   * 明州阿育王山志二,續志
  
   * 重修普陀山志 N29.9835 E122.3795
  
   * 玉岑山慧因高麗華嚴教寺志 N30.2304 E120.1259
  
   * 泉州開元寺志N24.9232 E118.5837,
  
   * 廈門南普陀寺志N24.4424 E118.0929
  
   * 雞足山志 N25.9704 E100.3745
  
   * 雞足山志
  
   * 黃檗山寺志N25.5845 E119.2715


=== 轉粗標為正確 標記( 小花)===
=== 如何取得以前的某個版本===
  pb+p
1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
2.選擇想要 版本 => 按右鍵 => Create Branch at this version
3.輸入 branch 名稱 ( 自己可以訂) => ok => 可關掉這個視窗
4.回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
  (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
  5.在branch欄點選想要的版本(切換branch)=> ok=> close
6.回到專案資料夾 => 將需要的文件複製出來
7.在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱(確定已切換回 master版本)
8.(若有必要時,可將複製出來的文件貼回master版本文件中。)


==== 標句讀(春玉)====
=== 如何取得以前的某個版本(單一檔案)===
  如果二個人標同一文 句讀時, 共同合作一星期,以取得標 用法 共識
1.在想要擷取的檔案或資料夾(例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
  2.點選想要的版
3.在下方欄位中會出現當次push的檔案,點選想 的檔案,再點滑鼠右鍵
4. 選Save revision to...,儲存到自己指定的路徑
5.關掉log messages,到自己指定的路徑去便可看到下載 檔案


=== 掃瞄檔列印(筆一校用)(小芩)===
=== 如何刪除某個 branch===
  
  1.在整個 專案 資料夾上按右鍵 => TortoiseGit => Git GUI =>
  ●開啟檔案,選取 Windows Picture and  Fax Viewer(山水圖案)
  2.(功能 上)Branch => Delete => Local Branches欄內點 要刪除的分支名稱=> Delete =>關掉Git GUI視窗
   
  ●點擊列印
|相片精靈(請耐心等待 約20秒~60秒後出現)
|圖片選項
|選取張數(佛寺志 專案 掃瞄列印通常為整本所以是全選)
  |
|列印喜好設定
|原稿型態:雙面書本
|選取版面設定:二合一
|順序:由右至左 
|選取版面設定
|全頁傳真列印完成


===共110冊 Scanning 掃瞄 (伯雍,Simon)===
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97xml%E8%BD%89html xml轉html]==


   * 選擇掃瞄檔案儲存為Tiff
==[http://wiki.dila.edu.tw/pages/%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E6%9B%B8%E7%9B%AE 建立參考書目]==
   * 解析度為400dpi 像素是 1945x2992
   * 8 bits 灰階。( 不是黑白 )
   * Tiff 轉 jpg(網頁用)
   * Jpg 為 Tif的4/1 像素是 486x768
   * jpg檔加浮水印
   * 切邊


==Metadata==
*對外公開的 metadata: [[佛寺志 Metadata]]
*內部的 metadata: [[佛寺志 Content Metadata Version 2]]


==發行==
====[http://buddhistinformatics.dila.edu.tw/fosizhi/ 佛寺志網路版]<br>====


=== 共110冊 Metadata 建立 (家名,秀雯,Simon)===
====佛寺志紙本書====
 中華佛寺志叢書〈12部寺志,共15冊〉<br>
 ISBN:978-957-17-2177-4<br>
 出版社:新文豐<br>
 出版日:2013/06/01<br>
 內容:<br>
    01. 清涼山志<br>
    02. 峨眉山志<br>
    03. 重修普陀山志<br>
    04. 普陀洛迦新志<br>
    05. 九華山志<br>
    06. 天台山方外志<br>
    07. 明.明州阿育王寺志<br>
      清.明州阿育王續志<br>
    08. 寒山寺志<br>
    09. 玉岑山慧因高麗華嚴教寺志<br>
    10. 黃檗山志<br>
    11. 泉州開元寺志<br>
    12. 雞足山志<br>


<syntaxhighlight lang="XML">
==一 般庶務==
* 建立掃瞄 Tiff 數位圖檔的 Metadata
1. 電腦 春玉 回報 資訊組窗
* 一本佛寺志各頁的掃瞄圖檔放在同一資料夾
 報修人員並 在google 文件中, 填妥報 修情況 資訊
* 一本佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
* Metadata檔案內依序記錄每張掃瞄圖檔之資訊
* 每張圖檔資訊記於一組<div></div>內
</syntaxhighlight>
 
<syntaxhighlight lang="XML">
舉例如下:
 
<div n="1Book005/1B005P011">
<list>
<item n="1">1B005P011</item>
<item n="2">內文</item>
<item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
<item n="4">g006p0978</item>
<item n="5">放生池</item>
</list>
</div>
 
內容說明:
 
<item n="1">1B005P011</item>
  1)指數位圖檔的檔名。
  2)每 頁都有一個數位圖檔。
 
<item n="2">內文</item>
 1)志文分成5個分類:a)書名頁或題詞 b)版本說明 c)杜目錄 d)內文 e)圖 f)空頁。
 
   注意:a)古文內的目錄,分類屬"內文",標題則作"目錄"。
      (因古籍內的目錄有頁碼,屬古籍內文的一份部,頁碼為g***p****。)
      b)杜潔祥編的目錄改為"杜目錄",以與"古籍內的目錄"以為區別。
 
<item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
  1)每頁的標題。
  2)以「-」(dash)表達漸層關係。
  3)以「/」(slash)隔開同一頁上的不同標題。
  4)若是空白頁,無標題,以”none”表示。
 
<item n="4">g006p0978</item>
  1)頁碼:前3碼為志碼,後4碼為內文本身的頁碼。
  2)頁碼種類如下:
 
   a)書名頁頁碼(f+1碼數字):g***f*
   b)版本說明頁碼(無頁碼):g***p0000a 
   c)目錄頁碼(c+3碼數字):g***c***
   d)內文頁碼(p+4碼數字):g***p****
  
  注意:1)頁碼都以小寫表達,組成方式是:[志碼+頁碼]
    2)若插圖無頁碼,則以[前一頁的頁碼+英文字母]。
    3)需另外記錄插圖的數目,以作統計使用。
     4)無頁碼的編碼原則:前一頁頁碼+英文字母。
 
     a)舉例:
 
      g***p0011
      無頁碼-----------則編為:g***p0011a
      g***p0012
 
      b)版本說明,因無前一頁,故編為:g***p0000a  
 
<item n="5">放生池</item>
  1)前三個字,從每一頁的右上角數過來。
  2)若無前3個字,如空白頁,則以"none"表示。
  3)若遇糢糊不清的字,則以[?]表示。
 
  注意:
  1)每一個數位檔都需對照文本,以確定數位檔沒有lost,
   若有任何一個lost,則後面所有的metadata資料無法與圖檔對照起來。
  2)若有數位檔檔lost的部份,請與伯雍聯繫,請他更正補上。
 
 缺字
1)至cbeta漢字工具,教育部異體字網站,unicode查找。
2)若無法貼上,需作缺字庫。(待續)
 
 完成檔案
1)以.txt 存於 Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff
  與佛寺志的數位圖檔放在一起。
2)每一個資料夾對應一個Metadata的檔案。
3)資料夾 1Book001 表佛寺志第一輯的第一本數位圖檔,對應1Book001.txt
  (updated by Sophia 2009-06-25)
 
</syntaxhighlight>
 
===metadata 檔案匯入MIX標記架構內(小花)===
MIX架構含:head, mix, map
 
====Metadata 問題與解答====
1.目前的 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可,
  type多增加一個圖&空頁
2. 若內文的漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense)
3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?]表示
4.版本說明及內文插圖無頁碼?
  版本說明的頁碼:g***none; 內文插圖的頁碼:none (不作g,以跟版本說明作區別)(110冊約只有3~4個無頁碼)
5.若是空白頁,標題及末3個字處,統一以"none"表示。
[[#簡介及目的(春玉)|返目錄]]
 
===八志的文本標記(April, 妙妙,美燕,小芩,易儒,秀雯)===
 
====資料路徑與操作技巧====
 
=====●工具=====
 * Authority書籤:http://share.foxmarks.com/folder/rss/osyCa6r9nX
 * 中國基本古籍庫 http://10.10.1.20/
 * CBETA 字辭典資料網(有big5的字代表可以打得出來,故不用組字式及給CB碼)
   http://dict.cbeta.org/word2/search.php
 * oclc查詢系統(查詢書籍用) http://www.worldcat.org/search?q=%E4%B9%9D%E8%8F%AF%E5%B1%B1%E5%BF%97&fq=dt%3Abks&dblist=638&qt=first_page
 * 在線新華字典 http://xh.5156edu.com/html4/8952.html
 * 標點符號用法  CBETA  http://www.cbeta.org/xb/table.htm
   教育部 http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo
 * 缺字查詢介面(維博士提供)維博士的缺字查詢網址: http://app.kita.zinbun.kyoto-u.ac.jp/ids-find
 * 漢字檢索工具 http://mousai.kanji.zinbun.kyoto-u.ac.jp/ids-find  
 * unicode 網址: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35
 * 漢語拼音: http://www.iq-t.com/SYSCOM/pingying2.asp
 * 文字轉拼音工具-1: http://tdc.putonghuaonline.com/tools2.html
 * 文字轉拼音工具-2: http://www.iq-t.com/SYSCOM/pingying2.asp
 * 繁簡轉換工具: http://tdc.putonghuaonline.com/tools3.html
 * 教育部異體字字典:  http://dict.variants.moe.edu.tw/suo.htm
 * 《重訂標點符號手冊》查詢網址:  http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo
 * 國語辭典:http://dict.revised.moe.edu.tw/index.html
 * 漢典:http://www.zdic.net/
 * 漢語字典(可查找"四角號碼"和"漢語拼音"):http://www.zdic.net/zd/
 * 查詢書法字體(請輸入簡體檢索字):http://mail.google.com/mail/?hl=zh-TW&utm_source=zh-TW-et-more&utm_medium=et&utm_campaign=zh-TW&shva=1#sent/123071b89c999916
 * TEI: http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html
 * 二十五史http://www.sinica.edu.tw/ftms-bin/new/ftmsw3?tdb=%A4G%A4Q%A4%AD%A5v
 * 呼嚕嚕 hoolulu:http://www.hoolulu.com/core_zh/
 * 宋史研究網:  http://www.ihp.sinica.edu.tw/~twsung/scholar/scholarframe.html
 * 宋史檢索: http://www.ihp.sinica.edu.tw/~twsung/search/search.html
 * MapABC地圖搜索:http://www.mapabc.com/localsearch.shtml
 * Google地圖:http://ditu.google.com/
 * 搜狗Sogou地圖:http://map.sogou.com/new/#c=13222250,3747750,11
 * 維基百科:http://zh.wikipedia.org/w/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh-hant
 * 法鼓維基首頁:http://wiki.ddbc.edu.tw/pages/%E9%A6%96%E9%A0%81
 * 批次改檔名工具:UltraRename28b.exe
 * 批次改檔名路徑J:\CND\Projects\2008BTG佛寺志\work\工具\UltraRename28b.exe
 * 同文堂(僅限Firefox網頁使用下載-簡繁體轉換):http://of.openfoundry.org/projects/333/download
 * 復旦版歷史地名資料庫有歷史地名釋文  http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp
 * cbeta網站 http://www.cbeta.org/download/cbreader.htm
 * 台北版佛典集成 缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
 * 字符編碼理解  http://www.donews.net/holen/archive/2004/11/30/188182.aspx
 * 全字庫  http://www.cns11643.gov.tw/web/index.jsp
 * UTF-8維基百科  http://zh.wikipedia.org/w/index.php?title=UTF-8&variant=zh-tw
 * Unicode維基百科  http://zh.wikipedia.org/w/index.php?title=UTF&variant=zh-tw
 * 十六進位維基百科  http://zh.wikipedia.org/w/index.php?title=十六進制&variant=zh-tw
 * 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw
 * 吳疆教授(亞利桑那大學東亞研究所,對中國佛寺志有鑽研)
   網址:  http://bgis.coh.arizona.edu/
   聯絡信箱: jiangwu@email.arizona.edu
 
=====● 資料路徑=====
 
  ●清除折行多餘空格程式(doConcat.py):Y:\Projects\fosizhi\work\tools\cleanBK
  ●缺字輸入介面 http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
  ● 首頁 http://10.10.0.49/fosizhi/index.html
  ● 中國佛寺史志內部網址  http://10.10.0.49/fosizhi/ui.html
  ● 中國佛寺史志外部網址  http://140.131.254.11/fosizhi/ui.html
  ● 節點頁面網址: http://10.10.0.49:8080/fosizhi_json/
  ● 總目錄標記問與答,存放路徑  J:\CND\Projects\2008BTG佛寺志\work\標記\目錄\目錄標記問與答.odt
  ● 佛寺志作業時程 http://spreadsheets.google.com/ccc?key=py-MCl83eYhHl-WYd8FBcFA&hl=zh_TW
  ● 掃瞄檔 http://10.10.1.11/Temple_Gazetteers_Tiff/    密碼:tg_project
  ● 佛寺志專案工作檔: J:\CND\Projects\2008BTG佛寺志\work\
  ● 工作時數登記表  J:\CND\Projects\2008BTG佛寺志\行政\人事\工讀金\
  ● DDBC 檢索網址 http://isearch.ddbc.edu.tw/
  ● 人名、地名、時間權威檔login: http://authority.ddbc.edu.tw/login.html
  ● 人名權威檢索查詢:http://authority.ddbc.edu.tw/person/ 
  ● 地名權威檢索查詢: http://authority.ddbc.edu.tw/place/
  ● 時間權威檢索查詢: http://authority.ddbc.edu.tw/time/index1.html
  ● 權威檔修改-Google文件:http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com
  ● GIS專案 http://buddhistinformatics.ddbc.edu.tw/gaosenggis
 
=====● 操作技巧=====
   幾個快捷技巧:
   Alt+ Tab  切換文件
   Ctrl+ R  html重新整理
 
   在Oxygen下:
   Ctrl+ E  下標記
   Ctrl+Shift+ V  valid
   Ctrl+Shift+ W  well form
   Ctrl+Shift+ <  加註;取消註
 
   在Oxygen xpath下:(Perspective → Show Toolbar → XPath)
   //pb → 找所有<pb>(同理可推:找placeName---)
   //pb[@='0100'] → 找第100頁
   //persName[.='名字'] → 找出某人名
 
  清除折行多餘空格的方法(使用doConcat.py程式)
   1.程式存放路徑:Y:\Projects\fosizhi\work\tools\cleanBK
   2.將要處理的檔案放在srcXml資料夾內(mian檔不須放)
   3.利用FreeComander內的"DOS視窗"執行doConcat.py程式
    Y:\CND\Projects\2008BTG\work\tool\cleanBK>doConcat.py(按Enter)
   4.再到output資料夾中,就可看到轉好的新檔案了
 
  使xml文件標記元素、屬性呈現中文解說的方法
   在xml文件內
   →點選功能列上Document
   →XML Document
   →Associate Schema
   →RelaxNG Schema(Compact syntax),URL選用新的Schema
   →ok
   之後,就會在文件上看到新增的聯繫<?oxygen RNGSchema="../../schema/gazetteers.rnc" type="compact"?>
   而後,標記時,當打上角括,其所出現的元素表,每一個元素都會有中文解釋。
   或者,將游標移到元素或屬性上時,也會出現中文解釋。
 
[[#●工具|返工具]]
 
=====● 觀念:=====
 
'''1. 標記前先找該本的相關資訊,例如是否有白話本,是否已有標句好的文本等'''
 
'''2凡用 電腦 可一併處理的,就不一一標記'''
 
====二、檔案架構說明====
 
  *  J:\CND\Projects\2008BTG佛寺志\work\標記\標記範本\併檔範本\併檔架構說明
<syntaxhighlight lang="XML">
  *  g0××_00.xm之檔頭宣告 與 <div>檔,均須提供元素類型名稱<div type="××××">目的:建置佛寺志網頁卷之節點名稱.(Erica;2009/01/19)
ex:<div xml:id="g077_00.xml" xmlns="http://www.tei-c.org/ns/1.0" type="九華山志"> 及<div type="圖文">.
</syntaxhighlight>
<syntaxhighlight lang="XML">
  *  卷前之【版前說明】或【卷前圖說】均放置g0××_00.xml檔案裡,以<div></div>包起來.(Erica;2009/01/19)
</syntaxhighlight>
<syntaxhighlight lang="XML">
  *  卷前之【無頁碼】 標法為<pb facs="1B020P003.jpg" n="0000a"/>(Erica;2009/01/19)
</syntaxhighlight>
 
====三、用轉好的檔案作業====
 
  *  J:\CND\Projects\2008BTG佛寺志\work\database\原始檔\BTG加p加pb\output\
 
====四、xml轉html步驟====
 
安裝oxygen 9.1
 
=====由gxxx_main.xml主檔 呼叫html.xsl=====
 
1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形)
  進入轉檔介面,選New(第一次建立html檔後,
  若所設定的路徑都沒變動的話,以後直接點Transformation now即可;
  若有要更改路徑的話,點Edit進入介面去 改即可)
2.進入Edit scenario 介面
  a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl)
  b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK
3.此時進入到下一個介面,點Transform now,即可產生html檔案
4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾
 
安裝 exist.jnlp 上傳檔案
 
1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
   (1)main主檔要經valid驗證 --沒有點點的紅勾勾
   (2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
   請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(單卷)→Select files or directories store →Close
 
=====佛寺志網頁=====
● 編輯網址: http://dev.ddbc.edu.tw/fosizhi/index.html
 
● 節點頁面網址: http://10.10.0.49:8080/fosizhi_json/
 
● HTML檔介面定案:人名/地名/時間 分三種顏色。
  例如:  地名 與 地名代名詞<ref>--------綠色
     時間 與 時間代名詞<ref>--------藍色
     別名 與 人名代名詞<ref>--------紅色
     人名(常名)--------------------加底線 (紅色)
 
=====介面程式撰寫 (小花)=====
 
===建立參考書目(妙妙,美燕,秀雯)===
 
 ●中研院書目參考網址:http://74.125.95.132/search?q=cache:JpyJD9HKveUJ:saturn.ihp.sinica.edu.tw/~dahcr/916c5-b4.doc+宋人傳記資料索引&cd=8&hl=zh-TW&ct=clnk
 
 ●存放路徑 Y:\CND\Projects\2008BTG\markup\bibliography
 ●gazetteerBibl.XML
 
 ●參考書目人名與書名的中英文寫法<author><hi>Wei</hi> Songshan 魏嵩山</author><title>Zhong Guo Lishi Diming Dacidian 中國歷史地名大辭典</title>
[[#簡介及目的( 春玉)|返目錄]]
 
==標記內容(+電1校)==
 
===標記重點:人名、地名、時間===
建置說明請參照凡例: [http://wiki.ddbc.edu.tw/pages/「專案整合權威資料庫」工作手冊 專案整合權威資料庫工作手冊]
====(1)人名<persName>====
 
 ※'''文獻查詢順序:1)宋僧錄 2)疑年錄 3)佛百、佛光 4)[http://authority.ddbc.edu.tw/AuthorityBibl.html Authority]所提供的其他參考書目 5)網路資訊(請參照[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 「專案整合規範資料庫」工作手冊 ]工作手冊1.編輯格式之第6項目說明)'''
 
●人名標記:<persName key="AXXXXXX">某某某</persName>
  說明:
  例 :今司寇平湖陸杲公來游茲山,瞻禮舍利。
  今<persName key="A004257"><roleName>司寇</roleName><placeName key="CN0330482Z08AA">
  平湖</placeName>陸杲<roleName type="honorific">公</roleName></persName>來游茲山,瞻禮舍利。
 
  例二:明慧廣禪師,俗姓姚,諱讓義,梁溪人。年三十祝髮為沙門,法名真緣,道號慧廣。
  明<persName key="A007784">慧廣<roleName>禪師</roleName></persName>,俗姓姚,諱讓義,梁溪人。年三十祝髮為沙門,法名真緣,道號慧廣。
  說明:由於前面"慧廣禪師"已標人名,後面的讓義、真緣、慧廣就不再標人名。因為他們距離很近,大家很容易就可以辨別內文的人物敘述指的都是"慧廣禪師"。
 
●人名規範 料庫建檔
 ※'''須先申請帳號密碼'''
  *查詢人名id碼:"人名規範資料庫" http://authority.ddbc.edu.tw/person/
  *新增人名id碼:"人名規範資料庫維護" http://authority.ddbc.edu.tw/welcome.php
 ※人名規範資料庫建檔方式,請參閱 DDBC_wiki [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 「專案整合規範資料庫」工作手冊 ] 建置「人名規範資料庫」
● 有關人名的問與答
 ※王居士、母龔氏等是否標記?
  A:可。但請儘量在規範資料註解欄提供相關可辨識的 息。
 ※某仙人,是否標人名、是否給id碼?
  A:否
 ※人名前的地名,地名不包進人名中。
   例:杭州徑山晦機元熈禪師
   <placeName>杭州徑山</placeName>杭<persName>晦機元熈<roleName>禪師</roleName></persName>
 
● 人名群組的標法
  <persName key="G000001">...</persName>
 
● 人名規範資料建檔注意事項
  ※人名規範資料,生卒年、籍貫欄位應填ID碼。
  ※註解欄中則不複註上方欄位(別名、生卒年、籍貫)中的資料,但有疑異者可記錄於註解欄中。
  ※人名規範資料中,常名要冠姓。
   別名(字、號)不必一定冠姓,僧人不必一定冠釋。(依文本)
  ※人名規範資料,人名中有缺字時,人名欄用通用字表示,並在註解中說明。
   例:人名:大[金*本] 註解欄:{大[unicode code]}
  ※人名規範資料中,常名若為破音字時,可將常名漢語拼音放進註解欄中,
   並用{}括住。例:鳩摩羅什{jiu1 mo2 luo2 shi2}
  ※人的生卒年跨朝代時,朝代欄位取卒年朝代。
  ※若知卒年及歲壽,生年的計算=卒年-歲壽+1
  ※人名生卒年的取捨,若資料來源有西元年及中元年,以取中元年為依。例:重顯(參看佛百)
  重顯,(980~1052)宋代雲門宗僧。於皇祐四年入寂。
  建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。
[[#(3)時間<date>|返時間]]
 
====(2)地名<placeName>====
 
 ※'''文獻查詢順序: 1)  [http://authority.ddbc.edu.tw/AuthorityBibl.html Authority]所提供的其他參考書目  2)  中國歷史地圖集  3)  網路資訊(維基等)'''
 
 * '''查詢'''地名id碼網址:"地名規範資料庫" http://authority.ddbc.edu.tw/place/
 * '''新增'''地名id碼:"地名規範資料庫'''維護'''"http://authority.ddbc.edu.tw/login.html
   (e-lib→佛學研究平台→佛學地理名詞權威檢索→輸入地名後,按submit→取Project­_No碼
   作為xml:id碼) 
 * 確認查找古今地理位置: 安裝 Super GIS 軟體
  (利用Super GIS所提供的地理圖層可幫助確認古今地名正確位置)
 * 世界地圖: J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
 * ccts使用教學影片:J:\CND\Projects\2008AuthorityDB\SuperGIS2.2\CCTS\CCTS \ccts.swf
   (感謝GIS伯雍提供)
 * 中央研究院提供地圖工具 http://gis.rchss.sinica.edu.tw/google/?p=301
=====(一)內文標記方式=====
* 地名的標法
  例:<placeName key="Z13005440">雒邑</placeName>
* 地名群 的標法:
  例:<placeName key="CN0000000G01AA">...</placeName>
 
=====(二)新增/修改地名之介面說明=====
 
'''新增'''資料建檔方式
 ●第一步驟說明:
      1.進入"地名規範資料庫'''維護'''"http://authority.ddbc.edu.tw/login.html
      2.跳出「有問題的地名」頁面時-不理會請Delete(快速鍵:Ctrl+ W 鍵)即可進入「地名檢索」頁面
      3.地名檢索下方「管理功能」點選「新增地名」
        * 地名檢索條目說明如下:
                 地名檢索字串:提供任一關鍵字即可。
                 編號搜尋:以CN碼為主。
                 Z碼搜尋 :以Z碼為主(中研院所提供之編碼)。
                 複合搜尋:複合關鍵字搜尋(隔開標點符號為逗號,)以利更快速精準的查詢功能。
                      範例:浙江,四明山(此為複合關鍵字)
                 管理功能:僅提供有權限人員使用欄位。
      4.選擇「地理區域範圍」(三種區域包括:中國、中國境內跨區、其他國家)
  a)已知固定範圍之地理區域(中國)項目說明:    
   區 域:選擇地名之省、市、縣或區,確認最小範圍後點選「選取此地區」。(資料不足可選擇最大範圍-省)
   分 類:參考[http://wiki.ddbc.edu.tw/pages/%E5%9C%B0%E5%90%8D%E7%B7%A8%E7%A2%BC%E5%8E%9F%E5%89%87 地名編碼原則]之「屬性編碼」方式,選擇適當代碼。
   獲得編碼:選「按此取得編碼」(請再次檢查編碼的正確性)。
   編碼結果:選「使用此碼」(新增編碼成功後,不可隨意更改編碼。)
   清除資料:可重填(重點原則是'''尚未點選'''「使用此碼」之前)。
  b)跨區(中國)項目說明: 
   先選擇一個區域:參考[http://www.xzqh.org/QUHUA/index.htm 中華人民共和國行政區劃]之「中國政區」區域範圍說明。
   分 類:參考[http://wiki.ddbc.edu.tw/pages/%E5%9C%B0%E5%90%8D%E7%B7%A8%E7%A2%BC%E5%8E%9F%E5%89%87 地名編碼原則]之「屬性編碼」方式,選擇適當代碼。
 ●第二步驟說明:
      1.取得編碼後出現「修改地名」視
      2.繼續填寫「基本資料」欄
   Level:(不必填)
   朝 代:慣用名-使用條件為『不受年代變動的影響之地名』。(範例:長江、四明山..等)
   經緯度:座標來源可利用[http://maps.google.com/maps Google Map] 『我的地圖』之『[http://maps.google.com/gadgets/directory?synd=mpl&hl=zh-TW&gl=TW&backlink=http%3A%2F%2Fmaps.google.com%2Fmaps%2Fmm%3Ft%3Dh%26hl%3Dzh-TW%26ie%3DUTF8%26ll%3D30.229246%2C120.12768%26spn%3D0.006322%2C0.007671%26z%3D17&cat=new 更多小工具]』新增 getLatLongPlus2
   座標型態:選擇條件說明:
      1.已考定(精確)-已確定之精確座標位置
      2.已考定(預設值)-須進一步雙重確認
      3.待考-尚未考察或須待確認
      4.不可考-已考察並確定此地名不存在或無可考
   拼 音:(不必填)
   說 明:(可不必填)填寫須具備以下條件:
      1.簡潔說明(僅提供地名本身須註解部分,不提供文本相關資料。)
      2.使用全形標點符號,如下所示:,。、;:!?.「」『』()《》〈〉[]……
      3.提供來源出處(須參考[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 「專案整合權威資料庫」工作手冊 ]凡例之1.3 註解 note項目說明)
   加入超連結:引用網路資料之網址。
        操作方式說明:先置入網址於說明欄內,並複製全選網址後,再一次點選「加入超連結」貼上網址按確定即可。
 ●第三步驟說明:
      1.繼續填寫「地名部分」欄
      2.「常名」:須符合當時年代所常用之名稱(僅可提供一個常名),於「是否常名」欄中選「是」即可。    
 ●第四步驟說明:
      1.按「修改資料」即成功完成新增建檔。(切記:若沒有先按「修改資料」而繼續登錄以下之項目「新增來源資料」將面臨前功盡棄的殘酷事實。)
      2.其他別名:限定條件須為同年代(因特殊地理位置或其他原因而給予的名稱(可提供多個名稱)),均於「是否常名」欄中選「否」即可。
 ●第五步驟說明:
      1.再次新增/修改地名時,於"地名檢索結果"頁面,點選「修改這筆資料」即可。
      2.「新增來源資料」(source)僅須登錄一筆即可。範例:g017p0001
  ※'''基本資料欄'''中須注意事項:
  a)必備四樣資訊:朝代、經緯度、地名部分、來源資料。
  b)文本之寺院內建築必須給ID及經緯度。常名建置。範例:慧因寺妙應殿
   ex:<placeName key="CN××××××T××AB">寺院內建築</placeName>(ID=CN××××××T××AB)
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
  d)尋找網路資料時,優先採用順序以[http://share.foxmarks.com/folder/rss/osyCa6r9nX Authority]所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
  f)失落或無可考的建築物及地名可不提供經緯度,但'''文本須標記'''並於
   地名權威資料庫建置地名以供日後檢索。
 
{| cellspacing="0" border="1"
!建築物
!XML(文本內文)
!地名基本資料欄
!經緯度
|-
|存在
|給I D 標<placeName key="×××">
|須建檔
|提供最大範圍 例如:省、區、寺院
|-
|不存在
|給I D 標<placeName key="×××">
|須建檔
|提供最大範圍 例如:省、區、寺院
|-
|無可考
|不給I D 文本標<placeName>以顏色區分
|須建檔
|不給
|}
 
'''修改'''資料建檔方式
     ●第一步驟說明:進入"地名檢索結果"頁面
     ●第二步驟說明:點選「修改這筆資料」(編碼和行政區不可修改)
     ●第三步驟說明:「地名部分」及「新增來源資料」僅開放新增或修改,無法執行刪除動作。
     ●第四步驟說明:新增別名時,於下方「新增其他別名」後,按「新增」即可。(限定條件須為同年代的別名)
 
 ※修改資料中須注意事項:
  a)編碼和地理區'''不輕易'''改編碼。
  b)若需'''改編碼後務必登錄'''[http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com 權威碼修改]申請隱藏該筆資料,以利後端程式人員通告相關人員。
  c)資料庫無刪除動作,僅可向authority維護人員 報修 登錄[http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com 權威碼修改]隱藏該筆資料。
 
 ※註:
  地名範例:四川行都司(明) 
  a)編 碼: CN513401Z39AA
  PrjNo:Z02018021
  Class_id:02_ BF(BF表示軍地)
 
<syntaxhighlight lang="XML">
※注意:
Google上的地圖與衛星圖的經緯度不一致,有很大的落差,
在標經緯度時以衛星圖為主,原Authority內定的Map是以
地圖為主,現已將Map改成Mix。另外,因衛星圖沒有較小的
市街道名,故無法精確將經緯度落在正確的位置上。(by Sophia 6-10)
</syntaxhighlight>
 
[[#(2)地名<placeName>|返地名]]
 
====(3)時間<date>====
 
● 查詢時間id碼網址:"時間規範資料庫" http://authority.ddbc.edu.tw/time/
 
● 時間的標法說明:
 
(a)為明確時間點的標法(某年某月某日)(用when)
 
<date when="西元年-西元月-西元日" xml:id="d(此日id碼)(此日id碼)">內文時間</date>
  例:<date when="1610-07-06" key="d58208525820852">萬曆庚戌年五月十六日</date>
 
(b)為區段時間點的標法(某年或某月中的某些日子)(用notBefore notAfter)
 
 例1:<date key="d57020065702359"
    notBefore="1285-02-06" notAfter="1286-01-25">至元廿二年</date>
   (notBefore:至元廿二年的第一天   notAfter:至元廿二年的最後一天)
 例2:<date key="d59174915929893" notBefore="1875" notAfter="1909">清光緒年間</date>
   (notBefore:清光緒的第一天   notAfter:清光緒的最後一天)
 
(c)事件進行為持續整個時段(用from to)
 
 例:明逕壁立禪師,生崇禎壬午年五月念七日寅時,雍正甲辰四月十二日說偈訣眾。
 壽<date key="d58325275862427" from="1642-06-23" to="1724-05-04">八十三</date>
 
● 初年,末年時間的擷取原則
  取當朝、當年號、當年的前1/4或末1/4
 
● 時間為民國的標法說明:
  *查詢ID: 用檔案 GISapD\資料表\ADDate&SB西元與日干支
  例: 民國十三年甲子九月 (出自 : 泉州開元寺志  第十一頁  第二行 )
  步驟一 : 至 http://destiny.xfiles.to/tools/calendarVS.html 查詢西元日期;
      結果為 西元 1924年9月29日至 1924 年10月27日
  步驟二 : 開啟GISapD\資料表\Addate&SB西元與日干支;
      找 ADDate中 +1924-09-29 的日期 ;
      得到 DateID 為5935623查詢 +1924-10-27 則得到DateID碼為5935651
  步驟三 : 得到ID碼後則可標記為<date when="1924" key="d59356235935651">
      第二次出現及以後 , 則標為<date when="1924" key="d59356235935651">
 
● 有關時間的問與答
  ※萬 丙子秋 (=萬曆丙子秋)
   A:照標時間,空格不再處理。例:<date> 萬 丙子秋</date>
  ※<date>: key notBefore notAfter  次序是否統一?
   A:不必統一。元素中若有多個屬性,其先後順序不會影響驗證或呈現。
  ※康熙年間,"年間"是否包進時間?
   A:可包進時間內。
 
* Datecode查詢為id碼(d59356235935651)返回查詢系統
[[#(1)人名<persName>|返人名]]
 
====(4)"群組"規範資料====
 
 ●網底顏色區分:粉紅底→代表群組
       蘋果綠→代表個人
 
<syntaxhighlight lang="XML">
●規範資料"群組"的建置
  人名群組:<persName key="G000001">...</persName>
  地名群組:<placeName  key="CN0000000G01AA">...</placeName>
</syntaxhighlight>
 
===建置【來源出處】注意事項===
 
  ● 出處在''' CBETA''' 者。請建置在「新增來源資料」''' CBeta''' Links欄位中
 例如:X65no1295_p716a23
 
  ● 出處在''' 文本''' 者。請建置在「新增來源資料」 ''' Source'''  Links欄位中
 例如:g017p0036
 
  ● 「註解」中來源出處請使用'''全形標點符號''',如下所示:
 ,。、;:!?.「」『』()《》〈〉…… 標點符號用法,可參  http://www.edu.tw/files/site_content/M0001/hau/c2.htm 。
'''注意事項''': 
1.生卒年中「-」連接號使用'''全形標點符號'''。例如:通容(1593-1661)。
2.每一個別名之間以「;」分號(半形或全形皆可)隔開。
 
  ● 「註解」內容之來源出處請使用'''全形標點符號''',並參照以下範例:
 一.同一來源出處請使用「全形'''、'''頓號」標點符號隔開
 例1:佛光:480、405
 例2:(http://baike.baidu.com/view/322497.html、http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw,2008.12.23)
 二.不同來源出處請使用「全形''';'''分號」標點符號隔開
 例1:佛光:480;佛百:4053.1
 例2:(http://baike.baidu.com/view/22260.html,2008.12.02;佛光:480;http://baike.baidu.com/view/1225413.html,2008.12.23)
 三.日期前的標點符號請使用「全形''','''逗號」隔開
 例1:(http://baike.baidu.com/view/22260.htm,2008.12.02)
'''注意事項''':
1.使用網路出處來源,需注意其穩定性及權威性。建議參照使用'''Authority'''所提供網路資料[http://share.foxmarks.com/folder/rss/osyCa6r9nX'''Authority''']。
2.出處來源中的網址,需注意其長短,避免網址太過隴長EX:短:http://zh.wikipedia.org/wiki/雷峰 EX:長:http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw
 
===代名詞=== 
<syntaxhighlight lang="XML">
1.標記時機:當詞意不明顯時才要標
</syntaxhighlight>
<syntaxhighlight lang="XML">
2.代名詞的標法:<ref key="Axxxxxxx">代名詞</ref>
  例如:<ref key="A003940">余</ref>
</syntaxhighlight>
<syntaxhighlight lang="XML">
3.由於頁面太多超連結,請各位標記 人員 以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
  皆不用再重複標記。
</syntaxhighlight>
[[#簡介及目的(春玉)|返目錄]]
 
===註解=== 
<syntaxhighlight lang="XML">
1.文本註解無論是何種類型,一律採用此種標記為<gloss></gloss>
  例如:上有橫地<gloss>疑當作池</gloss>
2.在標題內之註解,置於<head>內.
  例如:<head>峰<gloss>共計五十九峰</gloss></head>
</syntaxhighlight>
 
<syntaxhighlight lang="XML">
<note>中有連結網址時:
  <note resp="ddbc.da"><ptr target="網址"/>註解描述</note>
 
例1:url是網路資料時
柔兆<note resp="ddbc.da"><ptr  target="http://baike.baidu.com/view/651760.html"/>
歲陽名之一,指太歲在"丙"。</note>
 
例2:url是CBETA資料時
僧會<note resp="ddbc.da"><ptr  target="http://w3.cbeta.org/cgi-bin/goto.pl?linehead=T49n2038_p0931b12">
釋道二教流傳入中國,歷代以來皆設官以領之。明代,縣設僧會司,置僧會一員,掌本縣僧道事。</ref></note>
(?linehead=T49n2038_p0931b12:這一段(行首資訊)須自行手動加在網址列上)
</syntaxhighlight>
 
===內文字體缺少或難以辨認時===
 
* 標法參考以下網頁:
  http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html#
  範例:2個圓圈刪去,輸入<gap extent="2" unit="chars" reason="lost"/>
     extent: 被省略的文字量  unit: 資料型態
 
* 內文刻印若有「字體缺少」,須插入「字」其標法:
  範例:
     原文: 元祐四年
     標法: 元<add>延</add>祐四年
 
===缺字與通用字===
 
定義:
  ●  凡於unicode網站找不到者,或古字打不出來的,皆作缺字處理。
 台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
 別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml
 
  ●  若無 unicode 字型均採用組字式處理(ex: 羅[目*侯])(Erica;2008/11/17)
 
  ●  組字式(必建)建置規則。參考網頁 http://cbeta.org/data-format/rare-rule.htm
 
  ●  通用字:古今通用,例如價值的值,古字用直,今用值。參考網頁
http://big5.ce.cn/gate/big5/cathay.ce.cn/file/200704/25/t20070425_11166721.shtml
 異體字:例如寧,可寫成寶蓋頭下加血
 
 
 
====異體字(通用字)與缺字處理流程====
#[[#1.判斷異體字(通用字)或缺字|判斷異體字(通用字)或缺字]],(用教育部異體字典)
#[[#2.圖檔處理|圖檔處理]]
#[[#3.內文標記|內文標記]]
#[[#4.介面輸入|介面輸入]]
#[[#5.缺字上傳|缺字上傳]]
#[[#6.相關知識|相關知識]]
 
 
=====1.判斷異體字(通用字)或缺字,(用教育部異體字典)=====
http://www.zdic.net/zd/zi/ZdicE9ZdicBBZdic8E.htm
 
=====2.圖檔處理=====
<syntaxhighlight lang="XML">
(1) 是異體字時:
 
1.於教育部異體字典網站download(手寫字體)或unicode 網站download圖檔(正寫字體)
unidoce download 的圖檔背景是透明的,教育部異體字典download圖檔是背景是白的,用文本掃瞄的.tif背景是灰的,此背景色不同無仿
 
2.於缺字介面新增一筆以獲得檔名.gif
用gimp縮放尺寸, 尺寸45x47 72dpi,作法如下
或以xview批次處理尺寸及dpi
 
(2) 是缺字時:
   (2.1)unicode網站如果有圖檔,請第一優先download 用此圖
   (2.2)於原始檔.tif用gimp剪下,作法如下
</syntaxhighlight>
 
======利用Gimp軟體處理缺字圖檔======
<syntaxhighlight lang="XML">
【98.01.19 Erica】
 *裁切掃瞄檔缺字步驟
(1)開啟Gimp功能表「檔案」.
(2)點選「開啟」.
(3)選擇掃瞄檔案ex:2Book022(路徑:J:\CND\Projects\2008BTG\work\掃瞄)中缺字頁碼.
(4)放大圖片以利裁切:點選「顯示」選擇「縮放2:1(200﹪)」.
(5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆).
(6)將「剪裁」圖形移至缺字字體,確認位置後點選滑鼠左鍵2次,即出現裁切之缺字圖檔.
(7)設定圖片尺寸:點選「圖片」選擇「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成.
 
 *針對已下載缺字圖片設定尺寸之轉檔步驟
(1)開啟Gimp功能表「檔案」
(2)點選「開啟」(路徑:先前已下載的缺字圖檔ex:btg×××××××××.jpg之資料夾)
(3)設定圖片尺寸--點選「圖片」選擇「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(4)點選「檔案」選擇「另存新檔」並提供檔名ex:btg×××××××××.gif再點選下方「Gif影像檔」按「儲存」後,即出現另一視窗請不要勾選任何選項按「儲存」即完成.
</syntaxhighlight>
[[#簡介及目的(春玉)|返目錄]]
 
=====3.內文標記=====
<syntaxhighlight lang="XML">
●異體字(通用字)與缺字:
<g ref="#btg086001701"/>
以上檔案命名原則:btg+志碼+頁碼4碼+序碼2碼(此頁第幾個缺字)
 
●變更通用字與古字以缺字標記方式如下:(Erica;2009/02/11)
      通用字--值
      古字-----直
  TEI標記:         
      <g ref="#btg017018201"/>(古字-直)
並且登錄「缺字網頁」後「新增一個 mapping」Key in 通用字-值
</syntaxhighlight>
 
=====4.介面輸入=====
(a)缺字id編碼原則: btg086(志名)0327(頁碼) 01(第幾個缺字)。目錄缺字id:btgcal(目錄)XXXX(頁碼)XX(第幾個)
(b)登入缺字網頁[http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020]
(c)取碼目的:取得缺字碼<g ref="#btg086001701"/>標記內文及建置缺字組
(d)建置步驟說明:
  (1)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (2)產生缺字id後,即可輸入缺字資訊(如e).
(e)完成後,按「更新資料庫」.
(f)輸入缺字資訊須知,說明如下:
  (1)<glyph xml:id="btg086033701">: 為缺字id碼。
  (2)<glyphName>: 為unicode編碼。
    到 [http://www.unicode.org/charts/unihanrsindex.html unicode網站 ]找cjk(decimal), CJK IDEOGRAPH 15181=Unicode使用 Unicode,不用utf-8<charProp表示字的屬性、表達方法。比如說注音、發音。
  (3)<charProp>: 標記<value>發音。
    到 [http://www.iq-t.com/SYSCOM/pingying2.asp 漢語拚音字典 ]找漢語拚語,一律小寫,第幾聲用數字表示,不知發音者以問號表示。
  (4)<mapping type="cbeta">: 為組字式。
    請參閱 [http://dict.cbeta.org/word2/search.php CBETA漢字庫 ]打通用字或組字式以獲得組字式或CB碼。
  (5)<mapping type="cbetaNo"> : 為cbeta的CB碼。
  (6)<mapping type="unicode"> : 為unicode編碼。
    Mapping說明:<mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、組字式、unicode碼。cjk與Unicode(id=decimal)的關係猶如cjk=一年甲班,Unicode=10號。
  (7)<mapping type="MoEvariant"> : 為教育部異體字編碼。
    沒有Undicode的字才要異體字 抄下左邊的號碼,小花將增加一欄位。例如:b02420-001
 
=====5.缺字上傳=====
(1) FTP informations:
   session:fosizhi
   host name:10.10.0.49
   user name:april  
   password:m4tjp
 
(2)上傳位置 
  從 Y:\Projects\fosizhi\images\gword\
  到 0:/fosizhi/public_html/gword/
 
=====6.相關知識=====
. extension B 內碼範圍:2000~2A6cf
. 如果缺字在介面如法顯現,請安裝字型
  Y:\Projects\fosizhi\work\tools\字型\unicode字型\HAN NOM B(A).ttf
 
===勘字===
<syntaxhighlight lang="XML">
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
 
</syntaxhighlight>
 
===圖檔或圖檔內有文字標記法===
<syntaxhighlight lang="XML">
印章(視為圖檔)標記法如下:
<figure>
   <figDesc><signatures></signatures></figDesc>
   <graphic url="1B020P024.jpg"/>
</figure>
</syntaxhighlight>
 
<syntaxhighlight lang="XML">
<figure>
  <head>標題</head>
  <figDesc>讓此表可以檢索到的圖說,以半形標點符號間隔文字</figDesc>
   <graphic url="cwdc01p085a.jpg"/>
</figure>(己有掃瞄圖檔故圖不顯示)
</syntaxhighlight>
 
===在文本標完後,建立事件<linkGrp>===
 
  ※ 暫先不建立此事件<linkGrp>,馬老師將找專家做)
    說明:辨識文本中的事件,建立其「人、時、地」的連結群組
   例:
   <linkGrp>
    <ptr type="person" target="#G0292"/>
    <ptr type="person" target="#G1273"/>
    <ptr type="place" target="#TX5132241"/>
    <ptr type="time" target="#d405666405666"/>
   </linkGrp>
[[#簡介及目的(春玉)|返目錄]]
 
[[#驗證|至標記問答-最後一題]]
 
===標記問答===
● 宗派(例如賢首宗)及普門菩薩是否標記?
A:不標
 
● 寺院內建築(例如華嚴經閣)是否標記? 
A:要標。
 
● 內文中提到的相關「著作」是否標記?
A:不標。
 
● 格式問題:是否照書編排?
A:可依文本實際內容標記,不用照書排版。
 
●  列文字的標法?
A:例:副寺<list rend="inline"> <item>惠秀</item>  <item>舜普</item>
    <item>永施 </item></list>校刊
 
● 標題(head)+作者(persname)於同一行的標法?
A:<head>標題</head>  <byline><persname>作者</persname></byline>
   (註:<byline> 包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
 
● 標題後有副標題的標法?
<syntaxhighlight lang="XML">  
例:<head>大安禪師<seg type="toc" rend="smallType">上堂一則 機緣二則</seg></head>
    註:seg(隨機分割) 包含 文件中 任何隨機字詞層次的單元。
      toc=table and content
      rend表示"如何呈現"
</syntaxhighlight>
 
● 文本段落無標題時,文中可否自添標題?
<syntaxhighlight lang="XML"> 
A:否。可將自添標題放於段落屬性中。例:<div type="入院法語一">
</syntaxhighlight>
 
● 人名權威建檔,製作資料來源(source)是否登錄?
A:不必登錄,規範資料庫檢驗通過後,將自動冠上每志的第一筆出處。
 
● 引語是否需標<cit><quote>?
A:否
 
● <lg><l>的注意事項
<syntaxhighlight lang="XML">
<lg><l>與<p>是對等地位,故不可包在<p>中。應結束</p>後,再標<lg>。
</syntaxhighlight>
 
● 行後有小字的標法? 例:寶慶三年正月日牒尚書省印#行書
A:寶慶三年正月日<note rend="smallType">牒尚書省印行書</note>
 
● pb放置的位置?
A:放<div>與<head>中間。例:<div><pb n="0095"/><head>
 
● 文字出現於兩行的行中時,是否照文本排版標記?
A:不用照原文排版
  
● 文本中人名資料中的<字號或別名>無法確實查證時,該如何標記?
  例:<persName key="A003937">姚二煜葆明</persName>甫
A:無論是別名或字均以<addName></addName>包起來即可.
  例:<persName key="A003937">姚二煜<addName>葆明</addName> </persName>甫
 
● 遇人名不確定是否為某人時,可加屬性值標示。
 例1:<persName type="unknown">某某某</persName>此為完全不明或查找不到確認
   此人身份資料時用
 例2:<persName key="A001606" cert="70%">cert 是表示標者自認為的正確度,
   是相對的,非絕對的。
 
● 圖檔標記:url 圖檔檔名?
  <figure><figDesc>圖說</figDesc><graphic url="掃瞄檔檔名.jpg"/></figure>
 例:<graphic url="3B004P001.jpg"/>(註:P為大寫,頁碼為三碼)
 
● 空白頁的處理
A:只需標上頁碼
 例:<pb n="0248"/>
 
● 文末的"印"是否需標記?
A:<figure><figDesc><signatures>「樊王家」方印</signatures></figDesc></figure>
 
● <author>與<docAuthor>之異同? (<author>在<body>內無法valid)
<syntaxhighlight lang="XML">
suggest: <docAuthor>指題名頁的作者, <author>指內文的作者以為區別
A:可用<byline><persName type="author">唐王勃</persName></byline>
 
</syntaxhighlight>
● 若印刷錯誤,大段內容重複時?
A:可用[註]標示。例:<note resp="ddbc.da">此段重複「文本重複的文字」</note>,
  這樣,內文會消失,只出現[註].
 
● 行後小字的標法
 可使用<gloss>
 
● 訛字標記、今體字標記:
<syntaxhighlight lang="XML">
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何 改或規格化處理。
  <reg> (一般化) 標誌一般化或規格化處理過的文字。
</syntaxhighlight>
 
● 版本說明及內文插圖無頁碼時,如何標示頁碼?
<syntaxhighlight lang="XML">
版本說明的頁碼標法:<pb n="0000a" facs="xBxxxPxxx"/>(0000+a)
內文插圖的頁碼標法:<pb n="0123a" facs="xBxxxPxxx"/>(插圖前頁頁碼+a)
xBxxxPxxx 指的是圖檔的檔名,
可自行自以下資料夾找相對應的圖檔即可。
Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff
</syntaxhighlight>
 
● 當詩詞跨頁時
<syntaxhighlight lang="XML">
<l>或<item>遇跨頁時,照書換頁,不用顧及排版問題。
</syntaxhighlight>
 
●敬格的問題?
  A:可以不照書斷行或空格。若要照書空格時,
  應標<space quantity="1" unit="chars"/>
  (1個單位是一個半形的距離。標記內不可有不明的空格。)
 
 
●人名前的朝代是否需建置時間標記?
  A:可不標。
 
●名勝是否需建置? 如朝音洞,蓮花洋。
  A:可不標,但如找得到,亦可標。
 
●文本若出現非標記可處理的範圍,可不標句讀。
  須於<teiHeader>作一個說明程式。例如:元朝蒙文文言文,可不標句讀。
 
●變更標記事項說明如下:
1.xml:id 及 corresp 均修訂為 key
2.修訂範圍包括:人(persName)時(date)地(placeName)及代名詞(ref)標記xml:id 及 corresp
3.範例說明:
(1)原標記
  <persName xml:id="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>
(2)原標記
  <persName corresp="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>
 
● 若無從考證的地名,是否建置地名規範資料?  沒有id的人名、地名,是否允許存在於標記文本中?
  A:若無從考證的人地名,不用建置人地名規範資料。
   標記文本中,允許沒有id的人名、地名存在。
 
● 「南海補陀山寶陀禪寺」的地名標記。
  a)<placeName>南海補陀山寶陀禪寺</placeName>
  b)<placeName>南海補陀山</placeName><placeName>寶陀禪寺</placeName>
  c)<placeName>南海</placeName><placeName>補陀山</placeName><placeName>寶陀禪寺</placeName> 
 
  A:南海補陀山<placeName>寶陀禪寺</placeName>。
 
● 標點符號。
  a)經謂:「莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。」
  b)經謂:莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。
  c)經謂,莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。
 
  A:若是經文原文引用,則用a,若是意義引用,則用b,不可用c。
 
● space的單位(chars)有3種:
  1) <space quantity="1" unit="chars"/>:表達的是一個(英文)半形的距離。(保留原標記)
  2) <space quantity="1" unit="eng_chars"/>:表達的是一個英文半形的距離。
  3) <space quantity="1" unit="chi_chars"/>:表達的是一個中文全形的距離。
 
 
 
[[#標記問答|返標記問答-第一題]]
 
==驗證==
 
1. main的檔頭有用all.nrc刪除
2.需要的schema路徑
  J:\CND\Projects\2008BTG\work\markup\標記進行中\schema\.rnc
3.設定Schema路徑操作說明如下:
  a)在Oxygen功能表上方,點選Document中valid--Exteral validation。
  b) 在validate with 視窗 選擇RelaxNG schema。
  c)於URL選擇設定schema路徑(參考2.)後按確定即可。
4.回到main檔按Oxygen功能表上方的紅勾勾驗證(沒有點點的)確認已valid及確認其他卷well formoed
5.開啟eXist程式上傳
6.若樹狀結構有變更,請先更新節點[http://10.10.0.49:8080/fosizhi_json/?更新節點頁面]
7.開啟佛寺志網頁,按重新整理即可。
 
==上傳==
<syntaxhighlight lang="XML">
使用方法:
(一)將欲上傳的檔案,放在Y:\Projects\fosizhi\eXist_upload中
(二)打開上傳網頁http://dev.ddbc.edu.tw/fosizhi/upload/index.php
    1.填上帳號fosizhi,密碼amituofo
    2.點選"重新檢視"(將會看到預備上傳的檔案)
    3.點選"上傳XML"(不用理會之後出現的Validation Error! )
     Upload successful!
</syntaxhighlight>
 
 
==待解決內部問題討論==
 
<syntaxhighlight lang="XML">
1)table的樣式,若有底色,是否可click兩下?
2)closer若太長,會有向右折行的 情況 。(g049p0011,12)
3)<roleName type="honorific">公</roleName>,君是否也可用此標記?
4)太史虎臣蔣先生,標記?
5)官職名前的地名是否須標?如象山縣知縣、寧波司理之類。
6)秦川:泛指今陝西、甘肅的秦嶺以北平原地帶。經緯度落在?
7)g010p073志地輿融結
8)g010目錄的空格
 
</syntaxhighlight>
 
==最新公告==
&quot;請註明紀錄者姓名及日期&quot;
 
 
 
 
[[#簡介及目的(春玉)|返目錄]]

於 2021年4月27日 (二) 09:47 的最新修訂

《中國佛寺史志》數位典藏工作手冊
Archive of Buddhist Temple Gazetteers(Service manual)

簡介及目標

一、簡介:
  佛寺志是一種獨特而重要的文獻,其主要內容有:佛寺歷史沿革、建置、高僧行誼、語錄、法脈傳承、感應事跡、碑記詩賦藝文等。20世紀有兩大套木刻版寺志叢書印刷,此二套叢書所收之佛寺志,或為手抄本,或為各國圖書館唯一藏本,世所罕傳,彌足珍貴,被譽為「續大藏未竟之偉業,出佛教史料之遺珍,集寺院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻記載之不足,使漢傳佛教在時間、空間與內容的研究資源上更加完備。
  適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助,自2008年起開始著手以下二套叢書之數位化工作:
  1.《中國佛寺史志彙刊》(110冊;100志):台北.明文出版社、丹青圖書公司,1980-1994,杜潔祥主編
  2.《中國佛寺志叢刊》(130冊;197志):揚州.廣陵書社,2006,張智、白化文等主編

二、目標:
  本專案的數位化目標,乃欲將200多座寺志建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老寺志的新版本,運用科技得以長遠保存,而有助於佛法的弘化。

進程及人力

進程:
第一階段(97年~99年):
 1. 建置二套叢書後設資料庫(metadata)。
 2. 設立DILA中國佛寺志網頁(開發版和推廣版)。
 3. 二套叢書完整掃描,提供網頁瀏覽、下載。
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀,及相關人名、地名資料連結。

第二階段(100年~101年):
 1. 執行出版「中華佛寺志叢書」計畫。(12部寺志,共15冊)
 2. 複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇。

第三階段(102年):
 進行明丹本85部寺志之初階標記。

第四階段(103年~104年):
 進行廣陵本124部寺志之初階標記。

第五階段(105年~108年):
 進行明丹本寺志之點校,以製成更便利後人閱讀的版本。
 1. 105年:點校18部寺志,約120萬字。
 2. 106年:點校4部寺志,約60萬字。
 3. 107年:點校12部寺志,約71萬5千字。
 4. 108年:點校9部寺志,約60萬字。

人力:
 時程控管 1人
 程式設計 2人
 標記人員 3人
 後設資料建置人員 1人
 義工 1人

執行單位

執行單位:法鼓佛教學院數位典藏組
主持人:Marcus Bingenheimer 馬德偉博士(97年~102年)、洪振洲博士(102年~108年)
時程及預算控管:柯春玉(97年~102年)、林智妙(103年~108年)
程式及介面撰寫:花金地、李志賢、周邦信
標記技術人員:林智妙、林綉麗、王秀雯、游美燕、何易儒、詹麗春
新式標點人員:蔡謀芳、張革丰
佛學規範資料庫維護人員:闕慧貞、葛賢敏

參考工具

1 網頁工具
 1.1 文本介面
 1.2 規範資料庫
 1.3 工作手冊
 1.4 TEI 網站
 1.5 漢字處理
 1.6 辭典類
 1.7 標點符號用法
 1.8 人名查詢
 1.9 地名查詢
 1.10 時間查詢
 1.11 綜合查詢
 1.12 古籍文獻資料庫
 1.13 學校相關網頁
 1.14 在Y公共磁碟區上的工具檔
2 操作技巧
 2.1 幾個快捷技巧
 2.2 在Oxygen下
 2.3 在Oxygen xpath下
 2.4 標記元素中文化
 2.5 wiki 語法

前置作業

1 叢書目錄建立
2 地理資訊建立
3 文字輸入
4 文字校對
5 掃描
6 Metadata建置

標記作業

1 工作準備
2 檔案架構
3 加facs碼
4 段落形式
5 標記元素
6 字元層次
7 標記問答
8 佛寺志PDF版
9 佛寺志粗標

點校作業

佛寺志點校
1. 佛寺志點校須知_Oxygen作業
2. 佛寺志點校須知_txt作業
3. 佛寺志異體字處理規則(2018年版)

python程式的應用

特字處理

規範資料驗證

上傳到FTP

輸出佛寺志的純文字檔

1.在ruby資料夾下執行ruby x2t.rb

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb

2.純文字檔將會產生在output資料夾內

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text

3.將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。

Github版本管理操作說明

《Pro Git》繁體中文翻譯

如何取得以前的某個版本

1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
2.選擇想要的版本 => 按右鍵 => Create Branch at this version
3.輸入 branch 名稱 (自己可以訂) => ok => 可關掉這個視窗
4.回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
 (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
5.在branch欄點選想要的版本(切換branch)=> ok=> close
6.回到專案資料夾 => 將需要的文件複製出來
7.在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱(確定已切換回 master版本)
8.(若有必要時,可將複製出來的文件貼回master版本文件中。)

如何取得以前的某個版本(單一檔案)

1.在想要擷取的檔案或資料夾(例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
2.點選想要的版本
3.在下方欄位中會出現當次push的檔案,點選想要的檔案,再點滑鼠右鍵
4.點選Save revision to...,儲存到自己指定的路徑
5.關掉log messages,到自己指定的路徑去便可看到下載的檔案

如何刪除某個 branch

1.在整個專案資料夾上按右鍵 => TortoiseGit => Git GUI =>
2.(功能列上)Branch => Delete => Local Branches欄內點選要刪除的分支名稱=> Delete =>關掉Git GUI視窗

xml轉html

建立參考書目

Metadata

發行

佛寺志網路版

佛寺志紙本書

 中華佛寺志叢書〈12部寺志,共15冊〉
 ISBN:978-957-17-2177-4
 出版社:新文豐
 出版日:2013/06/01
 內容:
    01. 清涼山志
    02. 峨眉山志
    03. 重修普陀山志
    04. 普陀洛迦新志
    05. 九華山志
    06. 天台山方外志
    07. 明.明州阿育王寺志
      清.明州阿育王續志
    08. 寒山寺志
    09. 玉岑山慧因高麗華嚴教寺志
    10. 黃檗山志
    11. 泉州開元寺志
    12. 雞足山志

一般庶務

1. 電腦維修由春玉統一回報資訊組窗口 報修人員並在google文件中,填妥報修情況資訊