「名山古剎-《中國佛寺史志》數位典藏」:修訂間差異

出自DILA Wiki
imported>April
imported>Jiayu.xu
無編輯摘要
 
(未顯示由 4 位使用者於中間所作的 308 次修訂)
行 2: 行 2:
Archive of Buddhist Temple Gazetteers(Service manual)
Archive of Buddhist Temple Gazetteers(Service manual)


==簡介及目 ==
==簡介及目 ==
  
  一、簡介:<br>
  在中國佛教史料中, 佛寺志是一種獨特而重要的文獻, 它也是地方志或地方性歷史文獻之一。 其主要內容 在於 :佛寺歷史沿革 建設, 高僧 傳記 詩偈, 法脈傳承 感應事跡等 ,亦 兼及佛 寺所 在地 地理、人文、風俗的記載 及地圖、建物圖、人像等。通常是由對區域、城市及寺院研究有興趣的學者所編寫 因此此類文獻乃收集 種文 編輯而成。本專案的研究目的 除將佛寺志的 珍貴 史料數位典藏 流傳 並將進行相關 佛寺 志的書目研究和標 作業 ,使 之成為研究中國 佛教 歷史不可或缺 數位文獻 。適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助, 執行期間從2008年1月至2010年12月。
     佛寺志是一種獨特而重要的文獻,其主要內容 :佛寺歷史沿革 、高僧 行誼 、語 錄、 法脈傳承 感應事跡 、碑記詩賦藝文 。20世紀 兩大套木刻版 志叢書印刷,此二套叢書 佛寺志 或為手抄本 或為 國圖書館唯一藏 本, 世所罕傳,彌足 珍貴, 被譽 「續大藏未竟 偉業 教史料之遺珍,集 院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻 載之不足 ,使 漢傳 佛教 在時間、空間與內容 研究資源上更加完備 <br>
  有關 佛寺志 的收集 ,主 要來源為20世紀所印刷的兩套木刻版
   適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助, 自2008年起開始著手以下二套叢書之數位化工作:<br>
    1.《中國 佛寺 史志彙刊》(110冊;100 ):台北.明文出版社、丹青圖書公司,1980-1994 杜潔祥 編<br>
  2.《中國佛寺志叢刊》(130冊;197志) 揚州.廣陵書社,2006,張智、白化文等主編<br>


  *Zhongguo Fosi Shizhi Huikan 《中國佛 彙刊》
  二、目標:<br>
  Taipei, 1980-1985. Compiled by Du Jiexiang 杜潔祥. 110vols
    本專案的數位化目標,乃欲將200多座 寺志 建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老 寺志 的新版本,運用科技得以長遠保存,而有助於佛法的弘化。<br>
*Zhongguo fosizhi congkan 《中國佛 寺志 叢刊》
  Hangzhou: Guangling shushe 廣陵書社 2006. Compiled by Zhang Zhi 張智.130 vols.


本專案預計於2010年之前,將完成超過200座寺志的數位化作業,並公開圖檔資料提供大眾免費使用,其中,至少有12座寺志將提供加上 物、時間與地點標記的數位化全文,同時,在本專案中所識別的人物、時間與地點之資料,將與其他專案的相同資料一併整合至本校「[http://authority.ddbc.edu.tw/ 佛學規範資料庫Buddhist Authority Database]」之中。除此之外,本專案至2011年之前,將完成相關佛寺志書目研究和標記作業,以提升本典藏之應用價值。
==進程及 力==


==預算 及人 力==
進程:<br>
第一階段(97年~99年):<br>
 1. 建置二套叢書後設資料庫(metadata)。<br>
 2. 設立DILA中國佛寺志網頁(開發版和推廣版)。<br>
 3. 二套叢書完整掃描,提供網頁瀏覽、下載。<br>
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀, 相關 名、地名資料連結。<br>


  預算 :<br>
  第二階段(100年~101年) :<br>
  此專案預 行年 度為97~101 共計5 年, 由中華佛學研究所贊助 。<br>
   1. 執行出版「中華佛寺志叢書」 畫。(12部寺志,共15冊)<br>
 2. 複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇。<br>
 
第三階段(102年):<br>
 進行明丹本85部寺志之初階標記。<br>
 
第四階段(103年~104年):<br>
 進行廣陵本124部寺志之初階標記。<br>
 
第五階段(105年~108年):<br>
 進 明丹本寺志之點校,以製成更便利後人閱讀的版本。<br>
 1. 105 :點校18部寺志 約120萬字。<br>
 2. 106年:點校4部寺志,約60萬字。<br>
 3. 107 :點校12部寺志 約71萬5千字。<br>
 4. 108年:點校9部寺志,約60萬字 。<br>


 人力:<br>
 人力:<br>
  程式設計 1人<br>
    時程控管 1人<br>
時程控管 1人<br>
   程式設計 2 人<br>
  目錄及經緯度建立 1 人<br>
    標記人員 3人<br>
 標記人員 3人<br>
    後設資料建置人員 1人<br>
 後設資料建置人員 1人<br>
    義工 1人<br>
 義工 1人


==執行單位==
==執行單位==
 執行單位:法鼓佛教學院數位典藏組
 執行單位:法鼓佛教學院數位典藏組<br>
  負責 馬德偉 Marcus Bingenheimer<br>
  主持 :Marcus Bingenheimer  馬德偉 博士(97年~102年)、洪振洲博士(102年~108年)<br>
  進度 及預算控管:柯春玉<br>
  時程 及預算控管:柯春玉 (97年~102年)、林智妙(103年~108年)<br>
 程式及介面撰寫:花金地、李志賢、周邦信<br>
 程式及介面撰寫:花金地、李志賢、周邦信<br>
 標記:林智妙、林綉麗、王秀雯、游美燕 、彭川芩 、何易儒、 釋道厚 、張 聖豔<br>
 標記 技術人員 :林智妙、林綉麗、王秀雯、游美燕、何易儒、 詹麗春<br>
  權威 資料庫:闕慧貞、葛賢敏
新式標點人員:蔡謀芳 、張 革丰<br>
  佛學規範 資料庫 維護人員 :闕慧貞、葛賢敏<br>


==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E5%B7%A5%E5%85%B7#.E5.B7.A5.E5.85.B7 參考工具]==
1 網頁工具<br>
 1.1 文本介面<br>
 1.2 規範資料庫<br>
 1.3 工作手冊<br>
 1.4 TEI 網站<br>
 1.5 漢字處理<br>
 1.6 辭典類<br>
 1.7 標點符號用法<br>
 1.8 人名查詢<br>
 1.9 地名查詢<br>
 1.10 時間查詢<br>
 1.11 綜合查詢<br>
 1.12 古籍文獻資料庫<br>
 1.13 學校相關網頁<br>
 1.14 在Y公共磁碟區上的工具檔<br>
2 操作技巧<br>
 2.1 幾個快捷技巧<br>
 2.2 在Oxygen下<br>
 2.3 在Oxygen xpath下<br>
 2.4 標記元素中文化<br>
 2.5 wiki 語法<br>


==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%BF%97%E3%80%8B%E5%B0%88%E6%A1%88%E5%9F%B7%E8%A1%8C%E6%AD%A5%E9%A9%9F 前置作業]==
1 叢書目錄建立<br>
2 地理資訊建立<br>
3 文字輸入<br>
4 文字校對<br>
5 掃描<br>
6 Metadata建置<br>


== 工具==
==[http://wiki.dila.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%A8%99%E8%A8%98%E4%BD%9C%E6%A5%AD 標記作業]==
1 工作準備<br>
2 檔案架構<br>
3 加facs碼<br>
4 段落形式<br>
5 標記元素<br>
6 字元層次<br>
7 標記問答<br>
8 佛寺志PDF版<br>
9 佛寺志粗標<br>


=== 使用工具===
== 點校作業==
佛寺志工作網頁
[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E9%BB%9E%E6%A0%A1 佛寺志 點校]<br>
 * 中國佛寺志(法鼓內部) http://dev.ddbc.edu.tw/fosizhi/ui.html
1. 佛寺志 點校須知_Oxygen作業<br>
 * 中國 佛寺志 首頁(法鼓) http://dev.ddbc.edu.tw/fosizhi/
2. 佛寺志點 校須知_txt作業<br>
 * 中國 佛寺志 首頁(逢甲) http://buddhistinformatics.ddbc.edu.tw/fosizhi/
3. 佛寺志 異體 處理規則(2018年版)<br>
 * 佛寺志檔案上傳 http://dev.ddbc.edu.tw/fosizhi/upload/index.php
 * 佛寺志 更新 http://dev.ddbc.edu.tw/fosizhi/exeQuery.php?getTreeJson=yes
 * 佛寺志缺字資料庫(法鼓) http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq
 * 佛寺志 資料庫( 逢甲) http://buddhistinformatics.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq 
 * 佛寺志掃描圖檔 http://buddhistinformatics.ddbc.edu.tw/fosizhi/jpegs/ 
 * 普陀山志目錄比對 http://dev.ddbc.edu.tw/putuoshan/admin/


規範資料庫
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97python%E7%A8%8B%E5%BC%8F%E7%9A%84%E6%87%89%E7%94%A8#python.E7.A8.8B.E5.BC.8F.E7.9A.84.E6.87.89.E7.94.A8 python程式的應用]==
 * 規範資料庫首頁(逢甲)  http://authority.ddbc.edu.tw/
 * 規範資料庫首頁(法鼓)  http://dev.ddbc.edu.tw/authority/
 * 人名規範資料庫(法鼓)  http://dev.ddbc.edu.tw/authority/person/
 * 地名規範資料庫(法鼓)  http://dev.ddbc.edu.tw/authority/place/
 * 時間規範資料庫(法鼓)  http://dev.ddbc.edu.tw/authority/time/
 * 法鼓愛搜尋 http://isearch.ddbc.edu.tw/


工作手冊
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E5%B0%88%E6%A1%88_%E7%89%B9%E5%AD%97%E8%99%95%E7%90%86 特字處理]==
 * [http://blazer.org.tw/wiki/index.php/%E6%9C%9F%E5%88%8A/Wiki%E6%96%B0%E6%89%8B%E5%AF%AB%E4%BD%9C%E6%8C%87%E5%8D%97%E2%85%A0%EF%BC%88%E4%B8%8A%EF%BC%89 Wiki新手寫作指南]
 * [http://wiki.ddbc.edu.tw/pages/Blog_%E7%A4%BA%E7%AF%84 Blog 示範 - DDBC Wiki]
 * [http://wiki.ddbc.edu.tw/pages/%E5%90%8D%E5%B1%B1%E5%8F%A4%E5%89%8E-%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%95%B8%E4%BD%8D%E5%85%B8%E8%97%8F 中國佛寺史志工作手冊]
 * [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 佛學規範資料庫工作手冊]
 * [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 佛學規範資料庫問答]
 * [http://wiki.ddbc.edu.tw/pages/GIS%E3%80%8A%E9%AB%98%E5%83%A7%E5%82%B3%E3%80%8B%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A GIS《高僧傳》工作手冊]


TEI 網站
==[http://wiki.dila.edu.tw/pages/%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E9%A9%97%E8%AD%89#.E8.A6.8F.E7.AF.84.E8.B3.87.E6.96.99.E9.A9.97.E8.AD.89 規範資料驗證]==
 * P5:TEI指引 http://www.tei-c.org/release/doc/tei-p5-doc/zh-tw/html/
 * TEI Elements http://www.tei-c.org/release/doc/tei-p5-doc/zh-tw/html/REF-ELEMENTS.html
 * TEI Lite http://www.tei-c.org/Guidelines/Customization/Lite/
 * TEI Lite(中文版)http://www.sinica.edu.tw/~metadata/standard/rarebook/TEI921224/index_c.htm
 * Roma http://www.tei-c.org/Roma/
 * teiWorkshop http://buddhistinformatics.chibs.edu.tw/~mb/webclassmb/teiWorkshop/indexTei.html
 * TEI(P4)核心元素一覽表 http://www.sinica.edu.tw/~metadata/standard/rarebook/TEIelements-core.htm


Unicode
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97%E4%B8%8A%E5%82%B3%E5%88%B0FTP 上傳到FTP]==
 * unicode網站 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35
 * Unicode-維基百科 http://zh.wikipedia.org/w/index.php?title=UTF&variant=zh-tw
 * UTF-8-維基百科 http://zh.wikipedia.org/w/index.php?title=UTF-8&variant=zh-tw
 * 字符編碼理解 http://www.donews.net/holen/archive/2004/11/30/188182.aspx
 * Unicode字符平面映射 http://zh.wikipedia.org/zh-hk/Unicode%E5%AD%97%E7%AC%A6%E5%B9%B3%E9%9D%A2%E6%98%A0%E5%B0%84


處理
==輸出佛寺志的純文 檔==
 * 缺字SOP流程 http://wiki.ddbc.edu.tw/pages/%E5%9C%96%E7%89%87:FSOP.jpg
1. 在ruby資料夾下執行ruby x2t.rb
 * CBETA組字式規則 http://www.cbeta.org/data-format/rare-rule.htm
   案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb
 * 別譯雜阿含缺字 http://buddhistinformatics.chibs.edu.tw/BZA/gaijiPron.html
 * 嘉興藏缺字處理參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
 * 古籍數位化中的漢字處理問題 http://artvine.org/forum/index.php?topic=617.0
 * 文獻處理實驗室 http://cdp.sinica.edu.tw/download/dcatalog.htm


辭典類
2.純文 檔將會產生在output 資料 夾內
 * CBETA字辭典 資料 網 http://dict.cbeta.org/word2/search.php
  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text
 * 教育部異體字字典:  http://dict.variants.moe.edu.tw/suo.htm
 * 教育部重編國語辭典 http://dict.revised.moe.edu.tw/index.html
 * 全字庫 http://www.cns11643.gov.tw/web/index.jsp
 * 漢典:http://www.zdic.net/
 * 漢字庫 http://www.cns11643.gov.tw/seeker/chinese/search-04.jsp
 * 在線新華字典 http://xh.5156edu.com/html4/8952.html
 * 書法字典 http://www.9610.com/zidian/index.asp
 * CHISE IDS 漢字検索 http://app.kita.zinbun.kyoto-u.ac.jp/ids-find
 * 佛典辭書數位檢索系統 http://140.112.26.229/cyj/index.py
 * 中華博物文字庫工具書 http://www.gg-art.com/article/tools_b.php
 * 佛門網 http://glossary.buddhistdoor.com/
 * FODIAN 佛教辭典 http://fodian.goodweb.cn/fodict.asp
 * 中文字轉漢語拼音-1 http://www.iq-t.com/SYSCOM/pingying2.asp
 * 中文字轉漢語拼音-2 http://tdc.putonghuaonline.com/tools2.html
 * 繁簡轉換工具 http://tdc.putonghuaonline.com/tools3.html
 * 新同文堂(簡繁轉換)http://tongwen.openfoundry.org/
 * OLDict http://zh-cn.oldict.com/
 * FODIAN佛教辞典 http://fodian.goodweb.cn/
 * 佛光大辭典第三版 http://etext.fgs.org.tw/etext6/search-1.htm


標點符號用法
3. 將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。
 * CBETA標點符號用法 http://www.cbeta.org/xb/table.htm
 * 教育部重訂標點符號手冊 http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo
 * 重訂標點符號手冊 http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo


人名查詢
==Github版本管理操作說明==
 * 清代檔案人名權威資料查詢 http://npmhost.npm.gov.tw/ttscgi/ttsweb?@0:0:1:mctauac::/tts/npmmeta/dblist.htm@@0.924019884790802
[http://wiki.dila.edu.tw/pages/Git 《Pro Git》繁體 文翻譯]
 * 華藝術家人名大辭典 http://www.chinese-artists.net/name/name.htm
 * 詩人檢索 http://poems.tang.net/
 * 諡法及得諡人表
 * 謚號_百度百科 http://baike.baidu.com/view/1072.htm
 * 中國歷代人物傳記資料庫 http://isites.harvard.edu/icb/icb.do?keyword=k35201&pageid=icb.page145374


  地名查詢
===如何取得以前的某個版本===
 * 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw
  1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
 * 中國古代地 大詞典 http://www.gg-art.com/dictionary/index_b.php?bookid=33
  2. 選擇想要的版本 => 按右鍵 => Create Branch at this version
 * Google 地圖 http://ditu.google.com/
  3.輸入 branch  稱 (自己可以訂) => ok => 可關掉這個視窗
   * Google 地圖_大陸 http://ditu.google.com/
  4. 回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
 * MapABC 地圖網 http://www.mapabc.com/
    (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
 * Sogou搜狗地圖 http://map.sogou.com/
  5. 在branch欄點選想要的版本(切換branch)=> ok=> close
 * Get Lat Lon 獲取經緯度的地圖網 http://www.getlatlon.com/
  6. 回到專案資料夾 => 將需要的文件複製出來
 * 中國歷史地理信息 (有 歷史地名釋 文) http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp
7. 在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱 確定已切換回 master版本
 * 中国行政区划网 http://www.xzqh.org/index.htm
  8. 必要時,可將複製出來的文件貼回master版本 件中。


時間查詢
===如何取得以前的某個版本(單一檔案)===
 * 國家時間與頻率標準實驗室 http://www.stdtime.gov.tw/chinese/home.aspx
  1. 在想要擷取的檔案或資料夾(例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
 * 中原標準時間 http://w3.tkgsh.tn.edu.tw/95c244/TIME.htm
  2. 點選想要的版本
 * 中研院兩千年中西曆轉換 http://sinocal.sinica.edu.tw/
  3. 在下方欄位 會出現當次push的檔案,點選想要的檔案,再點滑鼠右鍵
 *  西曆對照查詢系統 http://thdl.ntu.edu.tw/datemap/index.php
  4. 點選Save revision to... ,儲存到自己指定的路徑
 * 陸拓資訊萬年曆 http://time.rootinfo.com.tw/
  5. 關掉log messages,到自己指定 路徑去便可看到下載 檔案
 * 爱词霸_万年历 http://hanyu.iciba.com/wannianli.html
 * 中国历代年表 http://kdd.cc/fl/lisi/
 * 時間參照系統-時間軸庫 https://cga-download.hmdc.harvard.edu/publish_web/Geo_Tools/timeRS/
 * 月份 名稱 http://tw.group.knowledge.yahoo.com/zeelandia-zeelandia/listitem/view?iid=114
 * 月份 別稱 http://zh.wikipedia.org/w/index.php?title=%E8%BE%B2%E6%9B%86&variant=zh-tw#.E9.97.B0.E6.9C.88.E6.9C.88.E4.BB.BD
 * 干支 http://zh.wikipedia.org/w/index.php?title=%E5%B9%B2%E6%94%AF&variant=zh-tw


綜合查詢
=== 如何刪除某個 branch===
 * Authority書籤 http://share.foxmarks.com/folder/rss/osyCa6r9nX
  1.在整個專案 料夾上按右鍵 => TortoiseGit => Git GUI =>
 * oclc查詢系統(查詢出版品) http://www.worldcat.org/search?q=%E4%B9%9D%E8%8F%AF%E5%B1%B1%E5%BF%97&fq=dt%3Abks&dblist=638&qt=first_page
  2. 功能列上)Branch => Delete => Local Branches欄內點選要刪除的分支名稱=> Delete =>關掉Git GUI視窗
 * 國立編譯館學術名詞 訊網 http://terms.nict.gov.tw/search_b.php
 * 吳疆教授 亞利桑那大學東亞研究所,對中國佛寺志有鑽研)
   網址 http://bgis.coh.arizona.edu/
   聯絡信箱  jiangwu@email.arizona.edu


古籍文獻資料庫
==[http://wiki.dila.edu.tw/pages/%E4%BD%9B%E5%AF%BA%E5%BF%97xml%E8%BD%89html xml轉html]==
 * 文淵閣四庫全書電子檔安裝(找圖書組櫂埕安裝)
 * 漢籍全文資料庫(二十五史) http://dbo.sinica.edu.tw/~tdbproj/handy1/index.html?
 * 中國古籍全錄(按經史子集收錄中國歷代古籍繕本) http://guji.artx.cn/
 * 宋史研究網 http://www.ihp.sinica.edu.tw/~twsung/scholar/scholarframe.html
 * 宋史檢索 http://www.ihp.sinica.edu.tw/~twsung/search/search.html
 * 數位資源數據庫 http://www.ddbc.edu.tw/zh/metalib_sfx/e_resource.html
 * 中國大陸各省地方志書目查詢系統 http://webgis.sinica.edu.tw/place/


學校相關網頁
==[http://wiki.dila.edu.tw/pages/%E5%B0%88%E6%A1%88%E5%8F%83%E8%80%83%E6%9B%B8%E7%9B%AE 建立參考書目]==
 * 法鼓佛教學院首頁 http://www.ddbc.edu.tw/
 * DDBC_library http://licbib.ddbc.edu.tw/F?RN=411815122
 * DDBC_Moodle http://moodle.ddbc.edu.tw/
 * DDBC_Wiki http://wiki.ddbc.edu.tw/pages/
 * DDBC_gmail 學校首頁→資訊服務入口→網頁郵件系統
 * DDBC_calendar 學校首頁→資訊服務入口→網頁郵件系統→登入信箱→日曆
 * 法鼓山內部資訊網 http://w1.omtf.pl/


在Y 共磁碟區上 工具檔 Y:\Projects\fosizhi\work\tools
==Metadata==
 * 漢語大辭典 accelon3-dict
*對外 metadata: [[佛寺志 Metadata]]
 * 清除折行多餘空格軟體 cleanBK
*內部的 metadata: [[ 佛寺志 Content Metadata Version 2]]
 * 檔案總管 freecommander
 * 裁圖軟體 GIMP
 * 搜狗拚音輸入法(可用漢語拚音輸入)
 * 出版物標點符號用法規範
 * 批次更名工具:用total commander \files\multi-rename tool\
   [N] 代表檔名,更改檔名時也可用[N#-#]Range,用法是將要的檔名選起即可。
 * FTP上傳 名稱:fosizhi, 主機地址:dev.ddbc.edu.tw


===操作技巧===
== 行==
 幾個快捷技巧:
====[http://buddhistinformatics.dila.edu.tw/fosizhi/ 佛寺志網 版]<br>====
  Alt+ Tab 切換文件
  Ctrl+ R 重新整理網頁
 
 在Oxygen下:
  Ctrl+ E 下標記
  Ctrl+Shift+ V  valid驗證
  Ctrl+Shift+ W  well form 驗證
  Ctrl+Shift+ <  加註;取消註
 
 在Oxygen xpath下:(Perspective → Show Toolbar → XPath)
   //pb → 找所有<pb>(同理可推:找placeName---)
   //pb[@='0100'] → 找第100頁
   //persName[.='名字'] → 找出某人名
 
 使xml文件標記元素、屬性呈現中文化解說的方法
   在xml文件內→ 點選功能列上Document→ XML Document→ Associate Schema
   →RelaxNG Schema(Compact syntax),URL選用新的Schema→ok
   在文件首便會出現新增的聯繫<?oxygen RNGSchema="../../schema/gazetteers.rnc" type="compact"?>
   而後,標記時,當打"上角括",其所出現的元素表,每一個元素將會有中文解釋。
   或者,將游標移到元素或屬性上時,也會出現中文解釋。
 
wiki 語法
 樣式設定:{| border="1" cellpadding="0" cellspacing="0"
 表格標題行:|+
 表格 :|-
 表格標題 儲存格:!
 表格資料 儲存格:|
 儲存格欄合併:|colspan="2"|
 儲存格列合併:|rowspan="2"|
 表格結束:|}
 
=== 工作準備===
1. 進行新一本寺志標記前,應先找好該志的相關參考資料,例如:白話本、標逗本等。
2. 凡可用程式一併處理的工作,就不一一手動作業。
 
 
 
==執行步驟==
 
===叢書目錄及地理資訊建立===
 
====叢書目錄====
1. 明丹本共110冊,廣陵本共130冊,目錄檔路徑:
 
Y:\Projects\fosizhi\master-data\catalog\gazetteerCatalog.xml
 
2. 明丹本與廣陵本版本分析,檔案路徑:
 
Y:\Projects\fosizhi\master-data\catalog\catalogGazetteers_main.xml
 
====地理資訊====
 
1. 明丹本檔案路徑:
 
Y:\Projects\fosizhi\master-data\catalog\gazetteerKMLzfsh.xml
 
2. 廣陵本檔案路徑:
 
Y:\Projects\fosizhi\master-data\catalog\gazetteerKMLzfc.xml
 
 
 
===輸入===
 
一、輸入前的準備
搜集網路資料,確認無電子檔時再考慮打字
 
二、自行打字或OCR或委外輸入
 (一)自行打字
量少時適用
1.特殊字型
藏文:會打經典語文的廠商不多,可自行訓練打字人選。
梵巴轉寫字:篇幅不多時打字公司打字時以英文字代替,校對時再修正。梵巴轉寫字打法如下列。
(1)http://www.ashtangayoga.info/philosophy/transkription-tool/
(2)Itranslator 2003
(3)keyman
 
(二)OCR:鉛字印刷辨識佳,手抄本不宜採用 
 
(三)委外輸入(含粗標)
量大時適用
底本:以掃瞄圖檔或影印本,
輸入規範書:資方訂定輸入規範 Y:\Projects\fosizhi\work\標案\中研院\各項規範\
存檔:存成純文字檔.txt,檔名依志、卷、冊順序命名
輸入份數  
1. 從財力、時程決定打字份數
2. 經費不足,且不考慮時程時:輸入1份(含紙一校)→請義工以書本核對電子檔(電二校)→標記(電三校)→轉PDF(電四校)。
3. 經費足,時程緊時:輸入2份(含紙一校)→再以2份電子檔以word比對(電二校),目前作業乃到此步驟→有人力再進行電三校
 
三、徵選廠商時應考量
1. 廠商及價格
(1)台灣的廠商,價錢通常每千字70至80元
(2)大陸的廠商,價錢可壓至每千字50元
1. (3)最佳選擇:台灣公司在大陸設分部,如此在台灣有窗口連繫,價錢也較低。雅奧出版社中、英文字稿(或中英夾雜),每千字50,含一校
 
2. 人力的配合度:趕工時可增加人力,調配富彈性
3. 財力的配合度:當補助款尚未匯入時,可延遲請款
4. 雙方溝通有無障礙
5. 比價
(1)金額在100萬元以下,20萬元(含)以上者,要請3家(含)以上報價,由會計室派員監辦,進行三家公開比價、議價。
 
四、輸入速度
視輸入公司的人力而定,通常會配合資方要求的時程。
1分鐘打60字計算,1天約打3萬字,高手1分鐘打100字計算,1天約5萬字。
例:「漢籍全文佛寺志專案」1個月交件100~150萬字。
 
五、錯誤率及減價
一般錯誤率為千分之四或五。
例:「漢籍佛寺志專案」中研院史語所對廠商的要求為萬分之五;即1萬字錯5字。雙方可協調到認同的階段訂約。
Y:\Projects\fosizhi\work\標案\中研院\各項規範\輸入採購規範書(100法鼓)_1000516.doc
 
六、輸入規範 
為達成資源共享,本校數位化作業均以符合國際標準的標記語言進行標記作業,故輸人時會要求廠商加入粗標,以利後段以程式轉成正確TEI Tag
其規範書範本,檔案路徑如下:
  Y:\Projects\fosizhi\work\標案\中研院\各項規範\佛寺志輸入規範書+標記說明.docx
 
五、 委外輸入給廠商的檔案方式
(1) 有掃瞄檔時:以FTP方式傳送
(2) 無掃瞄檔時:影印原書,原書待打完字做為標記使用
 
 
六、輸入完成時交回檔案方式
1. 計算字數的方式:使用word開啟檔案後,字元數不含空白的數值計算。
2. 製作google document記錄繳交情形,以掌控進度
https://docs.google.com/a/ddbc.edu.tw/spreadsheet/ccc?key=0AvNiyYs1TA4idDhVcmQ2QmprTU4xWTBiYmlFc25KRmc&hl=zh_TW&pli=1#gid=0
 
===校對===
 
  打2份打字稿:校對流程如下
  打1份打字稿:請義工二電校,標記時三校
 
===打字稿比對===
 一、準備兩檔比對,比對內容為相異字及標逗。
 二、比對前先細讀序文或凡例,或能解釋內文難解的符號。
 三、計算「接受變更」的數字,以利分析打字公司的錯誤率。
 步驟如下:
1.以word的比較(兩個版本電子檔)功能比較中研院之txt檔及'''未經電校'''的ddbc之txt檔,在畫面上方選
 「檢閱窗格」項下之任一項,會出現關於修訂的資訊。記下「刪除」的數量得到數字A。
2.以word的比較(比較文見的兩個版本)功能比較中研院之txt檔及'''業經電校'''的ddbc之txt檔,在畫面上方選
 「檢閱窗格」項下之任一項,會出現關於修訂的資訊。記下「刪除」的數量得到數字B。
*以上兩步驟,何者為原始文件、何者為修訂文件得出之數字有落差,但落差極小。
3.將前二步驟所得之A扣去B,得到數字C。C除以該志總字數後再換算為百分比數字則得出打字公司概括的錯誤率。
 四、看不懂的字,可複製一段文字查網路。
 
1.使用office的Word校閱/ 比較的功能來作業,方式如下(並請一定要閱讀注意事項):
(1)開啟任一既有Word檔,或空白Word頁面。
(2)在Word功能列表中「校閱」一項下選「比較」,再選其下有「比較文件的兩個版本」說明文的「比較」。
(3)選擇要比較的兩份文件分別當作「原始文件」與「修訂的文件」。並將底下的「顯示變更」設定為將變更顯示在「字
 元階層」,將變更顯示於「新文件」。設定完成後點確定並開始參照原文比對,以Word界面上方的「接受」及「拒絕」
 對文件做修訂。第一次修訂應以gXXX_gaji_c.txt的檔名另存新檔,文字編碼請選UTF-8(存檔事宜請見注意事項),
 之後則皆以此檔做該文件比對工作。XXX請填各志的三位數編碼。
    p.s.Word是將原始文件當做被修改的底本,因此建議最開始就以數典組文件當做原始文件
 
(4)原始文件與修訂文件的文字顏色修改:追蹤修訂\變更追蹤選項
(5)同一文件的第二次比對起,宜設定將變更顯示於「原始文件」。
  2.注意事項:存檔前,務必先設法紀錄起來修正至文件何處,以利下次繼續比對。
 並'''一定要先點選「拒絕文件中的所有變更」,才能儲存,否則Word會自動接受文件所有變更。'''
3.使用word比對會遇到的問題
(1)比對時,會發現過去打字公司當做通用字處理之罕用字,需另行特字處理。
  
(2)雙方皆錯產生的差異無法直接採用,要再查證。
(3)比對會顯示標記的不同,無法使之不顯示(因為也是文字)。Word比對功能無法顯示標記與錯字間的差別,而且又
 多以詞句為單位,所以錯字易摻混其中,有問題片段需逐字檢查。
 
(4)顯示方式比較繁雜,需細讀,否則更改後文字次序易混亂(特別是有一部分的修訂要接受,同時有另一部分的修定要
 拒絕時)。
4.編碼相容問題處理
(1)遇到的問題:目前由於比對是由數名同仁同時處理,所使用電腦之差異造成部分同仁無法以utf-8編碼進行比對的情
  況,在word校閱->比較->比較(比較文件的兩個版本),開啟文件選文字編碼時會自動跳到無法正確顯示文字的編
  碼。
 
(2)解決方式:作比對前以NotePad++將要比對的txt檔編碼編譯(encoding in)為usc 2-Little Endian,待比對結
  束再轉換(convert to)回utf-8。使用txt程式另存新檔來改變編碼的效果約等於NotePad++的convert to。
  轉為usc 2-Little Endian編碼的txt檔需標為gxxx_gaji_c_B,以利將編碼改回utf-8時的辨認。
  改回utf-8編碼的txt檔需刪去檔名末尾的「_B」。
(3)有時候會因為轉檔產生亂碼,因此比對後宜將缺字完成(檔名以"_gaji"結束的檔)與校對完成
 (檔名以"_gaji_c_B"或"_gaji_c"結束的檔)的寺志再進行一次比對,找出亂碼。
5.檔案過大問題處理
(1)遇到的問題:部份 佛寺志 篇幅十分龐大,以word比對時易造成程式運作遲緩或產生問題。
(2)解決方式:交付資訊組人員轉為xml檔之前,是可以自行將一志分為數個檔案來處理的,但之後務必記得重新併為一
 個檔再交資訊組。
 五、問題反映
1.各電腦字型顯示有異
ex.辦公室電腦能顯示「啟」、「啓」的差別,而筆電法拉利不行。辦公室電腦則無法正確顯示「為」、
 「偽」等字(「為」字上端原有「爪」字頭與倒「八」字頭的差別),而筆電法拉利可以。
 
===掃瞄===
 
   * 選擇掃瞄檔案儲存為Tiff
   * 解析度為400dpi 像素是 1945x2992
   * 8 bits 灰階。( 不是黑白 )
   * Tiff 轉 jpg( 頁用)
   * Jpg 為 Tif的4/1 像素是 486x768
   * jpg檔加浮水印
   * 切邊
   * 明丹本掃瞄明細:https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4idGtaOUJWdldPcy1IclNpN1hmTi1YNlE&hl=zh_TW
   * 廣陵本掃瞄明細:https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4icDJXeXRzRF9JNHJUcW5aczR0a1JaRnc&hl=zh_TW
   * 檔案:  Y:\Projects\fosizhi\images\
   * 處理人員:伯雍
  
===圖檔檢查===
 目前暫時以下述方式檢查圖檔
1.以office picture manager為介面,使用縮圖檢視進行「圖檔檢查」
2.可開一新資料夾將有問題圖檔複製至此資料夾中,以便之後複製圖檔檔名貼上文字文件做成清單,或直接以資料夾當作有問題圖檔之明細
 
===Metadata 建置===
 
* 建立掃瞄 Tiff 數位圖檔的 Metadata
* 一本佛寺志各頁的掃瞄圖檔放在同一資料夾
* 一本佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
* Metadata檔案內依序記錄每張掃瞄圖檔之資訊, 關於該 Metadata 檔案說明請參考: [[佛寺志_Content_Metadata_Version_2]]
* 每張圖檔資訊記於一組 &lt;div>&lt;/div>
* 檔案放在: Y:\Projects\fosizhi\gazetteerTxt\
* 處理人員:家名,秀雯,琇麗,小花
 
<syntaxhighlight lang="XML">
(一)內容說明:
<div n="1Book005/1B005P011">
<list>
<item n="1">1B005P011</item>
<item n="2">內文</item>
<item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
<item n="4">g006p0978</item>
<item n="5">放生池</item>
</list>
</div>
 
A.<item n="1">1B005P011</item>
  1)指數位圖檔的檔名。
  2)每一頁都有一個數位圖檔。
 
B.<item n="2">內文</item>
 1)志文分成5個分類:a)書名頁或題詞 b) 本說明 c)目錄 d)內文 e)圖 f)空頁。
 
   注意:a)古文內的目錄,分類屬"內文",標題則作"目錄"。
      (因古籍內的目錄有頁碼,屬古籍內文的一份部,頁碼為g***p****。)
      b)空頁:指全部空白。若有格線,只是沒有文字的話,則作"內文"類。
 
C.<item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
  1)每頁的標題。
  2)以「-」(dash)表達漸層關係。
  3)以「/」(slash)隔開同一頁上的不同標題。
  4)若是空白頁,無標題,以”none”表示。
 
D.<item n="4">g006p0978</item>
  1)頁碼:前3碼為志碼,後4碼為內文本身的頁碼。
  2)頁碼種類如下:
 
   a)書名頁頁碼(f+1碼數字):g***f*
   b)版本說明頁碼(無頁碼):g***p0000a 
   c)目錄頁碼(c+3碼數字):g***c***
   d)內文頁碼(p+4碼數字):g***p****
  
  注意:1)頁碼都以小寫表達,組成方式是:[志碼+頁碼]
    2)若插圖無頁碼,則以[前一頁的頁碼+英文字母]。
    3)需另外記錄插圖的數目,以作統計使用。
     4)無頁碼的編碼原則:前一頁頁碼+英文字母。
 
     a)舉例:
 
      g***p0011
      無頁碼-----------則編為:g***p0011a
      g***p0012
 
      b)版本說明,因無前一頁,故編為:g***p0000a  
 
E.<item n="5">放生池</item>
  1)"可辨識"的前三個字,從每一頁的右上角數過來。
  2)若無前3個字,如空白頁,則以"none"表示。
  3)若遇糢糊不清的字,則向下遞補,取可辨識的字。(Sophia 10-14-2009 updated according to小花's saying.)
 
(二)注意:
  1)每一個數位檔都需對照文本,以確定數位檔沒有lost,
   若有任何一個lost,則後面所有的metadata資料無法與圖檔對照起來。
  2)若有數位檔檔lost的部份,請與伯雍聯繫,請他更正補上。
 
(三)缺字:
1)至cbeta漢字工具,教育部異體字網站,unicode查找。
2)若無法貼上,需作缺字庫。(事後決議用通用字或組字式。updated by Sophia 2010-03)
 
(四)完成檔案:
1)以.txt 存於 Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff
  與佛寺志的數位圖檔放在一起。
2)每一個資料夾對應一個Metadata的檔案。
3)資料夾 1Book001 表佛寺志第一輯的第一本數位圖檔,對應1Book001.txt
  (updated by Sophia 2009-06-25)
 
</syntaxhighlight>
 
====Metadata 目錄處理原則====
1.皇明觀志metadata
  會議結論:將佛寺志序、前言及總目錄全拿掉,不放在metadata。(秀麗 99.03.17)
 
====Metadata 明丹本與廣陵本更正項目====
<syntaxhighlight lang="XML">
小花建議:
1)原稿缺須用中括號括起來,前面要加樹狀結構。(前三個字亦要用中括號括起來)
  ex:    <item n="1">1B043P290</item>
       <item n="2">內文</item>
       <item n="3">鶴林寺志-鶴林寺志卷之十二-[原槁缺]</item>
       <item n="4">g045p0005</item>
       <item n="5">[原稿缺]</item>
 
2)把分類"杜目錄"變更回"目錄"。如下:
<item n="2">杜目錄</item> -->  <item n="2">目錄</item>
 
3)空頁的head <item n="3">none 亦須加上樹狀結構,不作none,
  用上頁的head,如下:(共292個 + 非空頁但標題為none,僅限內文類。)
 
       <item n="1">1B009P087</item>
       <item n="2">空頁</item>
       <item n="3">重修普陀山志-普陀山志卷一-普陀寺殿圖</item>
       <item n="4">g008p0068</item>
       <item n="5">none</item>
    
a)書名頁,目錄,及版本說明的<item n="3">none,由小花處理。
b)先search 空頁,再search none.(none有487個,空頁有292個 + 非空頁但標題為none,)
 
4)補上g027 xml (內文第一頁須加上 type="first)
  <div n="1Book028/1B028P311" type="first">
     <list>
       <item n="1">1B028P311</item>
       <item n="2">內文</item>
       <item n="3">雲棲紀事</item>
       <item n="4">g027p0001</item>
       <item n="5">孝義無</item>
     </list>
   </div>
 
5)內文的p.1大部份皆為標題名,亦須加上樹狀結構,即志名(type="first"),約100+個。
 
6)缺字的部份[?],補上通用字或組字式。若有脫字的部份用<gap/>表示。(明丹本共有880個缺字,其他符號表示的缺字約有400-500)
 
7)同一頁有不同層級的title,如下:
  <item n="3">天童寺志-天童寺志卷三-先覺攷-宋-月窗圓禪師/元-環溪一禪師/月坡明禪師</item>
  <item n="4">g012p0231</item>
 
改成:用半形的分號隔開,下面的標題作完整的樹狀結構。
 
<item n="3">
天童寺志-天童寺志卷三-先覺攷-宋-月窗圓禪師;
天童寺志-天童寺志卷三-先覺攷-元-環溪一禪師/月坡明禪師
</item>
<item n="4">g012p0231</item>
 
8)g056後之附編一梁京寺記,頁碼為1-4;附編二寺塔記,頁碼為1-6。
 若照書編,會有頁碼double的問題,故將頁碼續編,為g056p0115~124。(小花建議, 2010/06/07)
 
 
小花需處理的問題:
 
1)書名頁,目錄及版本說明的<item n="3">none,由小花加上樹狀結構。
2)書名頁及目錄的title,小花要用程式加上志名。(每一筆資料皆須志名)
3)圖檔切太多:
  1B042107(頂頭,無匡線),108(少一個字),109(頂頭,無匡線),110(頂頭,無匡線),1B042P639(頂頭,無匡線)  3B023P289(少一個字),2B008P208(圖上面的title不見了)
 
 
9)有插圖,貢碼為[前一頁頁碼+英文字母]的部份,將<item n="2">的內容,補上括號”( )”,以與版本說明,亦為[頁碼+英文字母]作為區別。
 
<div n="1Book015/1B015P050">
      <list>
       <item n="1">1B015P050</item>
       <item n="2">(圖)</item>
       <item n="3">七塔寺志-七塔寺志卷之一-志圖記-七墖報恩禪寺平面全圖</item>       <item n="4">g013p0036a</item>
       <item n="5">七墖報</item>
 
10)同一頁有兩個以上標題,而第二個標題的內容跨頁時,則目錄上的標題有double的現象。解決方式,第二個標題前加上分號”;”,且作一個完整的樹狀結構。
 
<div n="1Book001/1B001P078">
      <list>
       <item n="1">1B001P078</item>
       <item n="2">內文</item>
       <item n="3">洛陽伽藍記-洛陽城東伽藍記卷第二-莊嚴寺;洛陽伽藍記-洛陽城東伽藍記卷第二-莊嚴寺秦太上君寺</item>       <item n="4">g001p0069</item>
       <item n="5">以石為</item>
 
 
11)組字式內有slash出現時,如:[*/*],將slash改成全形,以與標題的slash作為區別。
 
<div n="1Book026/1B026P151">
      <list>
       <item n="1">1B026P151</item>
       <item n="2">內文</item>
<item n="3">杭州上天竺講寺志-杭州上天竺講寺志卷之五-尊宿住持品-別傳-[鼓/耳]菴法師/天岸法師</item>       <item n="4">g024p0128</item>
       <item n="5">柳公貫</item>
 
 
</syntaxhighlight>
 
====Metadata 問題與解答====
<syntaxhighlight lang="XML">
 
1.目前的 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可,
  type多增加一個圖&空頁
2. 若內文的漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense)
3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?]表示
4.版本說明及內文插圖無頁碼?
  版本說明的頁碼:g***none; 內文插圖的頁碼:none (不作g,以跟版本說明作區別)(110冊約只有3~4個無頁碼)
5.若是空白頁,標題及末3個字處,統一以"none"表示。
 
6.在作metadata時,有些圖檔捨棄不用的原因有:
  如:g008中,內文頁碼的起始為p3,p3之前掃了4頁,有兩頁是title,另兩頁是空白頁。
   只能取用兩頁編為p1,p2,另兩頁的空白頁只好沒有編入metadata,原因是沒有頁碼
   可以使用。(Sophia 2010-3-16)
7.metadata中,佛寺志圖檔檔名流水號沒有連續的原因是,同一頁double掃瞄了二次,
 告知伯雍後,delete掉double的部份,故部份的流水號沒有連續。(約有十幾頁左右)(Sophia 2010-3-16)
8. 原稿缺的表遠方式:
   a)原稿缺的確不是一個tilte,所以最好是作none。
   b)但若想要表達出原稿缺這個問題,但它又不是
    一個tilte ,即不可作樹狀結構,所以我只作"
    原稿缺",而無樹狀結構。(Sophia 2010-3-16)
   A:開會討論如下,用中括號匡起來。
 
<div n="1Book043/1B043P345">
      <list>
       <item n="1">1B043P345</item>
       <item n="2">內文</item>
       <item n="3">﹝原稿缺﹞</item>
       <item n="4">g045p0060</item>
       <item n="5">﹝原稿缺﹞</item>
      </list>
     </div>
 
9.每一筆資料是否需加志名?(小花提的問題)
<div n="1Book023/1B023P021">
      <list>
       <item n="1">1B023P021</item>
       <item n="2">目錄</item>
       <item n="3">靈隱寺志詳目</item>  (靈隱寺志-靈隱寺志詳目)(小花建議)
       <item n="4">g021c018</item>
       <item n="5">靈隱寺</item>
      </list>
     </div>
a)請注意:只有內文的title才有樹狀結構,其他部份,如目錄,或書名頁並沒有作樹狀結構,
這是當初製作的標準,所以這並不是一個錯誤。目錄及書名頁並沒有第幾卷的問題,也就是說並
沒有繁複的層級問題,那是否有作樹狀結構的必要呢?(Sophia 2010-3-16)
 
 
10.metadata標題脫漏字的表達方式:(Sophia 3-23)
 a)用一個全形空格。(小花建議)
  b)用一個□。
  c)下標記<gap extent="1" unit="chars" reason="lost"/>
 
A:開會決議用c)  (小花事後建議用 <gap/> )
 
11.當文本屬性"不分卷"時,樹狀結構如何產出?
  (1)依內文屬性責成標題。
  (2)如無法責成標題,而自編標題,須加上括弧號{}註明,例如:
<div n="4Book002/4B002P005" type="first">
<list>
<item n="1">4B002P005</item>
<item n="2">內文</item>
<item n="3">北京廟宇征存錄-{李圓淨序}/{吳百之序}</item>
<item n="4">y003p0001</item>
<item n="5">北京廟</item>
</list>
</div>
(小花跑程式,將括弧號{}轉換中括號[])
  (3)文本"不分卷",因較難產出樹狀結構之層級。惟忠於文本架構,即使到第二層級,也可行。
 
 
12.標題如出現簡體字時,是以繁體字為準?
  不轉換繁體字,仍以簡體字為準。
 
 
13.內文同時附有圖表,如何處理?
  同時做內文與圖表之標題,但以"分號"區分。文本分類屬內文,例如:
<div n="4Book008/4B008P437">
<list>
<item n="1">4B008P437</item>
<item n="2">內文</item>
<item n="3">大同武州石窟寺記-支那山西雲岡石窟寺-第二章石窟寺之現狀-大佛殿窟;大同武州石窟寺記-支那山西雲岡石窟寺-第二章石窟寺之現狀-大佛殿平面圖</item>
<item n="4">y014p0035</item>
<item n="5">立千仞</item>
</list>
</div>
 
14.插圖與版本說明的頁碼"a"是如何作區別的?ex:g009p0030a為圖,但左方結構顯示為版本說明。(2010-9-8)
  加上括孤以為區別,如:<item n="2">(圖)</item> 
 
</syntaxhighlight>
 
====metadata 檔案匯入MIX標記架構內====
MIX架構含:head, mix, map
 處理人員:小花
 
===[http://wiki.ddbc.edu.tw/pages/%E3%80%8A%E4%B8%AD%E5%9C%8B%E4%BD%9B%E5%AF%BA%E5%8F%B2%E5%BF%97%E3%80%8B%E6%A8%99%E8%A8%98%E4%BD%9C%E6%A5%AD 《中國佛寺史志》標記作業]===
 
===XML驗證===
1Well-form驗證(檢驗文件的標記元素及形式是否正確)
 方法:在Oxygen功能列上點選「藍勾勾」
  1)若格式正確,則會在文件的右下方出現「綠方格Document is well formed.」訊息。
  2)若格式不正確,則會在文件的右下方出現「紅方格Wellformed test - failed. Errors:」訊息,
   且在文件下方會列出錯處清單,此時點選條列清單,即可對應到文件的錯區,逐一除錯即可。
   ps. 文件若要上傳到FTP,務必得Document is well formed.才能上傳成功。
 
2Valid驗證(檢驗文件的標記是否符合TEI語法及專案特定的格式)
  此項驗證,需借助一支驗證程式(schema):gazetteers.rnc
  程式存放路徑 Y:\Projects\fosizhi\master-data\schema\gazetteers.rnc
  步驟:
  a)在main檔中,Oxygen功能列上點選「紅勾勾旁的倒三角形」
   (若未看到紅勾勾,點選功能列上Document→valid→External validation)
  b)下拉選單選External validation
  c)在validate with 視窗選擇RelaxNG schema,及選擇Compact syntax 模式
  d)於URL選擇schema存放路徑
  e)按OK
   1)若語法正確,則會在文件的右下方出現「綠方格Validation successful」訊息。
   2)若語法不正確,則會在文件的右下方出現「紅方格Validtion failed.」訊息,
    且在文件下方會列出錯處清單,此時點選條列清單,即可對應到文件的錯區,逐一除錯即可。
 
===規範資料驗證===
 步驟:1) 若要一次確認多個檔案,請先將XML文本壓縮為.ZIP格式。
    2) 在佛學規範資料庫首頁以帳號密碼登入資料庫管理介面
    3) 選擇您要進入的部份:5.權威碼檢查
    4) 選擇檔案
    5) 選擇文本形式:佛寺志
    6)(打勾)若驗證成功,自動更新權威資料庫參考
    7) 確定
    8) 若驗證未成功,則依提示回到文本進行除錯修改,然後再重覆步驟5-7
    9) 若驗證成功,則資料庫將會自動更新occurs in
  occurs in 呈現在規範資料庫中的原則
  1. 不同志,有別名=每一筆都會出現
  2. 不同志,同名=每一筆都會出現
  3. 同志,有別名=每一筆都會出現
  4. 同志,不同卷,同名=只會出現第一筆
 
===上傳到FTP===
 1上傳文本
  步驟:
  1)先要設定FTP路徑連線(Freecommand有預設FTP連線功能)
   名稱:fosizhi
   伺服器主機地址:dev.ddbc.edu.tw
   (第一次使用者,請以登入學校信箱的帳號、密碼登入)
   按「連線」就完成設定了。
  2)將欲上傳的檔案,複製貼到ftp://dev.ddbc.edu.tw/fosizhi_eXist中
  3)打開上傳網頁http://dev.ddbc.edu.tw/fosizhi/upload/index.php
   (必須以各作業人員學校信箱之帳號與密碼登入網頁)
  4)點選"重新檢視"(將會看到預備上傳的檔案)
  5)點選"上傳XML"
  6)若上傳成功,將出現Upload successful!的訊息
  7)回到佛寺志網頁http://dev.ddbc.edu.tw/fosizhi/ui.html
   重新載入最新的網頁內容,即可看到更新的資料。
 2更新節點
  步驟:
  1)打開節點上傳網頁http://dev.ddbc.edu.tw/fosizhi/exeQuery.php?getTreeJson=yes
  2)點選欲更新節點的志碼
  3)稍候片刻,若更新成功,將可看到「資料已寫入/data/projects/fosizhi......」的訊息
  4)回到佛寺志網頁http://dev.ddbc.edu.tw/fosizhi/ui.html
   重新載入最新的網頁內容,即可看到更新的節點。
 
===Github版本管理操作說明===
http://wiki.ddbc.edu.tw/pages/Git
 
===xml轉html===
安裝oxygen 9.1
由gxxx_main.xml主檔 呼叫html.xsl
 
1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形)
  進入轉檔介面,選New(第一次建立html檔後,
  若所設定的路徑都沒變動的話,以後直接點Transformation now即可;
  若有要更改路徑的話,點Edit進入介面去修改即可)
2.進入Edit scenario 介面
  a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl)
  b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK
3.此時進入到下一個介面,點Transform now,即可產生html檔案
4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾
 
安裝 exist.jnlp 上傳檔案
 
1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
   (1)main主檔要經valid驗證 --紅勾勾
   (2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
   請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(單卷)→Select files or directories store →Close
 
=== 建立參考書目===


  研院 目參考網址 http://74.125.95.132/search?q=cache:JpyJD9HKveUJ:saturn.ihp.sinica.edu.tw/~dahcr/916c5-b4.doc宋人傳記資料索引&cd=8&hl=zh-TW&ct=clnk
====佛寺志紙本書====
    華佛寺志叢 〈12部寺志,共15冊〉<br>
 ISBN:978-957-17-2177-4<br>
 出版社:新文豐<br>
 出版日:2013/06/01<br>
 內容:<br>
    01. 清涼山志<br>
    02. 峨眉山志<br>
    03. 重修普陀山志<br>
    04. 普陀洛迦新志<br>
    05. 九華山志<br>
    06. 天台山方外志<br>
    07. 明.明州阿育王寺志<br>
      清.明州阿育王續志<br>
    08. 寒山寺志<br>
    09. 玉岑山慧因高麗華嚴教寺志<br>
    10. 黃檗山志<br>
    11. 泉州開元寺志<br>
    12. 雞足山志<br>


●參考書目人名與書名的中英文寫法<author><hi>Wei</hi> Songshan 魏嵩山</author><title>Zhong Guo Lishi Diming Dacidian 中國歷史地名大辭典</title>
==一般 庶務==
 
●內文「註」的參考書目寫法(april 9/3)例如:趙一新總編。《杭州佛教文獻叢刊‧慧因寺志》卷七。 (杭州出版社,年代)  參考網址 http://www.ddbc.edu.tw/zh/academic_publishing/submissions_format.html
 
●存放路徑
Y:\Projects\fosizhi\gazetteerXml\bibliography\gazetteerBibl.XML
 
● 處理人員:參與此專案有參考到任何書籍者
 
==發行==
[[佛寺志 Web Archives]],
[[佛寺志PDF紙本輸出|佛寺志PDF紙本輸出]]
 
==一般 行政==
1. 電腦維修由春玉統一回報資訊組窗口
1. 電腦維修由春玉統一回報資訊組窗口
 報修人員並在google文件中,填妥報修情況資訊
 報修人員並在google文件中,填妥報修情況資訊
==內部討論區==
(提問者請於問題後註明姓名及日期)
<xml code>
以下為阿賢待處理事項:
sophia:  
1.<closer>內頁碼需improve。 (sophia 1/20)
  以下紅色字為p.0751的頁首,因整段全包在closer內,故在html上出現在p.0750。
  http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g089&cpage=0751
 咸[湻=淳]甲戌十月朔旦,迪功郎新寶應軍歲學教授石余亨記,朝奉大夫權戶部尚書兼詳定勅令官浙西安撫制置使兼和臨安府曾淵子篆蓋,當寺僧端楷集,元章米芾書。
p.0751
(元)僧梵琦〈娑羅軒記〉
<closer><date key="j21866902186690" when="1274-11-07">咸<choice><orig>湻</orig><reg>淳</reg></choice>甲戌十月朔旦</date>,迪功郎新寶應軍歲學教授<persName key="A018611">石余亨</persName>記,朝奉大夫權戶部尚書兼詳定勅令官浙西安撫制置使兼和臨安府<persName key="A018613">曾<pb facs="3B010P084.jpg" n="0751"/>淵子</persName>篆蓋,當寺僧<persName key="A018610">端楷</persName>集,<persName key="A004610">元章米芾</persName>書。</closer></div>
   <div><head>(元)僧<persName key="A001082">梵琦</persName>
 〈<placeName  key="CN0331023T41AB">娑羅軒</placeName>記〉</head>
2.<figure>內的head無法顯示在左方樹狀結構。(sophia 1/29已寄e-mail通知)
http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g049&cpage=0021
p.0021
 普賢菩薩
p.0022
<div><pb facs="1B045P040.jpg" n="0021"/><figure><head>普賢菩薩</head>
<graphic url="1B045P040.jpg"/></figure></div>
</xml>

於 2021年4月27日 (二) 09:47 的最新修訂

《中國佛寺史志》數位典藏工作手冊
Archive of Buddhist Temple Gazetteers(Service manual)

簡介及目標

一、簡介:
  佛寺志是一種獨特而重要的文獻,其主要內容有:佛寺歷史沿革、建置、高僧行誼、語錄、法脈傳承、感應事跡、碑記詩賦藝文等。20世紀有兩大套木刻版寺志叢書印刷,此二套叢書所收之佛寺志,或為手抄本,或為各國圖書館唯一藏本,世所罕傳,彌足珍貴,被譽為「續大藏未竟之偉業,出佛教史料之遺珍,集寺院經濟之大成,繪山林文藻之精華」,極具漢文化之代表性,亦可彌補藏經《高僧傳》文獻記載之不足,使漢傳佛教在時間、空間與內容的研究資源上更加完備。
  適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助,自2008年起開始著手以下二套叢書之數位化工作:
  1.《中國佛寺史志彙刊》(110冊;100志):台北.明文出版社、丹青圖書公司,1980-1994,杜潔祥主編
  2.《中國佛寺志叢刊》(130冊;197志):揚州.廣陵書社,2006,張智、白化文等主編

二、目標:
  本專案的數位化目標,乃欲將200多座寺志建立後設資料庫,加以TEI標記、新式標點、特別字處理等,並公開檔案,提供大眾免費下載、引用,願這些古老寺志的新版本,運用科技得以長遠保存,而有助於佛法的弘化。

進程及人力

進程:
第一階段(97年~99年):
 1. 建置二套叢書後設資料庫(metadata)。
 2. 設立DILA中國佛寺志網頁(開發版和推廣版)。
 3. 二套叢書完整掃描,提供網頁瀏覽、下載。
 4. 挑選明丹本13部寺志做TEI人時地標記,並建置其相關人名、地名規範資料庫,提供網頁上之圖文對讀,及相關人名、地名資料連結。

第二階段(100年~101年):
 1. 執行出版「中華佛寺志叢書」計畫。(12部寺志,共15冊)
 2. 複檢13部寺志標記,加以新式標點,於罕見字提供通用字,附錄人名、地名索引等,在質上做提昇。

第三階段(102年):
 進行明丹本85部寺志之初階標記。

第四階段(103年~104年):
 進行廣陵本124部寺志之初階標記。

第五階段(105年~108年):
 進行明丹本寺志之點校,以製成更便利後人閱讀的版本。
 1. 105年:點校18部寺志,約120萬字。
 2. 106年:點校4部寺志,約60萬字。
 3. 107年:點校12部寺志,約71萬5千字。
 4. 108年:點校9部寺志,約60萬字。

人力:
 時程控管 1人
 程式設計 2人
 標記人員 3人
 後設資料建置人員 1人
 義工 1人

執行單位

執行單位:法鼓佛教學院數位典藏組
主持人:Marcus Bingenheimer 馬德偉博士(97年~102年)、洪振洲博士(102年~108年)
時程及預算控管:柯春玉(97年~102年)、林智妙(103年~108年)
程式及介面撰寫:花金地、李志賢、周邦信
標記技術人員:林智妙、林綉麗、王秀雯、游美燕、何易儒、詹麗春
新式標點人員:蔡謀芳、張革丰
佛學規範資料庫維護人員:闕慧貞、葛賢敏

參考工具

1 網頁工具
 1.1 文本介面
 1.2 規範資料庫
 1.3 工作手冊
 1.4 TEI 網站
 1.5 漢字處理
 1.6 辭典類
 1.7 標點符號用法
 1.8 人名查詢
 1.9 地名查詢
 1.10 時間查詢
 1.11 綜合查詢
 1.12 古籍文獻資料庫
 1.13 學校相關網頁
 1.14 在Y公共磁碟區上的工具檔
2 操作技巧
 2.1 幾個快捷技巧
 2.2 在Oxygen下
 2.3 在Oxygen xpath下
 2.4 標記元素中文化
 2.5 wiki 語法

前置作業

1 叢書目錄建立
2 地理資訊建立
3 文字輸入
4 文字校對
5 掃描
6 Metadata建置

標記作業

1 工作準備
2 檔案架構
3 加facs碼
4 段落形式
5 標記元素
6 字元層次
7 標記問答
8 佛寺志PDF版
9 佛寺志粗標

點校作業

佛寺志點校
1. 佛寺志點校須知_Oxygen作業
2. 佛寺志點校須知_txt作業
3. 佛寺志異體字處理規則(2018年版)

python程式的應用

特字處理

規範資料驗證

上傳到FTP

輸出佛寺志的純文字檔

1.在ruby資料夾下執行ruby x2t.rb

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\ruby>ruby x2t.rb

2.純文字檔將會產生在output資料夾內

  檔案路徑:...\BTG\02MasterData\Fosizhi_git\fosizhi\output\text

3.將純文字檔存放在,請網頁工程師上傳至佛寺志網站,供讀者下載。

Github版本管理操作說明

《Pro Git》繁體中文翻譯

如何取得以前的某個版本

1.在整個專案資料夾上按右鍵 => TortoiseGit => Show log
2.選擇想要的版本 => 按右鍵 => Create Branch at this version
3.輸入 branch 名稱 (自己可以訂) => ok => 可關掉這個視窗
4.回到專案資料夾上按右鍵 => TortoiseGit => Switch/Checkout
 (或在專案資料夾上按右鍵 =>GitBranch =>勾選新分支[這個動作可取代下面的5、6步驟])
5.在branch欄點選想要的版本(切換branch)=> ok=> close
6.回到專案資料夾 => 將需要的文件複製出來
7.在整個專案資料夾上按右鍵 =>GitBranch =>勾選master =>確認Git Commit後面是"master"名稱(確定已切換回 master版本)
8.(若有必要時,可將複製出來的文件貼回master版本文件中。)

如何取得以前的某個版本(單一檔案)

1.在想要擷取的檔案或資料夾(例:xml-basic-y\y001)上按右鍵 => TortoiseGit => Show log
2.點選想要的版本
3.在下方欄位中會出現當次push的檔案,點選想要的檔案,再點滑鼠右鍵
4.點選Save revision to...,儲存到自己指定的路徑
5.關掉log messages,到自己指定的路徑去便可看到下載的檔案

如何刪除某個 branch

1.在整個專案資料夾上按右鍵 => TortoiseGit => Git GUI =>
2.(功能列上)Branch => Delete => Local Branches欄內點選要刪除的分支名稱=> Delete =>關掉Git GUI視窗

xml轉html

建立參考書目

Metadata

發行

佛寺志網路版

佛寺志紙本書

 中華佛寺志叢書〈12部寺志,共15冊〉
 ISBN:978-957-17-2177-4
 出版社:新文豐
 出版日:2013/06/01
 內容:
    01. 清涼山志
    02. 峨眉山志
    03. 重修普陀山志
    04. 普陀洛迦新志
    05. 九華山志
    06. 天台山方外志
    07. 明.明州阿育王寺志
      清.明州阿育王續志
    08. 寒山寺志
    09. 玉岑山慧因高麗華嚴教寺志
    10. 黃檗山志
    11. 泉州開元寺志
    12. 雞足山志

一般庶務

1. 電腦維修由春玉統一回報資訊組窗口 報修人員並在google文件中,填妥報修情況資訊