名山古剎-《中國佛寺史志》數位典藏

出自DILA Wiki
於 2009年2月26日 (四) 15:17 由 imported>Ericayu0725 所做的修訂 →‎利用Gimp軟體處理缺字圖檔

名山古剎-《中國佛寺史志》數位典藏

Archive of Buddhist Temple Gazetteers


工作手冊 (請勿更動編排版面)

簡介及目的

《中國佛寺志》由杜潔祥主編,從民國69年至74年彙編完成,全套共3輯110冊。此套書所收之佛寺志或為手抄本或為各國圖書館唯一藏本,是以某地、某山、某寺為範圍的佛教史籍,是研究佛教史的重要史料。


透過便利的使用介面一一呈現圖檔、後設資料、數位全文等資源。 且將與「漢傳佛教高僧傳之時空資訊系統研究之專案計畫」(GIS)專案和CBETA光碟結合。

預算

此專案預計執行年度為97~99,共計3年,由中華佛學研究所贊助。 第一年經費57萬。

執行單位:數位典藏組

進度及預算控管:柯春玉. 程式及介面撰寫:花金地. 標記:林智妙、游美燕、彭川芩、何易儒、王秀雯. 權威資料庫:闕慧貞. 網頁美工設計:李承崇. 經驗指導:張伯雍

執行方式

目錄建立

中國佛寺史志彙刊1-3輯共110冊 Bibliography 目錄建立(妙妙)

 ●xml檔頭宣告

符合tei 標準,兩個驗證程式Schema(rng、rnc),輸出程式stylesheet

 ●登錄項目
       <bibl>
         <title>
         <biblScope>
         <spanGrp>
         <respStmt><name><date>
        <edition><date when="">or<date notBefore="" notAfter="">
 ●加入kml於目錄中
 於</bibl>結束前加
 <note type="place">河南洛陽</note>
 <note type="longlat">34.7203(緯度),112.6193(經度)</note>
 </bibl>

共八個志 Keying 外包打字加粗標 (春玉)

 ●外包打字加粗標
   * 明州阿育王山志一 N29.859 E121.745
 
   * 明州阿育王山志二,續志
   
   * 重修普陀山志 N29.9835 E122.3795
   
   * 玉岑山慧因高麗華嚴教寺志 N30.2304 E120.1259
   
   * 泉州開元寺志N24.9232 E118.5837,
   
   * 廈門南普陀寺志N24.4424 E118.0929
   
   * 雞足山志 N25.9704 E100.3745
   
   * 雞足山志
   
   * 黃檗山寺志N25.5845 E119.2715

轉粗標為正確的標記

pb+p

掃瞄檔列印(筆一校用)(小芩)

 ●開啟檔案,選取 Windows Picture and  Fax Viewer(山水圖案)
     
 ●點擊列印
|相片精靈(請耐心等待 約20秒~60秒後出現)
|圖片選項
|選取張數(佛寺志專案掃瞄列印通常為整本所以是全選)
|列印選項 
|列印喜好設定
|原稿型態:雙面書本 
|選取版面設定:二合一 
|順序:由右至左  
|選取版面設定
|全頁傳真列印完成

共110冊 Scanning 掃瞄 (伯雍,Simon)

   * 選擇掃瞄檔案儲存為Tiff
   * 解析度為400dpi
   * 8 bits 灰階。( 不是黑白 )
   * Tiff 轉 jpg

共110冊 Metadata 建立 (家名,秀雯,Simon)

  • 建立掃瞄 Tiff 數位圖檔的 Metadata
  • 一本佛寺志各頁的掃瞄圖檔放在同一資料夾
  • 一本佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
  • Metadata檔案內依序記錄每張掃瞄圖檔之資訊
  • 每張圖檔資訊記於一組<img></img>內
<img>內容範例:
<img>1B005P011(數位圖檔的檔名)
|內文( type 分4種 : 書名頁 ; 版本說明 ; 目錄 ; 內文 )
|金陵梵剎志-金陵梵剎志卷二十二-放生池記
|( title : 以 「-「 dash 表達漸層關係,同一頁若有2個標題以上則以「/」slash 隔開
|舉例:金陵梵剎志-金陵梵剎志卷二十二-千佛寺/金陵梵剎志-金陵梵剎志卷二十二-大中正覺菴)
|978 (圖檔之原書頁數)
|放生池(圖檔內容的前三個字)</img>
  • 缺字至cbeta查找組合字[], 若沒有則回報 cbeta小組,異體字至教育部異體字字典的網站查詢,遇到空白頁,則標題延續上一頁的標題,「前三個字」則空白處理.

  • 將完成的檔案以 txt 存於 ftp: 10.10.1.11/Buddhist temple's Gazetteers Tiff與佛寺志的數位圖檔放在一起,每一個資料夾對應一個Metadata的檔案 ( 資料夾 1Book001 表佛寺志第一輯的第一本,對應1Book001.txt )

metadata 檔案匯入MIX標記架構內(小花)

MIX架構含:head, mix, map

Metadata 問題與解答

1.目前的 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可,
  type多增加一個圖&空頁
2. 若內文的漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense)
3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?]表示

八志的文本標記(April, 妙妙,美燕,小芩,易儒,秀雯)

資料路徑與操作技巧

●工具
*中國基本古籍庫 http://10.10.1.20/%E4%B8%AD%E5%9C%8B%E5%9F%BA%E6%9C%AC%E5%8F%A4%E7%B1%8D%E5%BA%AB/
* unicode 網址: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35
* 漢語拼音: http://www.iq-t.com/SYSCOM/pingying2.asp
* 教育部異體字字典:  http://dict.variants.moe.edu.tw/suo.htm
* 標點符號用法:http://dict.variants.moe.edu.tw/main.htm
* 國語辭典:http://dict.revised.moe.edu.tw/index.html
* 漢典:http://www.zdic.net/cd/
* TEI: http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html
* 二十五史http://www.sinica.edu.tw/ftms-bin/new/ftmsw3?tdb=%A4G%A4Q%A4%AD%A5v
* 呼嚕嚕 hoolulu:http://www.hoolulu.com/core_zh/
* MapABC地圖搜索:http://www.mapabc.com/localsearch.shtml
* Google地圖:http://ditu.google.com/
* 搜狗Sogou地圖:http://map.sogou.com/new/#c=13222250,3747750,11
* 維基百科:http://zh.wikipedia.org/w/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh-hant
* 法鼓維基首頁:http://wiki.ddbc.edu.tw/pages/%E9%A6%96%E9%A0%81
* 批次改檔名工具:UltraRename28b.exe
* 批次改檔名路徑J:\CND\Projects\2008BTG佛寺志\work\工具\UltraRename28b.exe 
* 同文堂(網頁簡繁體轉換):http://of.openfoundry.org/projects/333/download
* 復旦版歷史地名資料庫有歷史地名釋文  http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp
* cbeta網站 http://www.cbeta.org/download/cbreader.htm
* 台北版佛典集成 缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php* 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw
* 吳疆教授(亞利桑那大學東亞研究所,對中國佛寺志有鑽研)
    網址:  http://bgis.coh.arizona.edu/ 
    聯絡信箱: jiangwu@email.arizona.edu
● 資料路徑
 ● 缺字輸入介面 http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
 ● 首頁 http://10.10.0.49/fosizhi/index.html
 ● 中國佛寺史志內部網址  http://10.10.0.49/fosizhi/ui.html
 ● 中國佛寺史志外部網址  http://140.131.254.11/fosizhi/ui.html
 ● 節點頁面網址: http://10.10.0.49:8080/fosizhi_json/
 ● 總目錄標記問與答,存放路徑  J:\CND\Projects\2008BTG佛寺志\work\標記\目錄\目錄標記問與答.odt
 ● 佛寺志作業時程 http://spreadsheets.google.com/ccc?key=py-MCl83eYhHl-WYd8FBcFA&hl=zh_TW
 ● 掃瞄檔 http://10.10.1.11/Temple_Gazetteers_Tiff/      密碼:tg_project
 ● 佛寺志專案工作檔: J:\CND\Projects\2008BTG佛寺志\work\
 ● 工作時數登記表  J:\CND\Projects\2008BTG佛寺志\行政\人事\工讀金\
 ● DDBC 檢索網址 http://isearch.ddbc.edu.tw/
 ● 人名、地名、時間權威檔login: http://authority.ddbc.edu.tw/login.html
 ● 人名權威檢索查詢:http://authority.ddbc.edu.tw/person/   
 ● 地名權威檢索查詢: http://authority.ddbc.edu.tw/place/
 ● 時間權威檢索查詢: http://authority.ddbc.edu.tw/time/index1.html
 ● 權威檔修改-Google文件:http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com
 ● GIS專案 http://buddhistinformatics.ddbc.edu.tw/gaosenggis
● 操作技巧
   幾個快捷技巧:
   Alt+ Tab  切換文件
   Ctrl+ R   html重新整理
   在Oxygen下:
   Ctrl+ E   下標記
   Ctrl+Shift+ V  valid
   Ctrl+Shift+ W  well form
   Ctrl+Shift+ <  加註;取消註
   在Oxygen xpath下:(Perspective → Show Toolbar → XPath)
   //pb → 找所有<pb>(同理可推:找placeName---)
   //pb[@='0100'] → 找第100頁
   //persName[.='名字'] → 找出某人名
● 觀念:

凡用電腦可一併處理的,就不一一標記


二、檔案架構說明

 *  J:\CND\Projects\2008BTG佛寺志\work\標記\標記範本\併檔範本\併檔架構說明

三、用轉好的檔案作業

 *  J:\CND\Projects\2008BTG佛寺志\work\database\原始檔\BTG加p加pb\output\

四、xml轉html步驟

安裝oxygen 9.1

由gxxx_main.xml主檔 呼叫html.xsl
1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形)
  進入轉檔介面,選New(第一次建立html檔後,
  若所設定的路徑都沒變動的話,以後直接點Transformation now即可;
  若有要更改路徑的話,點Edit進入介面去修改即可)
2.進入Edit scenario 介面
  a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl)
  b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK
3.此時進入到下一個介面,點Transform now,即可產生html檔案
4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾

安裝 exist.jnlp 上傳檔案

1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
   (1)main主檔要經valid驗證 --沒有點點的紅勾勾
    (2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
   請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(單卷)→Select files or directories store →Close
佛寺志網頁

● 編輯網址: http://dev.ddbc.edu.tw/fosizhi/index.html

● 節點頁面網址: http://10.10.0.49:8080/fosizhi_json/

● HTML檔介面定案:人名/地名/時間 分三種顏色。

 例如:  地名 與 地名代名詞<ref>--------綠色
        時間 與 時間代名詞<ref>--------藍色
        別名 與 人名代名詞<ref>--------紅色
        人名(常名)--------------------加底線 (紅色)
介面程式撰寫 (小花)

建立參考書目(妙妙,美燕,秀雯)

●存放路徑 J:\CND\Projects\2008BTG\work\reference\參考書目
●gazetteerBibl.XML

標記內容(+電1校)

標記重點:人名、地名、時間

建置說明請參照凡例: 專案整合權威資料庫工作手冊

(1)人名<persName>

查詢人名id碼網址:"人名權威資料庫" http://authority.ddbc.edu.tw/person/新增人名id碼:"人名權威資料庫維護" http://authority.ddbc.edu.tw/login.html
 (e-lib→佛學研究平台→佛學古典文獻人名權威檢索→輸入人名後,按submit→取權威碼作為xml:id碼)
  • 作者的標法& 標題(head)+作者(persname)於同一行的標法?
A:<head>標題</head>  <byline><persname type="author">作者</persname></byline>
   (註:<byline> 包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
  • 第一次出現人名時的標法
     例:<persName xml:id="A000883">攝摩騰</persName>
  • 以後出現此人的同名及異名時的標法:
    例:<persName corresp="A000883">騰</persName>
    說明:corresp 是correspondence的縮寫,意為相當或等於
  • 介面說明:
 新增資料建檔方式
   人 名:新增人名;別名(用半形分號分隔,越詳盡越好,但不用帶上稱謂如"禪師"等)
   類 別:(GIS專用)
   註 解:可辦認此人是誰的資訊(最好能標出生卒年。標點符號用全形)
   生卒年:(不用填)
   朝 代:(必填)
 
※註解欄中填寫須注意事項:
  a)必備四樣資訊:朝代、出生地、生卒年、著作。
 ●若缺少這些資料,則可放與時間參照點有關的人、事、物的資料,例如此人曾於某年某地做某事。  
 ●佛寺志文本若已具備這些條件,就不必找其他工具書。
  b)生卒年(西元-西元)中間用半形連接號分隔。
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。(須參考「專案整合權威資料庫」工作手冊 凡例之1.3 註解 note項目說明)
  d)尋找網路資料時,優先採用順序以Authority所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
 ●示範註解欄說明:
  (一)福州福清何氏子,年十四依鎮東慧山祝髮,著有舍利記、語錄二十捲、五燈嚴統二十五
       卷。為密雲圓悟法嗣。(g086p0119)
  (二)(1593-1661)明末清初臨濟宗僧。福建省福州府福清縣人,俗姓何,號費隱。生於明神
       宗萬曆21年,卒於清順治18年。(佛光:4802;佛百:4053)
      
 ●示範文本標記說明:
  例:衍勤禪師,幼從莆田西來寺純證禪德脫白,嗣仲祺和尚法。
  標法:1. 幼從<placeName xml:id="CN">莆田西來寺</placeName>
         <persName xml:id="A004122">純證<roleName>禪德</roleName>
         </persName>脫白,嗣<persName corresp="A004085">仲祺<roleName>
         和尚</roleName></persName>法。
  標法 2. 幼從<name><placeName xml:id="CN">莆田西來寺</placeName>
         <persName xml:id="A004122">純證<roleName>禪德</roleName>
         </persName></name>脫白,嗣<persName corresp="A004085">仲祺<roleName>
         和尚</roleName></persName>法。
  標法 3. 幼從<persName xml:id="A004122"><placeName xml:id="CN">莆田西來寺
         </placeName>純證<roleName>禪德</roleName></persName>脫白,嗣
         <persName corresp="A004085">仲祺<roleName>和尚</roleName></persName>
         法。

(2)地名<placeName>

查詢地名id碼網址:"地名權威資料庫" http://authority.ddbc.edu.tw/place/新增地名id碼:"地名權威資料庫維護"http://authority.ddbc.edu.tw/login.html
   (e-lib→佛學研究平台→佛學地理名詞權威檢索→輸入地名後,按submit→取Project­_No碼
    作為xml:id碼) 
* 確認查找古今地理位置: 安裝 Super GIS 軟體
  (利用Super GIS所提供的地理圖層可幫助確認古今地名正確位置)
* 世界地圖: J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
* ccts使用教學影片:J:\CND\Projects\2008AuthorityDB\SuperGIS2.2\CCTS\CCTS \ccts.swf
   (感謝GIS伯雍提供)
* 中央研究院提供地圖工具 http://gis.rchss.sinica.edu.tw/google/?p=301
(一)內文標記方式
  • 第一次出現地名時的標法
  例:<placeName xml:id="Z13005440">雒邑</placeName>
  • 以後出現同地名或別名時的標法
  例:<placeName corresp="Z13005440">雒陽</placeName>
  說明別名(異名):同地卻因朝(年)代不同而出現別名時,須於Super GIS用『同地名id碼』另建置
  新增地方別名
(二)新增/修改地名之介面說明

新增資料建檔方式

●第一步驟說明:
          1.進入"地名權威資料庫維護"http://authority.ddbc.edu.tw/login.html
          2.跳出「有問題的地名」頁面時-不理會請Delete(快速鍵:Ctrl+ W 鍵)即可進入「地名檢索」頁面
          3.地名檢索下方「管理功能」點選「新增地名」
             * 地名檢索條目說明如下:
                                地名檢索字串:提供任一關鍵字即可。
                                編號搜尋:以CN碼為主。
                                Z碼搜尋 :以Z碼為主(中研院所提供之編碼)。
                                複合搜尋:複合關鍵字搜尋(隔開標點符號為逗號,)以利更快速精準的查詢功能。
                                          範例:浙江,四明山(此為複合關鍵字)
                                管理功能:僅提供有權限人員使用欄位。
          4.選擇「地理區域範圍」(三種區域包括:中國、中國境內跨區、其他國家)
 a)已知固定範圍之地理區域(中國)項目說明:        
   區 域:選擇地名之省、市、縣或區,確認最小範圍後點選「選取此地區」。(資料不足可選擇最大範圍-省)
   分 類:參考地名編碼原則之「屬性編碼」方式,選擇適當代碼。
   獲得編碼:選「按此取得編碼」(請再次檢查編碼的正確性)。
   編碼結果:選「使用此碼」(新增編碼成功後,不可隨意更改編碼。)
   清除資料:可重填(重點原則是尚未點選「使用此碼」之前)。 
 b)跨區(中國)項目說明:   
   先選擇一個區域:參考中華人民共和國行政區劃之「中國政區」區域範圍說明。
   分 類:參考地名編碼原則之「屬性編碼」方式,選擇適當代碼。
●第二步驟說明:
          1.取得編碼後出現「修改地名」視窗
          2.繼續填寫「基本資料」欄
   Level:(不必填)
   朝 代:慣用名-使用條件為『不受年代變動的影響之地名』。(範例:長江、四明山..等)
   經緯度:座標來源可利用Google Map 『我的地圖』之『更多小工具』新增 getLatLongPlus2
   座標型態:選擇條件說明:
          1.已考定(精確)-已確定之精確座標位置
          2.已考定(預設值)-須進一步雙重確認
          3.待考-尚未考察或須待確認 
          4.不可考-已考察並確定此地名不存在或無可考
   拼 音:(不必填)
   說 明:(可不必填)填寫須具備以下條件:
          1.簡潔說明(僅提供地名本身須註解部分,不提供文本相關資料。)
          2.使用全形標點符號,如下所示:,。、;:!?.「」『』()《》〈〉[]…… 
          3.提供來源出處(須參考「專案整合權威資料庫」工作手冊 凡例之1.3 註解 note項目說明)
   加入超連結:引用網路資料之網址。
             操作方式說明:先置入網址於說明欄內,並複製全選網址後,再一次點選「加入超連結」貼上網址按確定即可。
●第三步驟說明:
          1.繼續填寫「地名部分」欄
          2.「常名」:須符合當時年代所常用之名稱(僅可提供一個常名),於「是否常名」欄中選「是」即可。        
●第四步驟說明:
          1.按「修改資料」即成功完成新增建檔。(切記:若沒有先按「修改資料」而繼續登錄以下之項目「新增來源資料」將面臨前功盡棄的殘酷事實。)
          2.其他別名:限定條件須為同年代(因特殊地理位置或其他原因而給予的名稱(可提供多個名稱)),均於「是否常名」欄中選「否」即可。
●第五步驟說明:
          1.再次新增/修改地名時,於"地名檢索結果"頁面,點選「修改這筆資料」即可。
          2.「新增來源資料」(source)僅須登錄一筆即可。範例:g017p0001
 ※基本資料欄中須注意事項:
  a)必備四樣資訊:朝代、經緯度、地名部分、來源資料。
  b)文本之寺院內建築必須給ID及經緯度。常名建置。範例:慧因寺妙應殿
    ex:<placeName xml:id="CN××××××T××AB">寺院內建築</placeName>(ID=CN××××××T××AB)
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
  d)尋找網路資料時,優先採用順序以Authority所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
  f)失落或無可考的建築物及地名可不提供經緯度,但文本須標記並於
    地名權威資料庫建置地名以供日後檢索。
建築物 XML(文本內文) 地名基本資料欄 經緯度
存在 給I D 標<placeName xml:id="×××"> 須建檔 提供最大範圍 例如:省、區、寺院
不存在 給I D 標<placeName xml:id="×××"> 須建檔 提供最大範圍 例如:省、區、寺院
無可考 不給I D 文本標<placeName>以顏色區分 須建檔 不給

修改資料建檔方式

        ●第一步驟說明:進入"地名檢索結果"頁面
        ●第二步驟說明:點選「修改這筆資料」(編碼和行政區不可修改)
        ●第三步驟說明:「地名部分」及「新增來源資料」僅開放新增或修改,無法執行刪除動作。
        ●第四步驟說明:新增別名時,於下方「新增其他別名」後,按「新增」即可。(限定條件須為同年代的別名)
※修改資料中須注意事項:
  a)編碼和地理區不輕易改編碼。
  b)若需改編碼後務必登錄權威碼修改申請隱藏該筆資料,以利後端程式人員通告相關人員。
  c)資料庫無刪除動作,僅可向authority維護人員報修登錄權威碼修改隱藏該筆資料。

(3)時間<date>

  • 年初,年末期間的取法原則:1/4
查詢時間id碼網址:"時間權威資料庫" http://authority.ddbc.edu.tw/time/
(e-lib→佛學研究平台→中西時間對照權威檢索→輸入檢索資料後,按submit→取Project-_No碼作為xml:id碼)
  • 時間點的標法說明:

(a)有年月日的標法,用 when

  <date when="西元年-月-日" xml:id="d(起始id碼)(終尾id碼)">內文時間</date>
    例:<date when="1610-西元月-西元日" xml:id="d58208525820852">萬曆庚戌年
     五月十六日</date>

(b)有年或月的標法

  1年(1月)的標法:<date corresp="d57020065702359" notBefore="1285-02-06" 
           notAfter="1286-01-25">至元廿二年</date>。   

(c)第二次以上出現時間的同名或異名時的標法:

  例: <date when="1610" corresp=" d58206905821073">同年</date>
  PS:將xml:id改為corresp
  • 為『不明確』(某區段內)時間的標法說明:

(a)事件發生於區段內的某一時段,用 notBefore notAfter 年代為四碼

  例:清光緒年間,錢塘丁丙刻「武林掌故叢編」時,...。
     <date notBefore="1875" notAfter="1909" xml:id="d59174915929893">清光緒年間</date>

(b)事件進行為持續整個區段時間(且時間點明確),用 from to

  例:明逕壁立禪師,生崇禎壬午年五月念七日寅時。雍正甲辰四月十二日說偈訣眾,
     而化塔本寺頭亭。壽<date from="1642-06-23" to="1724-05-04"xml:id=
     "d58325275862427">八十三</date>。
    
  • 時間為民國的標法說明:
* 查詢ID: 用檔案 GISapD\資料表\ADDate&SB西元與日干支
  例: 民國十三年甲子九月 (出自 : 泉州開元寺志  第十一頁  第二行 )
  步驟一 : 至 http://destiny.xfiles.to/tools/calendarVS.html 查詢西元日期;
          結果為 西元 1924年9月29日至 1924 年10月27日
  步驟二 : 開啟GISapD\資料表\Addate&SB西元與日干支;
          找 ADDate中 +1924-09-29 的日期 ; 
          得到 DateID 為5935623查詢 +1924-10-27 則得到DateID碼為5935651
  步驟三 : 得到ID碼後則可標記為<date when="1924" xml:id="d59356235935651">
          第二次出現及以後 , 則標為<date when="1924" corresp="d59356235935651">
  • Datecode查詢為id碼(d59356235935651)返回查詢系統

建置【來源出處】注意事項

 ● 出處在 CBETA 者。請建置在「新增來源資料」 CBeta Links欄位中
例如:X65no1295_p716a23
 ● 出處在 文本 者。請建置在「新增來源資料」  Source  Links欄位中
例如:g017p0036
 ● 「註解」中來源出處請使用全形標點符號,如下所示:
,。、;:!?.「」『』()《》〈〉…… 標點符號用法,可參   http://www.edu.tw/files/site_content/M0001/hau/c2.htm注意事項:  
1.生卒年中「-」連接號使用半形標點符號。例如:通容(1593-1661)。
2.每一個別名之間以「;」分號(半形或全形皆可)隔開。
 ● 「註解」內容之來源出處請使用全形標點符號,並參照以下範例:
一.同一來源出處請使用「全形頓號」標點符號隔開
例1:佛光:480、405
例2:(http://baike.baidu.com/view/322497.html(烏墩)、http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw(烏鎮),日期:2008.12.23)
二.不同來源出處請使用「全形分號」標點符號隔開
例1:佛光:480;佛百:4053
例2:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02;佛光:480;http://baike.baidu.com/view/1225413.htm(夕照山),日期:2008.12.23)
三.日期前的標點符號請使用「全形逗號」隔開
例1:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02)
注意事項: 
1.使用網路出處來源,需注意其穩定性及權威性。建議參照使用Authority所提供網路資料Authority。
2.網址中出處來源的條目,其目的是利於日後方便搜尋。EX:(雷峰)

代名詞

 
 1.須標記且詞意不明顯時才要標
 
 2.代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
   例如:<ref corresp="A003940"></ref>
 
 3.由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
   皆不用再重複標記。

註解

 
 1.文本註解無論是何種類型,一律採用此種標記為<note rend="smallType"></note>
   例如:上有橫地<note rend="smallType">疑當作池</note>
 2.在標題內之註解,置於<head>內.
   例如:<head><note rend="smallType">共計五十九峰</note></head>

內文字體缺少或難以辨認時

* 標法參考以下網頁:

  http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html#
  範例:2個圓圈刪去,輸入<gap extent="2" unit="chars" reason="lost"/>
        extent: 被省略的文字量  unit: 資料型態

 

缺字與通用字

缺字與通用字的定義

定義:

  ●  凡於unicode網站找不到者,或古字打不出來的,皆作缺字處理。
台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml
  ●  通用字:古今通用,例如價值的值,古字用直,今用值。參考網頁
http://big5.ce.cn/gate/big5/cathay.ce.cn/file/200704/25/t20070425_11166721.shtml 
異體字:例如寧,可寫成寶蓋頭下加血

異體字(通用字)與缺字處理流程

  1. 判斷異體字(通用字)或缺字,(用教育部異體字典)
  2. 圖檔處理
  3. 內文標記
  4. 介面輸入
1.判斷異體字(通用字)或缺字,(用教育部異體字典)

http://www.zdic.net/zd/zi/ZdicE9ZdicBBZdic8E.htm

2.圖檔處理
(1) 是異體字時:

1.於教育部異體字典網站download(手寫字體)或unicode 網站download圖檔(正寫字體)
unidoce download 的圖檔背景是透明的,教育部異體字典download圖檔是背景是白的,用文本掃瞄的.tif背景是灰的,此背景色不同無仿

2.於缺字介面新增一筆以獲得檔名.gif
用gimp縮放尺寸, 尺寸45x47 72dpi,作法如下
或以xview批次處理尺寸及dpi

(2) 是缺字時:
於原始檔.tif用gimp剪下,作法如下
利用Gimp軟體處理缺字圖檔
【98.01.19 Erica】
 *裁切掃瞄檔缺字步驟
(1)開啟Gimp功能表「檔案」.
(2)點選「開啟」.
(3)選擇掃瞄檔案ex:2Book022(路徑:J:\CND\Projects\2008BTG\work\掃瞄)中缺字頁碼.
(4)放大圖片以利裁切:點選「顯示」選擇「縮放2:1(200﹪)」.
(5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆).
(6)將「剪裁」圖形移至缺字字體,確認位置後點選滑鼠左鍵2次,即出現裁切之缺字圖檔.
(7)設定圖片尺寸:點選「圖片」選擇「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成.

 *針對已下載缺字圖片設定尺寸之轉檔步驟
(1)開啟Gimp功能表「檔案」
(2)點選「開啟」(路徑:先前已下載的缺字圖檔ex:btg×××××××.jpeg之資料夾)
(3)設定圖片尺寸--點選「圖片」選擇「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(4)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成.
3.內文標記
異體字(通用字)與缺字:
<g ref="#btg086001701"/>
以上檔案命名原則:btg+志碼+頁碼4碼+序碼2碼(此頁第幾個缺字)
4.介面輸入
(a)登入缺字網頁[1]
(b)取碼目的:取得缺字檔名及建置缺字組
(c)建置步驟說明:
  (1)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (2)產生缺字id後,即可輸入缺字資訊(如e).
(d)完成後,按「更新資料庫」.
(e)輸入缺字資訊
charName:
<charName>到unicode網站找cjk(decimal), CJK IDEOGRAPH 15181=Unicode使用 Unicode,不用utf-8<charProp表示字的屬性、表達方法。比如說注音、發音。Mapping說明:<mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、組字式、unicode碼。
(f)至CBETA漢字庫打通用字或組字式以獲得組字式或CB碼
(g)標記發音: 漢語拚音字典找漢語拚語

勘字

(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。

圖檔或圖檔內有文字標記法

印章(視為圖檔)標記法如下:
<figure>
    <figDesc><signatures></signatures></figDesc>
    <graphic url="1B020P024.jpg"/>
</figure>
 <figure>
  <head>標題</head>
   <figDesc>讓此表可以檢索到的圖說,以半形標點符號間隔文字</figDesc>
    <graphic url="cwdc01p085a.jpg"/>
 </figure>(己有掃瞄圖檔故圖不顯示)

在文本標完後,建立事件<linkGrp>

 ※ 暫先不建立此事件<linkGrp>,馬老師將找專家做)
   說明:辨識文本中的事件,建立其「人、時、地」的連結群組
    例:
   <linkGrp>
     <ptr type="person" target="#G0292"/>
     <ptr type="person" target="#G1273"/>
     <ptr type="place" target="#TX5132241"/>
     <ptr type="time" target="#d405666405666"/>
   </linkGrp>


標記問答

● 宗派(例如賢首宗)及普門菩薩是否標記?

A:不標

● 寺院內建築(例如華嚴經閣)是否標記?

A:要標。

● 高麗國王,「國王」是否標記?

A:稱謂,不用標。

● 代名詞要不要標?

A:原則第一次出現要標,明者不標,不明者要標。

● 內文中提到的相關「著作」是否標記?

A:不標。

● 唐之垂拱(垂拱是年號)的標法?

A:<date from="垂拱的第一天" to="垂拱的最後一天" xml:id="id碼">唐之垂拱</date>

● 格式問題:是否照書編排?

A:可依文本實際內容調整標記。

● 並列文字的標法?

A:例:副寺<list rend="inline"> <item>惠秀</item>  <item>舜普</item> 
      <item>永施 </item></list>校刊 (註:rend表示"如何呈現")

● 標題(head)+作者(persname)於同一行的標法?

A:<head>標題</head>  <byline><persname>作者</persname></byline>
   (註:<byline> 包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)

● 標題後有副標題的標法?

     
例:<head>大安禪師<seg type="toc" rend="smallType">上堂一則 機緣二則</seg> 
       </head>(註:<seg> (隨機分割) 包含文件中任何隨機字詞層次的單元。
       toc=table and content)<br/>

● 於黃檗丈室堂第三代隱元隆琦國師入院法語五則上堂九則機緣三則,文中可否自添標題?

   
A:否。可於段落中加屬性<div type="入院法語一">區分

● 人名權威建檔,同一人名有多筆出處時,製作資料來源是否一一出處皆登錄?

A:只須登記第一筆

● 王居士、母龔氏等是否標記?

A:是,請儘量在註解欄提供相關可辨識的訊息。

● 幾個關於人名標記的用法

   <addName> (附加名稱) 附加的名稱,例如綽號、稱號、或別名,或是在人名中出現的其他
             描述性措辭。    
   <roleName> 包含一個身份名稱,代表個人在社會上所扮演的特殊角色或所處地位,例如:
             官方頭銜或地位。
   <surname> 包含一個家族姓氏,並非名字、教名、或綽號。
   <forename> 包含名字或教名。
   <genName> 該名稱用來和其他相似名稱做區別,以個人的相對年紀或隸屬世代作依據。
   <geogName> (地理名稱) 與地形名稱結合的地名,例如威拉索溪谷、西奈山等。
範例1.:
  <persName xml:id="A001873"><addName>佛慈廣鑑慧光普照</addName>
     隱元隆琦<roleName>國師</roleName></persName>
範例2.:
  <persName xml:id="A001150"><roleName type=""school>臨濟</roleNname><addName>開法</addName>費隱通容<roleName>禪師</roleName></persName>
範例3.悟公的"公"標法?
  <persName corresp="A003688">悟<roleName type="honorific">公</roleName> </persName>

● 引語是否需標<cit><quote>?

A:否

● <lg><l>的注意事項

<lg><l><p>是對等地位,故不可包在<p>中。應結束</p>後,再標<lg>

● 行後有小字的標法? 例:寶慶三年正月日牒尚書省印#行書

A:寶慶三年正月日<note rend="smallType">牒尚書省印行書</note>

● pb放置的位置?

A:放<div>與<head>中間。例:<div><pb n="0095"/><head>

● 文字出現於兩行的行中時,是否照文本排版標記?

A:不用照原文排版 
    

● 文本中人名資料中的<字號或別名>無法確實查證時,該如何標記?

  例:<persName xml:id="A003937">姚二煜葆明</persName>甫
A:無論是別名或字均以<addName></addName>包起來即可.
  例:<persName xml:id="A003937">姚二煜<addName>葆明</addName> </persName>甫

● 遇人名不確定是否為某人時,可加屬性值標示。

例1:<persName type="unknown">某某某</persName>此為完全不明或查找不到確認
   此人身份資料時用
例2:<persName xml:id="A001606" cert="70%">cert 是表示標者自認為的正確度,
   是相對的,非絕對的。

● 作者標記<byline type="Author">無法驗證通過?

A:可試試另兩種標法
(1)<byline><docAuthor>作者名</docAuthor></byline>
(2)<persName type="Author">作者名</persName>

● 圖檔標記:url 圖檔檔名?

  <figure><figDesc>圖說</figDesc><graphic url="掃瞄檔檔名.jpg"/></figure>
例:<graphic url="3B004P001.jpg"/>(註:P為大寫,頁碼為三碼)

● 空白頁的處理

A:只需標上頁碼
例:<pb n="0248"/>

● 人名、地名等跨頁時的標記

A:將 pb移到name 之後(以程式處理)

● 人名標記:稱謂(如:公,和尚,禪師---等)是否包進人名,再確認?

A:稱謂須包進人名,並標以<roleName>等元素。

● 某仙人,是否標人名、是否給id碼?

A:否

●文末的"印"是否需標記?

A:<figure><figDesc><signatures>「樊王家」方印</signatures></figDesc></figure>

●<head> <item>標題,項目有跨頁時,是否可把標題,項目記在第一頁?

A:照原文標記

●<author>與<docAuthor>之異同? (<author>在<body>內無法valid)

suggest: <docAuthor>指題名頁的作者, <author>指內文的作者以為區別
 A:可用<byline><persName type="author">唐王勃</persName></byline>

●若印刷錯誤,這頁的內容與上頁相同,tag?

   是否可用<del type="duplicate"></del> (html沒有任何明顯的改變,只是用標記加以註解) 
   <del> (刪除) 標記在文本中,由作者、抄寫者、註解者、或更正者刪除、標上刪除記號、或者標明為多餘或偽造的字母或單字。
 A:可用<note resp="ddbc.da">「」</note>,內文會消失,只出現[註].

驗證

1. main的檔頭有用all.nrc刪除
2.需要的schema路徑 
  J:\CND\Projects\2008BTG\work\markup\標記進行中\schema\.rnc
3.設定Schema路徑操作說明如下:
  a)在Oxygen功能表上方,點選Document中valid--Exteral validation。
  b) 在validate with 視窗 選擇RelaxNG schema。
  c)於URL選擇設定schema路徑(參考2.)後按確定即可。
4.回到main檔按Oxygen功能表上方的紅勾勾驗證(沒有點點的)確認已valid及確認其他卷well formoed
5.開啟eXist程式上傳
6.若樹狀結構有變更,請先更新節點[2]
7.開啟佛寺志網頁,按重新整理即可。

待解決內部問題討論

● Do most smalltype words in the Chinese text belong to <note> or <gloss>?
   Or it depents? (Sophia 2009-2-20)
   <note> 包含附註或註釋。
   <gloss> 標明用來為另一個字詞下定義或提供註解的字詞。

The below info. is extracted from TEI P5 website. 
   
"A note is any additional comment found in a text, marked in some way as being
out of the main textual stream. All notes should be marked using the same tag,
note, whether they appear as block notes in the main text area, at the foot of
the page, at the end of the chapter or volume, in the margin, or in some other 
place. 

Notes may be in a different hand or typeface, may be authorial or editorial, and
 may have been added later. Attributes may be used to specify these and other 
characteristics of notes, as detailed below."

(Smaller words, compared with normal-size words, in ancient Chinese text are 
almost additonal,describle statement,but not alwayse the definiton of the 
normal-size words. Maybe some are.)(Sophia)

最新公告

"請註明紀錄者姓名及日期"

●變更通用字與古字以缺字標記方式如下:(Erica;2009/02/11)
           通用字--值 
           古字-----直
   TEI標記:                   
           <g ref="#btg017018201"/>(古字-直)
並且登錄「缺字網頁」後「新增一個 mapping」Key in 通用字-值
 
●g0××_00.xm之檔頭宣告 與 <div>檔,均須提供元素類型名稱<div type="××××">目的:建置佛寺志網頁卷之節點名稱.(Erica;2009/01/19)
ex:<div xml:id="g077_00.xml" xmlns="http://www.tei-c.org/ns/1.0" type="九華山志"><div type="圖文">
 
●卷前之【版前說明】或【卷前圖說】均放置g0××_00.xml檔案裡,以<div></div>包起來.(Erica;2009/01/19)
 
●用 Gimp 處理缺字圖檔的方法, 己放入缺字目錄中  98.01.15 April
 
●用 Gimp 處理缺字圖檔的方法, 己放入缺字目錄中  98.01.15 April
 
●代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
   例如:<ref corresp="A003940"></ref>
 
●由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
   皆不用再重複標記。
 
●註解內容要呈現,內容主要放:生卒年、出生地、別名。若這些資料缺少,則可放與時間參照點有關
   的資料,例如此人曾於某年某地做某事。
  
●html檔介面定案:人名/地名/時間 分三種顏色。
   例如:   
       地名 與 地名代名詞<ref>--------綠色
       時間 與 時間代名詞<ref>--------藍色
       別名 與 人名代名詞<ref>--------紅色
       人名------------------------加底線 (紅色)
 
●缺字處理決議為若無 unicode 字型均採用組字式處理(ex: 羅[目*侯])(Erica;2008/11/17)
 
●文本若出現非標記可處理的範圍,可不標句讀。但是須於<teiHeader>作一個說明程式。(Erica;2008/11/17)
   例如:元朝蒙文文言文,可不標句讀。
    
●通用字與古字TEI標記舉例如下:(Erica;2008/11/17)
           通用字--值 
           古字-----直
   TEI標記:                   
           <choice>
                  <orig></orig>
                  <reg></reg>   (reg = 標準化/一般化)
           </choice>
●Authority人名/地名/時間權威網址變更並已更正完成(Erica;2008/11/27)
●地名權威資料的建置,寺裡建築物若已無存或無從考證,則可只標<placeName>,而不標id碼及經緯度。(智妙2008.12.01)
●缺字組<charName>內容決議:
(1)主檔標記:<charName>CJK IDEOGRAPH 148564</charName>
(2)使用 Unicode
(3)XML 檔案的內文標記為<g ref="×××"/>並參照《別譯雜阿含經》 (BZA)的數位版本\「缺字發音表」\中將異體字轉成 HTML 的組字型態並呈現「缺字圖檔」。(Erica;2008/12/08)
●訛字標記修正,原<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>(智妙2008.12.11)
修訂為:
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
  <reg> (一般化) 標誌一般化或規格化處理過的文字。
●缺字組的內容 2008.12.29 妙妙
<encodingDesc>
      <charDecl>         
        <glyph xml:id="g0001">
          <glyphName>CJK IDEOGRAPH 15729</glyphName>
          <charProp>
            <localName>pronunciation</localName>
            <value>piao3</value>
          </charProp>
          <mapping type="cbeta">[漂*寸]</mapping>
          <mapping type="cbetaNo">CB00579</mapping>
          <mapping type="unicode">15729</mapping>
          <graphic url="btg086012301.gif"/>
        </glyph>
        <glyph xml:id="g0002">
          <glyphName>Non Unicode Character</glyphName>
          <charProp>
            <localName>pronunciation</localName>
            <value>wu4?</value>
          </charProp>
          <mapping type="cbeta">[寤-吾+告]</mapping>
          <mapping type="cbetaNo">CB00854</mapping>
          <graphic url="btg086045601.gif"/>
        </glyph>     
      </charDecl>
   </encodingDesc>
●新增DDBC檢索網址 http://isearch.ddbc.edu.tw/ 2009.01.13 erica
●缺字登入網頁 http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq 2009.01.14 erica
●變更標記事項說明:2009.01.14 erica
1.xml:id 及 corresp 均修訂為 key
2.修訂範圍包括:人(persName)時(date)地(placeName)及代名詞(ref)標記xml:id 及 corresp
3.範例說明:
(1)原標記
  <persName xml:id="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>
(2)原標記
  <persName corresp="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>