「名山古剎-《中國佛寺史志》數位典藏」:修訂間差異

出自DILA Wiki
imported>Ericayu0725
imported>Ericayu0725
行 487: 行 487:


   ●  登入取碼:
   ●  登入取碼:
  http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
  a)登入網頁http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
  步驟 :
b)取碼目的:取得缺字檔名及建置缺字組
c)建置 步驟 說明:
   (1)
  
  
 ※2008年10月09日 DA meeting 討論兩個元素定義
 ※2008年10月09日 DA meeting 討論兩個元素定義

於 2009年1月14日 (三) 09:37 的修訂

名山古剎-《中國佛寺史志》數位典藏

Archive of Buddhist Temple Gazetteers


工作手冊 (請勿更動編排版面)

簡介及目的

《中國佛寺志》由杜潔祥主編,從民國69年至74年彙編完成,全套共3輯110冊。此套書所收之佛寺志或為手抄本或為各國圖書館唯一藏本,是以某地、某山、某寺為範圍的佛教史籍,是研究佛教史的重要史料。


透過便利的使用介面一一呈現圖檔、後設資料、數位全文等資源。 且將與「漢傳佛教高僧傳之時空資訊系統研究之專案計畫」(GIS)專案和CBETA光碟結合。

預算

此專案預計執行年度為97~99,共計3年,由中華佛學研究所贊助。 第一年經費57萬。

執行單位:數位典藏組

進度及預算控管:柯春玉 程式及介面撰寫:花金地 標記:林智妙、游美燕、彭川芩、何易儒 權威資料庫:闕慧貞 網頁美工設計:李承崇 經驗指導:張伯雍

執行方式

目錄建立

中國佛寺史志彙刊1-3輯共110冊 Bibliography 目錄建立(妙妙)

 ●xml檔頭宣告

符合tei 標準,兩個驗證程式Schema(rng、rnc),輸出程式stylesheet

 ●登錄項目
       <bibl>
         <title>
         <biblScope>
         <spanGrp>
         <respStmt><name><date>
        <edition><date when="">or<date notBefore="" notAfter="">
 ●加入kml於目錄中
 於</bibl>結束前加
 <note type="place">河南洛陽</note>
 <note type="longlat">34.7203(緯度),112.6193(經度)</note>
 </bibl>

共八個志 Keying 外包打字加粗標 (春玉)

 ●外包打字加粗標
   * 明州阿育王山志一 N29.859 E121.745
 
   * 明州阿育王山志二,續志
   
   * 重修普陀山志 N29.9835 E122.3795
   
   * 玉岑山慧因高麗華嚴教寺志 N30.2304 E120.1259
   
   * 泉州開元寺志N24.9232 E118.5837,
   
   * 廈門南普陀寺志N24.4424 E118.0929
   
   * 雞足山志 N25.9704 E100.3745
   
   * 雞足山志
   
   * 黃檗山寺志N25.5845 E119.2715

轉粗標為正確的標記

pb+p

掃瞄檔列印(筆一校用)(小芩)

 ●開啟檔案,選取 Windows Picture and  Fax Viewer(山水圖案)
     
 ●點擊列印
|相片精靈(請耐心等待 約20秒~60秒後出現)
|圖片選項
|選取張數(佛寺志專案掃瞄列印通常為整本所以是全選)
|列印選項 
|列印喜好設定
|原稿型態:雙面書本 
|選取版面設定:二合一 
|順序:由右至左  
|選取版面設定
|全頁傳真列印完成

共110冊 Scanning 掃瞄 (伯雍,Simon)

   * 選擇掃瞄檔案儲存為Tiff
   * 解析度為400dpi
   * 8 bits 灰階。( 不是黑白 )
   * Tiff 轉 jpg

共110冊 Metadata 建立 (家名,秀雯,Simon)

  • 建立掃瞄 Tiff 數位圖檔的 Metadata
  • 一本佛寺志各頁的掃瞄圖檔放在同一資料夾
  • 一本佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
  • Metadata檔案內依序記錄每張掃瞄圖檔之資訊
  • 每張圖檔資訊記於一組<img></img>內
<img>內容範例:
<img>1B005P011(數位圖檔的檔名)
|內文( type 分4種 : 書名頁 ; 版本說明 ; 目錄 ; 內文 )
|金陵梵剎志-金陵梵剎志卷二十二-放生池記
|( title : 以 「-「 dash 表達漸層關係,同一頁若有2個標題以上則以「/」slash 隔開
|舉例:金陵梵剎志-金陵梵剎志卷二十二-千佛寺/金陵梵剎志-金陵梵剎志卷二十二-大中正覺菴)
|978 (圖檔之原書頁數)
|放生池(圖檔內容的前三個字)</img>
  • 缺字至cbeta查找組合字[], 若沒有則回報 cbeta小組,異體字至教育部異體字字典的網站查詢,遇到空白頁,則標題延續上一頁的標題,「前三個字」則空白處理.

  • 將完成的檔案以 txt 存於 ftp: 10.10.1.11/Buddhist temple's Gazetteers Tiff與佛寺志的數位圖檔放在一起,每一個資料夾對應一個Metadata的檔案 ( 資料夾 1Book001 表佛寺志第一輯的第一本,對應1Book001.txt )

metadata 檔案匯入MIX標記架構內(小花)

MIX架構含:head, mix, map

Metadata 問題與解答

1.目前的 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可,
  type多增加一個圖&空頁
2. 若內文的漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense)
3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?]表示

八志的文本標記(April, 妙妙,美燕,小芩,易儒,)

資料路徑與操作技巧

●工具
* 漢語拼音: http://www.iq-t.com/SYSCOM/pingying2.asp
* 教育部異體字字典:  http://dict.variants.moe.edu.tw/suo.htm
* 標點符號用法:http://dict.variants.moe.edu.tw/main.htm
* 國語辭典:http://dict.revised.moe.edu.tw/index.html
* 漢典:http://www.zdic.net/cd/
* TEI: http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html
* 二十五史http://www.sinica.edu.tw/ftms-bin/new/ftmsw3?tdb=%A4G%A4Q%A4%AD%A5v
* 呼嚕嚕 hoolulu:http://www.hoolulu.com/core_zh/
* MapABC地圖搜索:http://www.mapabc.com/localsearch.shtml
* Google地圖:http://ditu.google.com/
* 搜狗Sogou地圖:http://map.sogou.com/new/#c=13222250,3747750,11
* 維基百科:http://zh.wikipedia.org/w/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh-hant
* 法鼓維基首頁:http://wiki.ddbc.edu.tw/pages/%E9%A6%96%E9%A0%81
* 批次改檔名工具:UltraRename28b.exe
* 批次改檔名路徑J:\CND\Projects\2008BTG佛寺志\work\工具\UltraRename28b.exe 
* 同文堂(網頁簡繁體轉換):http://of.openfoundry.org/projects/333/download
* 復旦版歷史地名資料庫有歷史地名釋文  http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp
* cbeta網站 http://www.cbeta.org/download/cbreader.htm
* 台北版佛典集成 缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
* unicode 網址: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35
* 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw
* 吳疆教授(亞利桑那大學東亞研究所,對中國佛寺志有鑽研)
    網址:  http://bgis.coh.arizona.edu/ 
    聯絡信箱: jiangwu@email.arizona.edu
● 資料路徑
 ● 首頁 http://10.10.0.49/fosizhi/index.html
 ● 總目錄標記問與答,存放路徑  J:\CND\Projects\2008BTG佛寺志\work\標記\目錄\目錄標記問與答.odt
 ● 佛寺志作業時程 http://spreadsheets.google.com/ccc?key=py-MCl83eYhHl-WYd8FBcFA&hl=zh_TW
 ● 掃瞄檔 http://10.10.1.11/Temple_Gazetteers_Tiff/      密碼:tg_project
 ● 佛寺志專案工作檔: J:\CND\Projects\2008BTG佛寺志\work\
 ● 工作時數登記表  J:\CND\Projects\2008BTG佛寺志\行政\人事\工讀金\
 ● 中國佛寺史志內部網址  http://10.10.0.49/fosizhi/ui.html
 ● 中國佛寺史志外部網址  http://140.131.254.11/fosizhi/ui.html
 ● 人名、地名、時間權威檔login: http://authority.ddbc.edu.tw/login.html
 ● 人名權威檢索查詢:http://authority.ddbc.edu.tw/person/   
 ● 地名權威檢索查詢: http://authority.ddbc.edu.tw/place/
 ● 時間權威檢索查詢: http://authority.ddbc.edu.tw/time/index1.html
 ● 權威檔修改-Google文件:http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com
 ● GIS專案 http://buddhistinformatics.ddbc.edu.tw/gaosenggis
 ● DDBC Select databases http://isearch.ddbc.edu.tw/
● 操作技巧
   幾個快捷技巧:
   Alt+ Tab  切換文件
   Ctrl+ R   html重新整理
   在Oxygen下:
   Ctrl+ E   下標記
   Ctrl+Shift+ V  valid
   Ctrl+Shift+ W  well form
   Ctrl+Shift+ <  加註;取消註
   在Oxygen xpath下:(Perspective → Show Toolbar → XPath)
   //pb → 找所有<pb>(同理可推:找placeName---)
   //pb[@='0100'] → 找第100頁
   //persName[.='名字'] → 找出某人名
● 觀念:

凡用電腦可一併處理的,就不一一標記


二、檔案架構說明

 *  J:\CND\Projects\2008BTG佛寺志\work\標記\標記範本\併檔範本\併檔架構說明

三、用轉好的檔案作業

 *  J:\CND\Projects\2008BTG佛寺志\work\database\原始檔\BTG加p加pb\output\

四、xml轉html步驟

安裝oxygen 9.1

由gxxx_main.xml主檔 呼叫html.xsl
1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形)
  進入轉檔介面,選New(第一次建立html檔後,
  若所設定的路徑都沒變動的話,以後直接點Transformation now即可;
  若有要更改路徑的話,點Edit進入介面去修改即可)
2.進入Edit scenario 介面
  a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl)
  b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK
3.此時進入到下一個介面,點Transform now,即可產生html檔案
4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾

安裝 exist.jnlp 上傳檔案

1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
   (1)main主檔要經valid驗證 --沒有點點的紅勾勾
    (2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
   請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(單卷)→Select files or directories store →Close
佛寺志網頁

● 編輯網址: http://dev.ddbc.edu.tw/fosizhi/index.html

● HTML檔介面定案:人名/地名/時間 分三種顏色。

 例如:  地名 與 地名代名詞<ref>--------綠色
        時間 與 時間代名詞<ref>--------藍色
        別名 與 人名代名詞<ref>--------紅色
        人名(常名)--------------------加底線 (紅色)
介面程式撰寫 (小花)

建立參考書目(妙妙,美燕,秀雯)

標記內容(+電1校)

標記重點:人名、地名、時間

建置說明請參照凡例: 專案整合權威資料庫工作手冊

(1)人名<persName>

查詢人名id碼網址:"人名權威資料庫" http://authority.ddbc.edu.tw/person/新增人名id碼:"人名權威資料庫維護" http://authority.ddbc.edu.tw/login.html
 (e-lib→佛學研究平台→佛學古典文獻人名權威檢索→輸入人名後,按submit→取權威碼作為xml:id碼)
  • 第一次出現人名時的標法
     例:<persName xml:id="A000883">攝摩騰</persName>
  • 以後出現此人的同名及異名時的標法:
    例:<persName corresp="A000883">騰</persName>
    說明:corresp 是correspondence的縮寫,意為相當或等於
  • 介面說明:
 新增資料建檔方式
   人 名:新增人名;別名(用半形分號分隔,越詳盡越好,但不用帶上稱謂如"禪師"等)
   類 別:(GIS專用)
   註 解:可辦認此人是誰的資訊(最好能標出生卒年。標點符號用全形)
   生卒年:(不用填)
   朝 代:(必填)
 
※註解欄中填寫須注意事項:
  a)必備四樣資訊:朝代、出生地、生卒年、著作。
 ●若缺少這些資料,則可放與時間參照點有關的人、事、物的資料,例如此人曾於某年某地做某事。  
 ●佛寺志文本若已具備這些條件,就不必找其他工具書。
  b)生卒年(西元-西元)中間用半形連接號分隔。
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
  d)尋找網路資料時,優先採用順序以authority所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
 ●示範註解欄說明:
  (一)福州福清何氏子,年十四依鎮東慧山祝髮,著有舍利記、語錄二十捲、五燈嚴統二十五
       卷。為密雲圓悟法嗣。(g086p0119)
  (二)(1593-1661)明末清初臨濟宗僧。福建省福州府福清縣人,俗姓何,號費隱。生於明神
       宗萬曆21年,卒於清順治18年。(佛光:4802;佛百:4053)
      
 ●示範文本標記說明:
  例:衍勤禪師,幼從莆田西來寺純證禪德脫白,嗣仲祺和尚法。
  標法:1. 幼從<placeName xml:id="CN">莆田西來寺</placeName>
         <persName xml:id="A004122">純證<roleName>禪德</roleName>
         </persName>脫白,嗣<persName corresp="A004085">仲祺<roleName>
         和尚</roleName></persName>法。
  標法 2. 幼從<name><placeName xml:id="CN">莆田西來寺</placeName>
         <persName xml:id="A004122">純證<roleName>禪德</roleName>
         </persName></name>脫白,嗣<persName corresp="A004085">仲祺<roleName>
         和尚</roleName></persName>法。
  標法 3. 幼從<persName xml:id="A004122"><placeName xml:id="CN">莆田西來寺
         </placeName>純證<roleName>禪德</roleName></persName>脫白,嗣
         <persName corresp="A004085">仲祺<roleName>和尚</roleName></persName>
         法。

(2)地名<placeName>

查詢地名id碼網址:"地名權威資料庫" http://authority.ddbc.edu.tw/place/新增地名id碼:"地名權威資料庫維護"http://authority.ddbc.edu.tw/login.html
   (e-lib→佛學研究平台→佛學地理名詞權威檢索→輸入地名後,按submit→取Project­_No碼
    作為xml:id碼) 
* 確認查找古今地理位置: 安裝 Super GIS 軟體
  (利用Super GIS所提供的地理圖層可幫助確認古今地名正確位置)
* 世界地圖: J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
* ccts使用教學影片:J:\CND\Projects\2008AuthorityDB\SuperGIS2.2\CCTS\CCTS \ccts.swf
   (感謝GIS伯雍提供)


  • 第一次出現地名時的標法
  例:<placeName xml:id="Z13005440">雒邑</placeName>
  • 以後出現同地名或別名時的標法
  例:<placeName corresp="Z13005440">雒陽</placeName>
  說明別名(異名):同地卻因朝(年)代不同而出現別名時,須於Super GIS用『同地名id碼』另建置
  新增地方別名
  • 新安裝 中研院 SuperGIS 地理軟體
 目的 : 利用SuperGIS 提供的圖層,可幫助核對及查證古今地名位置。
 路徑 : 中研院『歷代地名圖層』J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf 
 ● 開啟 SuperGIS 的程式 :
 a):進入SuperGIS 介面
 b):開啟「功能表選單」>「工具」>「自訂」> 勾選 □「CCTS V2.0」選項 > 放置
       「功能表列」中
 ● 功能表選單:功能表選單包含「檔案」、「編輯」、「檢視」、「工具」、「選取」、
             「視窗」 、「說明」等項目,幾乎全部的功能皆可於功能表選單中找到。
 ● 匯入 中研院 提供的 『歷代地名圖層』
* J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf 
  步驟一: 點選 功能表列中的「CCTS V2.0」選項 >開啟 第一個選項「add CCTS Layer」
  步驟二: 點選「CCTS」> 「歷代行政界線圖層(面資料)」或「歷代地名圖層(點資料)」
  步驟三: 點選「歷代行政界線圖層(面資料)」>點選(可複選「秦(BC0210)」西元前        
          210 年(確認 紅  色勾ˇ)>勾選 □ 下方「Save SuperGeo file」選項 )
          >OK > 界面即出現地圖,請繼續步驟一.
PS:若選擇「現代各式圖層資料」>建議 點選「1990省/縣級行政區(面資料)」並耐心等候開啟
 ● 設定 圖層集(位於SuperGIS 介面的右方窗格)
 步驟一:點選右方「圖層集」> 按滑鼠右鍵選項 > 「內容」>「一般」>設定
             「地圖單位」選 項 > 選擇 「度」>「顯示單位」選項 > 選擇 「公里」
              >「套用」。
 步驟二:繼續設定「圖層集內容」>「座標系統」>選擇 右方「建立」選項 > 
             「大地基準-名稱」> 選擇 「D_WGS_1984」此編號為中研院版權不對外 
              >勾選下方 □「投影(Projection) -名稱」>
              選擇「Lambert_Confoml_Conic」> 點選「參數」>設定變更數值為 
              「Central_Meri..110」「Latitude_Of..10」「Standard_Par..25」
              「Standard_Par..47」>確定>回到「圖層集內容」>「套用」>確定。
 步驟三:繼續設定右方「圖層集」>點選「秦(BC0210)
              (確認 □ 藍色勾ˇ- 若顯示×表示該圖層路徑遺失)」>按滑鼠右鍵選項>
              點選「縮放至作用圖層」。
 步驟四:繼續設定 >點選「秦(BC0210)」>按滑鼠右鍵選項 >點選「內容」> 
              即進入「圖層內容」>功能表「來源」>設定「文字符號」您可依照需求
              自行設定「字型」「文字顏色」「背景顏色」【 建議 勾選 □ 背景透明
              及「背景顏色」為 白色 】。
 步驟五:繼續設定 >選擇「座標系統」>重複 第二步驟的設定
              (請參考2.1.3步驟二「座標系統」)。
 步驟六:繼續設定 >「圖層內容」>選擇功能表「符號」>點選「符號 □ 色框」> 
              進入「符號選取」>設定地圖背顏色您可依照需求自行設定「前景」顏色 >
              點選「邊線」設定地圖線條顏色 及 寬度 > 確定。
 步驟七:繼續設定 >「圖層內容」>選擇功能表「標記」>設定「文字符號」
              您可依照需求自行設定「字型」「文字顏色」「背景顏色」
              【建議 勾選 □ 背景透明 及 「背景顏色」為 白色】>確定> 完成
              【 建議 存檔 至  個人資料夾 】<其他有關SuperGIS功能表選單的
              「常用工具列」解說,建議請參照功能表選單「說明」。

(3)時間<date>

  • 年初,年末期間的取法原則:1/4
查詢時間id碼網址:"時間權威資料庫" http://authority.ddbc.edu.tw/time/
(e-lib→佛學研究平台→中西時間對照權威檢索→輸入檢索資料後,按submit→取Project-_No碼作為xml:id碼)
  • 時間點的標法說明:

(a)有年月日的標法,用 when

  <date when="西元年-月-日" xml:id="d(起始id碼)(終尾id碼)">內文時間</date>
    例:<date when="1610-西元月-西元日" xml:id="d58208525820852">萬曆庚戌年
     五月十六日</date>

(b)有年或月的標法

  1年(1月)的標法:<date corresp="d57020065702359" notBefore="1285-02-06" 
           notAfter="1286-01-25">至元廿二年</date>。   

(c)第二次以上出現時間的同名或異名時的標法:

  例: <date when="1610" corresp=" d58206905821073">同年</date>
  PS:將xml:id改為corresp
  • 為『不明確』(某區段內)時間的標法說明:

(a)事件發生於區段內的某一時段,用 notBefore notAfter 年代為四碼

  例:清光緒年間,錢塘丁丙刻「武林掌故叢編」時,...。
     <date notBefore="1875" notAfter="1909" xml:id="d59174915929893">清光緒年間</date>

(b)事件進行為持續整個區段時間(且時間點明確),用 from to

  例:明逕壁立禪師,生崇禎壬午年五月念七日寅時。雍正甲辰四月十二日說偈訣眾,
     而化塔本寺頭亭。壽<date from="1642-06-23" to="1724-05-04"xml:id=
     "d58325275862427">八十三</date>。
    
  • 時間為民國的標法說明:
* 查詢ID: 用檔案 GISapD\資料表\ADDate&SB西元與日干支
  例: 民國十三年甲子九月 (出自 : 泉州開元寺志  第十一頁  第二行 )
  步驟一 : 至 http://destiny.xfiles.to/tools/calendarVS.html 查詢西元日期;
          結果為 西元 1924年9月29日至 1924 年10月27日
  步驟二 : 開啟GISapD\資料表\Addate&SB西元與日干支;
          找 ADDate中 +1924-09-29 的日期 ; 
          得到 DateID 為5935623查詢 +1924-10-27 則得到DateID碼為5935651
  步驟三 : 得到ID碼後則可標記為<date when="1924" xml:id="d59356235935651">
          第二次出現及以後 , 則標為<date when="1924" corresp="d59356235935651">
  • Datecode查詢為id碼(d59356235935651)返回查詢系統

建置【來源出處】注意事項

 ● 出處在 CBETA 者。請建置在「新增來源資料」 CBeta Links欄位中
例如:X65no1295_p716a23
 ● 出處在 文本 者。請建置在「新增來源資料」  Source  Links欄位中
例如:g017p0036
 ● 「註解」中來源出處請使用全形標點符號,如下所示:
,。、;:!?.「」『』()《》〈〉…… 標點符號用法,可參   http://www.edu.tw/files/site_content/M0001/hau/c2.htm注意事項:  
1.生卒年中「-」連接號使用半形標點符號。例如:通容(1593-1661)。
2.每一個別名之間以「;」分號(半形或全形皆可)隔開。
 ● 「註解」內容之來源出處請使用全形標點符號,並參照以下範例:
一.同一來源出處請使用「全形頓號」標點符號隔開
例1:佛光:480、405
例2:(http://baike.baidu.com/view/322497.html(烏墩)、http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw(烏鎮),日期:2008.12.23)
二.不同來源出處請使用「全形分號」標點符號隔開
例1:佛光:480;佛百:4053
例2:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02;佛光:480;http://baike.baidu.com/view/1225413.htm(夕照山),日期:2008.12.23)
三.日期前的標點符號請使用「全形逗號」隔開
例1:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02)
注意事項: 
1.使用網路出處來源,需注意其穩定性及權威性。建議參照使用Authority所提供網路資料Authority。
2.網址中出處來源的條目,其目的是利於日後方便搜尋。EX:(雷峰)

代名詞

 
 1.須標記且詞意不明顯時才要標
 
 2.代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
   例如:<ref corresp="A003940"></ref>
 
 3.由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
   皆不用再重複標記。

內文字體缺少或難以辨認時

* 標法參考以下網頁:

  http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html#
  範例:2個圓圈刪去,輸入<gap extent="2" unit="chars" reason="lost"/>
        extent: 被省略的文字量  unit: 資料型態

 

缺字

定義:

  ●  凡於unicode網站找不到者,或古字打不出來的,皆作缺字處理。
台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml
  ●  通用字:古今通用,例如價值的值,古字用直,今用值。參考網頁
http://big5.ce.cn/gate/big5/cathay.ce.cn/file/200704/25/t20070425_11166721.shtml 
異體字:例如寧,可寫成寶蓋頭下加血
  ●  登入取碼:
a)登入網頁http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
b)取碼目的:取得缺字檔名及建置缺字組
c)建置步驟說明:
   (1)

※2008年10月09日 DA meeting 討論兩個元素定義

  ●  <charProp/>表示字的屬性、表達方法。比如說注音、發音。
  ●  <mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、unicode碼。

※2008年11月17日 DA meeting 更新缺字的處理方法

  ●  缺字處理決議為若無 unicode 字型均採用組字式處理(ex: 羅[目*侯])

※2008年12月08日 DA meeting 更新缺字組的處理方法

  (1)charName採用CJK:<charName>CJK IDEOGRAPH 148564</charName>
  (2)使用 Unicode,不用utf-8
  (3)標記發音
  • 在內文處標記
  <g ref="#btg086001701"/>
  檔案命名原則:btg+志碼+頁碼4碼+序碼2碼(此頁第幾個缺字)
  • 在main檔標記(缺字組)
</fileDesc>下建置缺字組。
    例:</fileDesc>
    <encodingDesc>
      <charDecl>         
        <glyph xml:id="g0001">
          <glyphName>CJK IDEOGRAPH 15729</glyphName>
          <charProp>
            <localName>pronunciation</localName>
            <value>piao3</value>
          </charProp>
          <mapping type="cbeta">[漂*寸]</mapping>
          <mapping type="cbetaNo">CB00579</mapping>
          <mapping type="unicode">15729</mapping>
          <graphic url="btg086012301.gif"/>
        </glyph>
        <glyph xml:id="g0002">
          <glyphName>Non Unicode Character</glyphName>
          <charProp>
            <localName>pronunciation</localName>
            <value>wu4?</value>
          </charProp>
          <mapping type="cbeta">[寤-吾+告]</mapping>
          <mapping type="cbetaNo">CB00854</mapping>
          <graphic url="btg086045601.gif"/>
        </glyph>     
      </charDecl>
   </encodingDesc>
   備註:1:沒有資料內容的,不用標記那一項。(例如:沒有unicode碼、沒有通用字)
        2:要有圖檔,xml:id即為圖片檔名。

勘字

(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
  <reg> (一般化) 標誌一般化或規格化處理過的文字。

圖檔或圖檔內有文字標記法

<figure>
 <head>標題</head>
  <figDesc>讓此表可以檢索到的圖說,以半形標點符號間隔文字</figDesc>
   <graphic url="cwdc01p085a.jpg"/>
</figure>(己有掃瞄圖檔故圖不顯示)

在文本標完後,建立事件<linkGrp>

 ※ 暫先不建立此事件<linkGrp>,馬老師將找專家做)
   說明:辨識文本中的事件,建立其「人、時、地」的連結群組
    例:
   <linkGrp>
     <ptr type="person" target="#G0292"/>
     <ptr type="person" target="#G1273"/>
     <ptr type="place" target="#TX5132241"/>
     <ptr type="time" target="#d405666405666"/>
   </linkGrp>


標記問答

● 宗派(例如賢首宗)及普門菩薩是否標記?

A:不標

● 寺院內建築(例如華嚴經閣)是否標記?

A:要標。

● 高麗國王,「國王」是否標記?

A:稱謂,不用標。

● 代名詞要不要標?

A:原則第一次出現要標,明者不標,不明者要標。

● 內文中提到的相關「著作」是否標記?

A:不標。

● 唐之垂拱(垂拱是年號)的標法?

A:<date from="垂拱的第一天" to="垂拱的最後一天" xml:id="id碼">唐之垂拱</date>

● 格式問題:是否照書編排?

A:可依文本實際內容調整標記。

● 並列文字的標法?

A:例:副寺<list rend="inline"> <item>惠秀</item>  <item>舜普</item> 
      <item>永施 </item></list>校刊 (註:rend表示"如何呈現")

● 標題(head)+作者(persname)於同一行的標法?

A:<head>標題</head>  <byline><persname>作者</persname></byline>
   (註:<byline> 包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)

● 標題後有副標題的標法?

     
例:<head>大安禪師<seg type="toc" rend="smallType">上堂一則 機緣二則</seg> 
       </head>(註:<seg> (隨機分割) 包含文件中任何隨機字詞層次的單元。
       toc=table and content)<br/>

● 於黃檗丈室堂第三代隱元隆琦國師入院法語五則上堂九則機緣三則,文中可否自添標題?

   
A:否。可於段落中加屬性<div type="入院法語一">區分

● 人名權威建檔,同一人名有多筆出處時,製作資料來源是否一一出處皆登錄?

A:只須登記第一筆

● 王居士、母龔氏等是否標記?

A:是,請儘量在註解欄提供相關可辨識的訊息。

● 幾個關於人名標記的用法

   <addName> (附加名稱) 附加的名稱,例如綽號、稱號、或別名,或是在人名中出現的其他
             描述性措辭。    
   <roleName> 包含一個身份名稱,代表個人在社會上所扮演的特殊角色或所處地位,例如:
             官方頭銜或地位。
   <surname> 包含一個家族姓氏,並非名字、教名、或綽號。
   <forename> 包含名字或教名。
   <genName> 該名稱用來和其他相似名稱做區別,以個人的相對年紀或隸屬世代作依據。
   <geogName> (地理名稱) 與地形名稱結合的地名,例如威拉索溪谷、西奈山等。
範例1.:
  <persName xml:id="A001873"><addName>佛慈廣鑑慧光普照</addName>
     隱元隆琦<roleName>國師</roleName></persName>
範例2.:
  <persName xml:id="A001150"><roleName type=""school>臨濟</roleNname><addName>開法</addName>費隱通容<roleName>禪師</roleName></persName>
範例3.悟公的"公"標法?
  <persName corresp="A003688">悟<roleName type="honorific">公</roleName> </persName>

● 引語是否需標<cit><quote>?

A:否

● <lg><l>的注意事項

<lg><l><p>是對等地位,故不可包在<p>中。應結束</p>後,再標<lg>

● 行後有小字的標法? 例:寶慶三年正月日牒尚書省印#行書

A:寶慶三年正月日<note rend="smallType" type="toc">牒尚書省印行書</note>

● pb放置的位置?

A:放<div>與<head>中間。例:<div><pb n="0095"/><head>

● 文字出現於兩行的行中時,是否照文本排版標記?

A:不用照原文排版 
    

● 文本中人名資料中的<字號或別名>無法確實查證時,該如何標記?

  例:<persName xml:id="A003937">姚二煜葆明</persName>甫
A:無論是別名或字均以<addName></addName>包起來即可.
  例:<persName xml:id="A003937">姚二煜<addName>葆明</addName> </persName>甫

● 遇人名不確定是否為某人時,可加屬性值標示。

例1:<persName type="unknown">某某某</persName>此為完全不明或查找不到確認
   此人身份資料時用
例2:<persName xml:id="A001606" cert="70%">cert 是表示標者自認為的正確度,
   是相對的,非絕對的。

● 作者標記<byline type="Author">無法驗證通過?

A:可試試另兩種標法
(1)<byline><docAuthor>作者名</docAuthor></byline>
(2)<persName type="Author">作者名</persName>

● 圖檔標記:url 圖檔檔名?

  <figure><figDesc>圖說</figDesc><graphic url="掃瞄檔檔名.jpg"/></figure>
例:<graphic url="3B004P001.jpg"/>(註:P為大寫,頁碼為三碼)

● 空白頁的處理

A:只需標上頁碼
例:<pb n="0248"/>

● 人名、地名等跨頁時的標記

A:將 pb移到name 之後(以程式處理)

● 人名標記:稱謂(如:公,和尚,禪師---等)是否包進人名,再確認?

A:稱謂須包進人名,並標以<roleName>等元素。

● 某仙人,是否標人名、是否給id碼?

A:否

驗證

1. main的檔頭有用all.nrc刪除

2.需要的schema路徑

 J:\CND\Projects\2008BTG\work\markup\標記進行中\schema\.rnc

3.設定Schema路徑 按configure validation scenario \Add

4.於main檔按紅勾勾驗證(沒有點點的)

待解決內部問題討論

最新公告

"請註明紀錄者姓名及日期"

 
●代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
   例如:<ref corresp="A003940"></ref>
 
●由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
   皆不用再重複標記。
 
●註解內容要呈現,內容主要放:生卒年、出生地、別名。若這些資料缺少,則可放與時間參照點有關
   的資料,例如此人曾於某年某地做某事。
  
●html檔介面定案:人名/地名/時間 分三種顏色。
   例如:   
       地名 與 地名代名詞<ref>--------綠色
       時間 與 時間代名詞<ref>--------藍色
       別名 與 人名代名詞<ref>--------紅色
       人名------------------------加底線 (紅色)
 
●缺字處理決議為若無 unicode 字型均採用組字式處理(ex: 羅[目*侯])(Erica;2008/11/17)
 
●文本若出現非標記可處理的範圍,可不標句讀。但是須於<teiHeader>作一個說明程式。(Erica;2008/11/17)
   例如:元朝蒙文文言文,可不標句讀。
    
●通用字與古字TEI標記舉例如下:(Erica;2008/11/17)
           通用字--值 
           古字-----直
   TEI標記:                   
           <choice>
                  <orig></orig>
                  <reg></reg>   (reg = 標準化/一般化)
           </choice>
●Authority人名/地名/時間權威網址變更並已更正完成(Erica;2008/11/27)
●地名權威資料的建置,寺裡建築物若已無存或無從考證,則可只標<placeName>,而不標id碼及經緯度。(智妙2008.12.01)
●更新地名權威資料的建置決議如下:
(1)寺院內建築須給ID及經緯度以提供地名權威資料庫建檔。ex:<placeName xml:id="CN××××××T××AB">寺院內建築</placeName>(ID=CN××××××T××AB)
(2)失落或無可考的建築物及地名不提供經緯度,但文本須標記<placeName>地名</placeName>並於地名權威資料庫建置地名以供檢索。(Erica;2008/12/08)
建築物 XML 地名權威檔 經緯度
存在 給I D 標<placeName xml:id="×××"> 須建檔 提供最大範圍 例如:省、區、寺院
不存在 給I D 標<placeName xml:id="×××"> 須建檔 提供最大範圍 例如:省、區、寺院
無可考 不給I D 文本標<placeName >以顏色區分 須建檔 不給
●缺字組<charName>內容決議:
(1)主檔標記:<charName>CJK IDEOGRAPH 148564</charName>
(2)使用 Unicode
(3)XML 檔案的內文標記為<g ref="×××"/>並參照《別譯雜阿含經》 (BZA)的數位版本\「缺字發音表」\中將異體字轉成 HTML 的組字型態並呈現「缺字圖檔」。(Erica;2008/12/08)
●訛字標記修正,原<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>(智妙2008.12.11)
修訂為:
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
  <reg> (一般化) 標誌一般化或規格化處理過的文字。
●缺字組的內容 2008.12.29 妙妙
<encodingDesc>
      <charDecl>         
        <glyph xml:id="g0001">
          <glyphName>CJK IDEOGRAPH 15729</glyphName>
          <charProp>
            <localName>pronunciation</localName>
            <value>piao3</value>
          </charProp>
          <mapping type="cbeta">[漂*寸]</mapping>
          <mapping type="cbetaNo">CB00579</mapping>
          <mapping type="unicode">15729</mapping>
          <graphic url="btg086012301.gif"/>
        </glyph>
        <glyph xml:id="g0002">
          <glyphName>Non Unicode Character</glyphName>
          <charProp>
            <localName>pronunciation</localName>
            <value>wu4?</value>
          </charProp>
          <mapping type="cbeta">[寤-吾+告]</mapping>
          <mapping type="cbetaNo">CB00854</mapping>
          <graphic url="btg086045601.gif"/>
        </glyph>     
      </charDecl>
   </encodingDesc>
●新增檢索網址 http://isearch.ddbc.edu.tw/ 2009.01.13 erica