名山古剎-《中國佛寺史志》數位典藏
名山古剎-《中國佛寺史志》數位典藏
Archive of Buddhist Temple Gazetteers
工作手冊 (請勿更動編排版面)
簡介及目的
《中國佛寺志》由杜潔祥主編,從民國69年至74年彙編完成,全套共3輯110冊。此套書所收之佛寺志或為手抄本或為各國圖書館唯一藏本,是以某地、某山、某寺為範圍的佛教史籍,是研究佛教史的重要史料。
透過便利的使用介面一一呈現圖檔、後設資料、數位全文等資源。 且將與「漢傳佛教高僧傳之時空資訊系統研究之專案計畫」(GIS)專案和CBETA光碟結合。
預算
此專案預計執行年度為97~99,共計3年,由中華佛學研究所贊助。 第一年經費57萬。
執行單位:數位典藏組
進度及預算控管:柯春玉 程式及介面撰寫:花金地 標記:林智妙、游美燕、彭川芩、何易儒 權威資料庫:闕慧貞 網頁美工設計:李承崇 經驗指導:張伯雍
執行方式
目錄建立
中國佛寺史志彙刊1-3輯共110冊 Bibliography 目錄建立(妙妙)
●xml檔頭宣告
符合tei 標準,兩個驗證程式Schema(rng、rnc),輸出程式stylesheet
●登錄項目
<bibl>
<title>
<biblScope>
<spanGrp>
<respStmt><name><date>
<edition><date when="">or<date notBefore="" notAfter="">
●加入kml於目錄中 於</bibl>結束前加 <note type="place">河南洛陽</note> <note type="longlat">34.7203(緯度),112.6193(經度)</note> </bibl>
共八個志 Keying 外包打字加粗標 (春玉)
●外包打字加粗標 * 明州阿育王山志一 N29.859 E121.745 * 明州阿育王山志二,續志 * 重修普陀山志 N29.9835 E122.3795 * 玉岑山慧因高麗華嚴教寺志 N30.2304 E120.1259 * 泉州開元寺志N24.9232 E118.5837, * 廈門南普陀寺志N24.4424 E118.0929 * 雞足山志 N25.9704 E100.3745 * 雞足山志 * 黃檗山寺志N25.5845 E119.2715
轉粗標為正確的標記
pb+p
掃瞄檔列印(筆一校用)(小芩)
●開啟檔案,選取 Windows Picture and Fax Viewer(山水圖案)
●點擊列印
|相片精靈(請耐心等待 約20秒~60秒後出現)
|圖片選項
|選取張數(佛寺志專案掃瞄列印通常為整本所以是全選)
|列印選項
|列印喜好設定
|原稿型態:雙面書本
|選取版面設定:二合一
|順序:由右至左
|選取版面設定
|全頁傳真列印完成
共110冊 Scanning 掃瞄 (伯雍,Simon)
* 選擇掃瞄檔案儲存為Tiff * 解析度為400dpi * 8 bits 灰階。( 不是黑白 ) * Tiff 轉 jpg
共110冊 Metadata 建立 (家名,秀雯,Simon)
- 建立掃瞄 Tiff 數位圖檔的 Metadata
- 一本佛寺志各頁的掃瞄圖檔放在同一資料夾
- 一本佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
- Metadata檔案內依序記錄每張掃瞄圖檔之資訊
- 每張圖檔資訊記於一組<img></img>內
<img>內容範例: <img>1B005P011(數位圖檔的檔名) |內文( type 分4種 : 書名頁 ; 版本說明 ; 目錄 ; 內文 ) |金陵梵剎志-金陵梵剎志卷二十二-放生池記 |( title : 以 「-「 dash 表達漸層關係,同一頁若有2個標題以上則以「/」slash 隔開 |舉例:金陵梵剎志-金陵梵剎志卷二十二-千佛寺/金陵梵剎志-金陵梵剎志卷二十二-大中正覺菴) |978 (圖檔之原書頁數) |放生池(圖檔內容的前三個字)</img>
- 缺字至cbeta查找組合字[], 若沒有則回報 cbeta小組,異體字至教育部異體字字典的網站查詢,遇到空白頁,則標題延續上一頁的標題,「前三個字」則空白處理.
- 將完成的檔案以 txt 存於 ftp: 10.10.1.11/Buddhist temple's Gazetteers Tiff與佛寺志的數位圖檔放在一起,每一個資料夾對應一個Metadata的檔案 ( 資料夾 1Book001 表佛寺志第一輯的第一本,對應1Book001.txt )
metadata 檔案匯入MIX標記架構內(小花)
MIX架構含:head, mix, map
Metadata 問題與解答
1.目前的 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可, type多增加一個圖&空頁 2. 若內文的漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense) 3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?]表示
八志的文本標記(April, 妙妙,美燕,小芩,易儒,)
資料路徑與操作技巧
●工具
* 漢語拼音: http://www.iq-t.com/SYSCOM/pingying2.asp * 教育部異體字字典: http://dict.variants.moe.edu.tw/suo.htm * 標點符號用法:http://dict.variants.moe.edu.tw/main.htm * 國語辭典:http://dict.revised.moe.edu.tw/index.html * 漢典:http://www.zdic.net/cd/ * TEI: http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html * 二十五史http://www.sinica.edu.tw/ftms-bin/new/ftmsw3?tdb=%A4G%A4Q%A4%AD%A5v * 呼嚕嚕 hoolulu:http://www.hoolulu.com/core_zh/ * MapABC地圖搜索:http://www.mapabc.com/localsearch.shtml * Google地圖:http://ditu.google.com/ * 搜狗Sogou地圖:http://map.sogou.com/new/#c=13222250,3747750,11 * 維基百科:http://zh.wikipedia.org/w/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh-hant * 法鼓維基首頁:http://wiki.ddbc.edu.tw/pages/%E9%A6%96%E9%A0%81 * 批次改檔名工具:UltraRename28b.exe * 批次改檔名路徑J:\CND\Projects\2008BTG佛寺志\work\工具\UltraRename28b.exe * 同文堂(網頁簡繁體轉換):http://of.openfoundry.org/projects/333/download * 復旦版歷史地名資料庫有歷史地名釋文 http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp * cbeta網站 http://www.cbeta.org/download/cbreader.htm * 台北版佛典集成 缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php * unicode 網址: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35 * 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw * 吳疆教授(亞利桑那大學東亞研究所,對中國佛寺志有鑽研) 網址: http://bgis.coh.arizona.edu/ 聯絡信箱: jiangwu@email.arizona.edu
● 資料路徑
● 首頁 http://10.10.0.49/fosizhi/index.html ● 總目錄標記問與答,存放路徑 J:\CND\Projects\2008BTG佛寺志\work\標記\目錄\目錄標記問與答.odt ● 佛寺志作業時程 http://spreadsheets.google.com/ccc?key=py-MCl83eYhHl-WYd8FBcFA&hl=zh_TW ● 掃瞄檔 http://10.10.1.11/Temple_Gazetteers_Tiff/ 密碼:tg_project ● 佛寺志專案工作檔: J:\CND\Projects\2008BTG佛寺志\work\ ● 工作時數登記表 J:\CND\Projects\2008BTG佛寺志\行政\人事\工讀金\ ● 中國佛寺史志內部網址 http://10.10.0.49/fosizhi/ui.html ● 中國佛寺史志外部網址 http://140.131.254.11/fosizhi/ui.html ● 人名、地名、時間權威檔login: http://authority.ddbc.edu.tw/login.html ● 人名權威檢索查詢:http://authority.ddbc.edu.tw/person/ ● 地名權威檢索查詢: http://authority.ddbc.edu.tw/place/ ● 時間權威檢索查詢: http://authority.ddbc.edu.tw/time/index1.html ● 權威檔修改-Google文件:http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com ● GIS專案 http://buddhistinformatics.ddbc.edu.tw/gaosenggis ● DDBC Select databases http://isearch.ddbc.edu.tw/
● 操作技巧
幾個快捷技巧: Alt+ Tab 切換文件 Ctrl+ R html重新整理
在Oxygen下: Ctrl+ E 下標記 Ctrl+Shift+ V valid Ctrl+Shift+ W well form Ctrl+Shift+ < 加註;取消註
在Oxygen xpath下:(Perspective → Show Toolbar → XPath) //pb → 找所有<pb>(同理可推:找placeName---) //pb[@='0100'] → 找第100頁 //persName[.='名字'] → 找出某人名
● 觀念:
凡用電腦可一併處理的,就不一一標記
二、檔案架構說明
* J:\CND\Projects\2008BTG佛寺志\work\標記\標記範本\併檔範本\併檔架構說明
三、用轉好的檔案作業
* J:\CND\Projects\2008BTG佛寺志\work\database\原始檔\BTG加p加pb\output\
四、xml轉html步驟
安裝oxygen 9.1
由gxxx_main.xml主檔 呼叫html.xsl
1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形) 進入轉檔介面,選New(第一次建立html檔後, 若所設定的路徑都沒變動的話,以後直接點Transformation now即可; 若有要更改路徑的話,點Edit進入介面去修改即可) 2.進入Edit scenario 介面 a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl) b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK 3.此時進入到下一個介面,點Transform now,即可產生html檔案 4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾
安裝 exist.jnlp 上傳檔案
1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
(1)main主檔要經valid驗證 --沒有點點的紅勾勾
(2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
找到來源檔案(單卷)→Select files or directories store →Close
佛寺志網頁
● 編輯網址: http://dev.ddbc.edu.tw/fosizhi/index.html
● HTML檔介面定案:人名/地名/時間 分三種顏色。
例如: 地名 與 地名代名詞<ref>--------綠色
時間 與 時間代名詞<ref>--------藍色
別名 與 人名代名詞<ref>--------紅色
人名(常名)--------------------加底線 (紅色)
介面程式撰寫 (小花)
建立參考書目(妙妙,美燕,秀雯)
存放路徑 J:\CND\Projects\2008BTG\work\reference\參考書目 gazetteerBibl
標記內容(+電1校)
標記重點:人名、地名、時間
建置說明請參照凡例: 專案整合權威資料庫工作手冊
(1)人名<persName>
* 查詢人名id碼網址:"人名權威資料庫" http://authority.ddbc.edu.tw/person/ * 新增人名id碼:"人名權威資料庫維護" http://authority.ddbc.edu.tw/login.html (e-lib→佛學研究平台→佛學古典文獻人名權威檢索→輸入人名後,按submit→取權威碼作為xml:id碼)
- 第一次出現人名時的標法
例:<persName xml:id="A000883">攝摩騰</persName>
- 以後出現此人的同名及異名時的標法:
例:<persName corresp="A000883">騰</persName>
說明:corresp 是correspondence的縮寫,意為相當或等於
- 介面說明:
新增資料建檔方式
人 名:新增人名;別名(用半形分號分隔,越詳盡越好,但不用帶上稱謂如"禪師"等)
類 別:(GIS專用)
註 解:可辦認此人是誰的資訊(最好能標出生卒年。標點符號用全形)
生卒年:(不用填)
朝 代:(必填)
※註解欄中填寫須注意事項:
a)必備四樣資訊:朝代、出生地、生卒年、著作。
●若缺少這些資料,則可放與時間參照點有關的人、事、物的資料,例如此人曾於某年某地做某事。
●佛寺志文本若已具備這些條件,就不必找其他工具書。
b)生卒年(西元-西元)中間用半形連接號分隔。
c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
d)尋找網路資料時,優先採用順序以authority所列的參考書目,為主要引用網路資料。
e)也可引用文本作為出處來源資料參考。
●示範註解欄說明:
(一)福州福清何氏子,年十四依鎮東慧山祝髮,著有舍利記、語錄二十捲、五燈嚴統二十五
卷。為密雲圓悟法嗣。(g086p0119)
(二)(1593-1661)明末清初臨濟宗僧。福建省福州府福清縣人,俗姓何,號費隱。生於明神
宗萬曆21年,卒於清順治18年。(佛光:4802;佛百:4053)
●示範文本標記說明:
例:衍勤禪師,幼從莆田西來寺純證禪德脫白,嗣仲祺和尚法。
標法:1. 幼從<placeName xml:id="CN">莆田西來寺</placeName>
<persName xml:id="A004122">純證<roleName>禪德</roleName>
</persName>脫白,嗣<persName corresp="A004085">仲祺<roleName>
和尚</roleName></persName>法。
標法 2. 幼從<name><placeName xml:id="CN">莆田西來寺</placeName>
<persName xml:id="A004122">純證<roleName>禪德</roleName>
</persName></name>脫白,嗣<persName corresp="A004085">仲祺<roleName>
和尚</roleName></persName>法。
標法 3. 幼從<persName xml:id="A004122"><placeName xml:id="CN">莆田西來寺
</placeName>純證<roleName>禪德</roleName></persName>脫白,嗣
<persName corresp="A004085">仲祺<roleName>和尚</roleName></persName>
法。
(2)地名<placeName>
* 查詢地名id碼網址:"地名權威資料庫" http://authority.ddbc.edu.tw/place/ * 新增地名id碼:"地名權威資料庫維護"http://authority.ddbc.edu.tw/login.html (e-lib→佛學研究平台→佛學地理名詞權威檢索→輸入地名後,按submit→取Project_No碼 作為xml:id碼) * 確認查找古今地理位置: 安裝 Super GIS 軟體 (利用Super GIS所提供的地理圖層可幫助確認古今地名正確位置) * 世界地圖: J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf * ccts使用教學影片:J:\CND\Projects\2008AuthorityDB\SuperGIS2.2\CCTS\CCTS \ccts.swf (感謝GIS伯雍提供)
- 第一次出現地名時的標法
例:<placeName xml:id="Z13005440">雒邑</placeName>
- 以後出現同地名或別名時的標法
例:<placeName corresp="Z13005440">雒陽</placeName> 說明別名(異名):同地卻因朝(年)代不同而出現別名時,須於Super GIS用『同地名id碼』另建置 新增地方別名
- 新安裝 中研院 SuperGIS 地理軟體
目的 : 利用SuperGIS 提供的圖層,可幫助核對及查證古今地名位置。 路徑 : 中研院『歷代地名圖層』J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
● 開啟 SuperGIS 的程式 :
a):進入SuperGIS 介面
b):開啟「功能表選單」>「工具」>「自訂」> 勾選 □「CCTS V2.0」選項 > 放置
「功能表列」中
● 功能表選單:功能表選單包含「檔案」、「編輯」、「檢視」、「工具」、「選取」、
「視窗」 、「說明」等項目,幾乎全部的功能皆可於功能表選單中找到。
● 匯入 中研院 提供的 『歷代地名圖層』
* J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
步驟一: 點選 功能表列中的「CCTS V2.0」選項 >開啟 第一個選項「add CCTS Layer」
步驟二: 點選「CCTS」> 「歷代行政界線圖層(面資料)」或「歷代地名圖層(點資料)」
步驟三: 點選「歷代行政界線圖層(面資料)」>點選(可複選「秦(BC0210)」西元前
210 年(確認 紅 色勾ˇ)>勾選 □ 下方「Save SuperGeo file」選項 )
>OK > 界面即出現地圖,請繼續步驟一.
PS:若選擇「現代各式圖層資料」>建議 點選「1990省/縣級行政區(面資料)」並耐心等候開啟
● 設定 圖層集(位於SuperGIS 介面的右方窗格)
步驟一:點選右方「圖層集」> 按滑鼠右鍵選項 > 「內容」>「一般」>設定
「地圖單位」選 項 > 選擇 「度」>「顯示單位」選項 > 選擇 「公里」
>「套用」。
步驟二:繼續設定「圖層集內容」>「座標系統」>選擇 右方「建立」選項 >
「大地基準-名稱」> 選擇 「D_WGS_1984」此編號為中研院版權不對外
>勾選下方 □「投影(Projection) -名稱」>
選擇「Lambert_Confoml_Conic」> 點選「參數」>設定變更數值為
「Central_Meri..110」「Latitude_Of..10」「Standard_Par..25」
「Standard_Par..47」>確定>回到「圖層集內容」>「套用」>確定。
步驟三:繼續設定右方「圖層集」>點選「秦(BC0210)
(確認 □ 藍色勾ˇ- 若顯示×表示該圖層路徑遺失)」>按滑鼠右鍵選項>
點選「縮放至作用圖層」。
步驟四:繼續設定 >點選「秦(BC0210)」>按滑鼠右鍵選項 >點選「內容」>
即進入「圖層內容」>功能表「來源」>設定「文字符號」您可依照需求
自行設定「字型」「文字顏色」「背景顏色」【 建議 勾選 □ 背景透明
及「背景顏色」為 白色 】。
步驟五:繼續設定 >選擇「座標系統」>重複 第二步驟的設定
(請參考2.1.3步驟二「座標系統」)。
步驟六:繼續設定 >「圖層內容」>選擇功能表「符號」>點選「符號 □ 色框」>
進入「符號選取」>設定地圖背顏色您可依照需求自行設定「前景」顏色 >
點選「邊線」設定地圖線條顏色 及 寬度 > 確定。
步驟七:繼續設定 >「圖層內容」>選擇功能表「標記」>設定「文字符號」
您可依照需求自行設定「字型」「文字顏色」「背景顏色」
【建議 勾選 □ 背景透明 及 「背景顏色」為 白色】>確定> 完成
【 建議 存檔 至 個人資料夾 】<其他有關SuperGIS功能表選單的
「常用工具列」解說,建議請參照功能表選單「說明」。
(3)時間<date>
- 年初,年末期間的取法原則:1/4
*查詢時間id碼網址:"時間權威資料庫" http://authority.ddbc.edu.tw/time/ (e-lib→佛學研究平台→中西時間對照權威檢索→輸入檢索資料後,按submit→取Project-_No碼作為xml:id碼)
- 時間點的標法說明:
(a)有年月日的標法,用 when :
<date when="西元年-月-日" xml:id="d(起始id碼)(終尾id碼)">內文時間</date>
例:<date when="1610-西元月-西元日" xml:id="d58208525820852">萬曆庚戌年
五月十六日</date>
(b)有年或月的標法
1年(1月)的標法:<date corresp="d57020065702359" notBefore="1285-02-06"
notAfter="1286-01-25">至元廿二年</date>。
(c)第二次以上出現時間的同名或異名時的標法:
例: <date when="1610" corresp=" d58206905821073">同年</date> PS:將xml:id改為corresp
- 為『不明確』(某區段內)時間的標法說明:
(a)事件發生於區段內的某一時段,用 notBefore notAfter 年代為四碼
例:清光緒年間,錢塘丁丙刻「武林掌故叢編」時,...。
<date notBefore="1875" notAfter="1909" xml:id="d59174915929893">清光緒年間</date>
(b)事件進行為持續整個區段時間(且時間點明確),用 from to
例:明逕壁立禪師,生崇禎壬午年五月念七日寅時。雍正甲辰四月十二日說偈訣眾,
而化塔本寺頭亭。壽<date from="1642-06-23" to="1724-05-04"xml:id=
"d58325275862427">八十三</date>。
- 時間為民國的標法說明:
* 查詢ID: 用檔案 GISapD\資料表\ADDate&SB西元與日干支 例: 民國十三年甲子九月 (出自 : 泉州開元寺志 第十一頁 第二行 ) 步驟一 : 至 http://destiny.xfiles.to/tools/calendarVS.html 查詢西元日期; 結果為 西元 1924年9月29日至 1924 年10月27日 步驟二 : 開啟GISapD\資料表\Addate&SB西元與日干支; 找 ADDate中 +1924-09-29 的日期 ; 得到 DateID 為5935623查詢 +1924-10-27 則得到DateID碼為5935651 步驟三 : 得到ID碼後則可標記為<date when="1924" xml:id="d59356235935651"> 第二次出現及以後 , 則標為<date when="1924" corresp="d59356235935651">
- Datecode查詢為id碼(d59356235935651)返回查詢系統
建置【來源出處】注意事項
● 出處在 CBETA 者。請建置在「新增來源資料」 CBeta Links欄位中 例如:X65no1295_p716a23
● 出處在 文本 者。請建置在「新增來源資料」 Source Links欄位中 例如:g017p0036
● 「註解」中來源出處請使用全形標點符號,如下所示: ,。、;:!?.「」『』()《》〈〉…… 標點符號用法,可參 http://www.edu.tw/files/site_content/M0001/hau/c2.htm 。 注意事項: 1.生卒年中「-」連接號使用半形標點符號。例如:通容(1593-1661)。 2.每一個別名之間以「;」分號(半形或全形皆可)隔開。
● 「註解」內容之來源出處請使用全形標點符號,並參照以下範例: 一.同一來源出處請使用「全形、頓號」標點符號隔開 例1:佛光:480、405 例2:(http://baike.baidu.com/view/322497.html(烏墩)、http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw(烏鎮),日期:2008.12.23) 二.不同來源出處請使用「全形;分號」標點符號隔開 例1:佛光:480;佛百:4053 例2:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02;佛光:480;http://baike.baidu.com/view/1225413.htm(夕照山),日期:2008.12.23) 三.日期前的標點符號請使用「全形,逗號」隔開 例1:(http://baike.baidu.com/view/22260.htm(雷峰),日期:2008.12.02) 注意事項: 1.使用網路出處來源,需注意其穩定性及權威性。建議參照使用Authority所提供網路資料Authority。 2.網址中出處來源的條目,其目的是利於日後方便搜尋。EX:(雷峰)
代名詞
1.須標記且詞意不明顯時才要標
2.代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
例如:<ref corresp="A003940">余</ref>
3.由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
皆不用再重複標記。
內文字體缺少或難以辨認時
* 標法參考以下網頁:
http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html# 範例:2個圓圈刪去,輸入<gap extent="2" unit="chars" reason="lost"/> extent: 被省略的文字量 unit: 資料型態
缺字
定義:
● 凡於unicode網站找不到者,或古字打不出來的,皆作缺字處理。 台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php 別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml
● 通用字:古今通用,例如價值的值,古字用直,今用值。參考網頁 http://big5.ce.cn/gate/big5/cathay.ce.cn/file/200704/25/t20070425_11166721.shtml 異體字:例如寧,可寫成寶蓋頭下加血
● 登入取碼:【98.01.14 尚待完成Erica】 a)登入網頁http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020 b)取碼目的:取得缺字檔名及建置缺字組 c)建置步驟說明: (1)
※2008年10月09日 DA meeting 討論兩個元素定義
● <charProp/>表示字的屬性、表達方法。比如說注音、發音。 ● <mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、unicode碼。
※2008年11月17日 DA meeting 更新缺字的處理方法
● 缺字處理決議為若無 unicode 字型均採用組字式處理(ex: 羅[目*侯])
※2008年12月08日 DA meeting 更新缺字組的處理方法
(1)charName採用CJK:<charName>CJK IDEOGRAPH 148564</charName> (2)使用 Unicode,不用utf-8 (3)標記發音
- 在內文處標記
<g ref="#btg086001701"/>
檔案命名原則:btg+志碼+頁碼4碼+序碼2碼(此頁第幾個缺字)
- 在main檔標記(缺字組)
在</fileDesc>下建置缺字組。
例:</fileDesc>
<encodingDesc>
<charDecl>
<glyph xml:id="g0001">
<glyphName>CJK IDEOGRAPH 15729</glyphName>
<charProp>
<localName>pronunciation</localName>
<value>piao3</value>
</charProp>
<mapping type="cbeta">[漂*寸]</mapping>
<mapping type="cbetaNo">CB00579</mapping>
<mapping type="unicode">15729</mapping>
<graphic url="btg086012301.gif"/>
</glyph>
<glyph xml:id="g0002">
<glyphName>Non Unicode Character</glyphName>
<charProp>
<localName>pronunciation</localName>
<value>wu4?</value>
</charProp>
<mapping type="cbeta">[寤-吾+告]</mapping>
<mapping type="cbetaNo">CB00854</mapping>
<graphic url="btg086045601.gif"/>
</glyph>
</charDecl>
</encodingDesc>
備註:1:沒有資料內容的,不用標記那一項。(例如:沒有unicode碼、沒有通用字)
2:要有圖檔,xml:id即為圖片檔名。
勘字
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
<sic> 包含看似錯誤但仍照實轉錄的文本。
<corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
<orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
<reg> (一般化) 標誌一般化或規格化處理過的文字。
圖檔或圖檔內有文字標記法
<figure> <head>標題</head> <figDesc>讓此表可以檢索到的圖說,以半形標點符號間隔文字</figDesc> <graphic url="cwdc01p085a.jpg"/> </figure>(己有掃瞄圖檔故圖不顯示)
在文本標完後,建立事件<linkGrp>
※ 暫先不建立此事件<linkGrp>,馬老師將找專家做)
說明:辨識文本中的事件,建立其「人、時、地」的連結群組
例:
<linkGrp>
<ptr type="person" target="#G0292"/>
<ptr type="person" target="#G1273"/>
<ptr type="place" target="#TX5132241"/>
<ptr type="time" target="#d405666405666"/>
</linkGrp>
標記問答
● 宗派(例如賢首宗)及普門菩薩是否標記?
A:不標
● 寺院內建築(例如華嚴經閣)是否標記?
A:要標。
● 高麗國王,「國王」是否標記?
A:稱謂,不用標。
● 代名詞要不要標?
A:原則第一次出現要標,明者不標,不明者要標。
● 內文中提到的相關「著作」是否標記?
A:不標。
● 唐之垂拱(垂拱是年號)的標法?
A:<date from="垂拱的第一天" to="垂拱的最後一天" xml:id="id碼">唐之垂拱</date>
● 格式問題:是否照書編排?
A:可依文本實際內容調整標記。
● 並列文字的標法?
A:例:副寺<list rend="inline"> <item>惠秀</item> <item>舜普</item>
<item>永施 </item></list>校刊 (註:rend表示"如何呈現")
● 標題(head)+作者(persname)於同一行的標法?
A:<head>標題</head> <byline><persname>作者</persname></byline> (註:<byline> 包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
● 標題後有副標題的標法?
例:<head>大安禪師<seg type="toc" rend="smallType">上堂一則 機緣二則</seg>
</head>(註:<seg> (隨機分割) 包含文件中任何隨機字詞層次的單元。
toc=table and content)<br/>
● 於黃檗丈室堂第三代隱元隆琦國師入院法語五則上堂九則機緣三則,文中可否自添標題?
A:否。可於段落中加屬性<div type="入院法語一">區分
● 人名權威建檔,同一人名有多筆出處時,製作資料來源是否一一出處皆登錄?
A:只須登記第一筆
● 王居士、母龔氏等是否標記?
A:是,請儘量在註解欄提供相關可辨識的訊息。
● 幾個關於人名標記的用法
<addName> (附加名稱) 附加的名稱,例如綽號、稱號、或別名,或是在人名中出現的其他
描述性措辭。
<roleName> 包含一個身份名稱,代表個人在社會上所扮演的特殊角色或所處地位,例如:
官方頭銜或地位。
<surname> 包含一個家族姓氏,並非名字、教名、或綽號。
<forename> 包含名字或教名。
<genName> 該名稱用來和其他相似名稱做區別,以個人的相對年紀或隸屬世代作依據。
<geogName> (地理名稱) 與地形名稱結合的地名,例如威拉索溪谷、西奈山等。
範例1.:
<persName xml:id="A001873"><addName>佛慈廣鑑慧光普照</addName>
隱元隆琦<roleName>國師</roleName></persName>
範例2.:
<persName xml:id="A001150"><roleName type=""school>臨濟</roleNname><addName>開法</addName>費隱通容<roleName>禪師</roleName></persName>
範例3.悟公的"公"標法?
<persName corresp="A003688">悟<roleName type="honorific">公</roleName> </persName>
● 引語是否需標<cit><quote>?
A:否
● <lg><l>的注意事項
<lg><l>與<p>是對等地位,故不可包在<p>中。應結束</p>後,再標<lg>。
● 行後有小字的標法? 例:寶慶三年正月日牒尚書省印#行書
A:寶慶三年正月日<note rend="smallType" type="toc">牒尚書省印行書</note>
● pb放置的位置?
A:放<div>與<head>中間。例:<div><pb n="0095"/><head>
● 文字出現於兩行的行中時,是否照文本排版標記?
A:不用照原文排版
● 文本中人名資料中的<字號或別名>無法確實查證時,該如何標記?
例:<persName xml:id="A003937">姚二煜葆明</persName>甫 A:無論是別名或字均以<addName></addName>包起來即可. 例:<persName xml:id="A003937">姚二煜<addName>葆明</addName> </persName>甫
● 遇人名不確定是否為某人時,可加屬性值標示。
例1:<persName type="unknown">某某某</persName>此為完全不明或查找不到確認 此人身份資料時用 例2:<persName xml:id="A001606" cert="70%">cert 是表示標者自認為的正確度, 是相對的,非絕對的。
● 作者標記<byline type="Author">無法驗證通過?
A:可試試另兩種標法
(1)<byline><docAuthor>作者名</docAuthor></byline>
(2)<persName type="Author">作者名</persName>
● 圖檔標記:url 圖檔檔名?
<figure><figDesc>圖說</figDesc><graphic url="掃瞄檔檔名.jpg"/></figure> 例:<graphic url="3B004P001.jpg"/>(註:P為大寫,頁碼為三碼)
● 空白頁的處理
A:只需標上頁碼 例:<pb n="0248"/>
● 人名、地名等跨頁時的標記
A:將 pb移到name 之後(以程式處理)
● 人名標記:稱謂(如:公,和尚,禪師---等)是否包進人名,再確認?
A:稱謂須包進人名,並標以<roleName>等元素。
● 某仙人,是否標人名、是否給id碼?
A:否
驗證
1. main的檔頭有用all.nrc刪除
2.需要的schema路徑
J:\CND\Projects\2008BTG\work\markup\標記進行中\schema\.rnc
3.設定Schema路徑 按configure validation scenario \Add
4.於main檔按紅勾勾驗證(沒有點點的)
待解決內部問題討論
最新公告
"請註明紀錄者姓名及日期"
●代名詞的標法:<ref corresp="Axxxxxxx">代名詞</ref>
例如:<ref corresp="A003940">余</ref>
●由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
皆不用再重複標記。
●註解內容要呈現,內容主要放:生卒年、出生地、別名。若這些資料缺少,則可放與時間參照點有關
的資料,例如此人曾於某年某地做某事。
●html檔介面定案:人名/地名/時間 分三種顏色。
例如:
地名 與 地名代名詞<ref>--------綠色
時間 與 時間代名詞<ref>--------藍色
別名 與 人名代名詞<ref>--------紅色
人名------------------------加底線 (紅色)
●缺字處理決議為若無 unicode 字型均採用組字式處理(ex: 羅[目*侯])(Erica;2008/11/17)
●文本若出現非標記可處理的範圍,可不標句讀。但是須於<teiHeader>作一個說明程式。(Erica;2008/11/17)
例如:元朝蒙文文言文,可不標句讀。
●通用字與古字TEI標記舉例如下:(Erica;2008/11/17)
通用字--值
古字-----直
TEI標記:
<choice>
<orig>直</orig>
<reg>值</reg> (reg = 標準化/一般化)
</choice>
●Authority人名/地名/時間權威網址變更並已更正完成(Erica;2008/11/27)
●地名權威資料的建置,寺裡建築物若已無存或無從考證,則可只標<placeName>,而不標id碼及經緯度。(智妙2008.12.01)
●更新地名權威資料的建置決議如下:
(1)寺院內建築須給ID及經緯度以提供地名權威資料庫建檔。ex:<placeName xml:id="CN××××××T××AB">寺院內建築</placeName>(ID=CN××××××T××AB)
(2)失落或無可考的建築物及地名不提供經緯度,但文本須標記<placeName>地名</placeName>並於地名權威資料庫建置地名以供檢索。(Erica;2008/12/08)
| 建築物 | XML | 地名權威檔 | 經緯度 |
|---|---|---|---|
| 存在 | 給I D 標<placeName xml:id="×××"> | 須建檔 | 提供最大範圍 例如:省、區、寺院 |
| 不存在 | 給I D 標<placeName xml:id="×××"> | 須建檔 | 提供最大範圍 例如:省、區、寺院 |
| 無可考 | 不給I D 文本標<placeName >以顏色區分 | 須建檔 | 不給 |
●缺字組<charName>內容決議:
(1)主檔標記:<charName>CJK IDEOGRAPH 148564</charName>
(2)使用 Unicode
(3)XML 檔案的內文標記為<g ref="×××"/>並參照《別譯雜阿含經》 (BZA)的數位版本\「缺字發音表」\中將異體字轉成 HTML 的組字型態並呈現「缺字圖檔」。(Erica;2008/12/08)
●訛字標記修正,原<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>(智妙2008.12.11)
修訂為:
(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
<sic> 包含看似錯誤但仍照實轉錄的文本。
<corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
<orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
<reg> (一般化) 標誌一般化或規格化處理過的文字。
●缺字組的內容 2008.12.29 妙妙
<encodingDesc>
<charDecl>
<glyph xml:id="g0001">
<glyphName>CJK IDEOGRAPH 15729</glyphName>
<charProp>
<localName>pronunciation</localName>
<value>piao3</value>
</charProp>
<mapping type="cbeta">[漂*寸]</mapping>
<mapping type="cbetaNo">CB00579</mapping>
<mapping type="unicode">15729</mapping>
<graphic url="btg086012301.gif"/>
</glyph>
<glyph xml:id="g0002">
<glyphName>Non Unicode Character</glyphName>
<charProp>
<localName>pronunciation</localName>
<value>wu4?</value>
</charProp>
<mapping type="cbeta">[寤-吾+告]</mapping>
<mapping type="cbetaNo">CB00854</mapping>
<graphic url="btg086045601.gif"/>
</glyph>
</charDecl>
</encodingDesc>
●新增檢索網址 http://isearch.ddbc.edu.tw/ 2009.01.13 erica
●缺字登入網頁 http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020