聖嚴法師專案人事時地標記作業
出自DILA Wiki
標記原則
- 本專案使用《法鼓全集》XML 檔進行標記。
- 標記位置於圖檔所對應的文字開頭處。
- 若同一圖檔所含的文字段落距離太遠,則標記於 XML 中多處。
圖檔標記
與內文對應之圖檔
標記於該 XML 檔對應圖檔的文字之前:
<ref type="syms" target="SYA000001_001"/>
- syms 為 Sheng Yen Manuscript 縮寫。
- 範例中 SYA000001_001 為圖檔編號 (圖檔命名參考: 聖嚴法師專案圖檔命名規範 )。
與內文無法對應、但明顯為同一作品之圖檔
如大綱、目錄、封面提字等,明顯屬於該書相關資料,標記於該 XML 檔的 <front> 區段中:
< text> < front> < div1 type="ms-ref"> < p> < ref type="syms" target="SYA001812_001"/> < ref type="syms" target="SYA002835_001"/> < /p> < /div1> < /front> < body> ... < /body> < /text>
注意事項:
- <front> 和 <body> 是平行的層次。
- 使用 < div1>,而非 < div>。
- 所有的 < ref> 外用一個 < p> 包起來。
同一圖檔出現於多個不同位置
若圖檔內容分屬於不同文字區域,則於每區前標記該圖檔。
同一位置出現多個圖檔
若同一位置同時有多個圖檔,則標記於同一位置。ref 的 target 屬性裡為多值,以半形空格隔開
例如:
<ref type="syms" target="SYA001672 SYA001812"/>
人時地標記
人名
<persName key="A023336">保羅甘迺迪(Paul Kennedy)</persName>
時間
我們是 <date when-iso="1988-04-08" key="j24472602447260">四月八日</date> 下午七點
注意事項:
- 舉例如文本內容為「正值「文化大革命」期間(西元一九六六~一九七六年),好友印海法師寄給我一小塊剪報,」其中「西元一九六六~一九七六年」雖為明確之時間,非古文中不明確之年號等,但若有「事件標記」之需求,仍需做標記。
- 季節的部份暫時不做標記,僅標記年份。
地名
<placeName key="PL000000000000">地名</placeName>
總則
需要紀錄的地名,必須符合下列**所有**條件:
- 在文獻當中,其前後文來說,該地點、組織名稱是當作「地名用途」。
- 在文獻當中,提供該地點的座標,是否有助於閱讀,或有助於地圖上的呈現
- 該名稱必須為大眾所認知的具代表性名稱,該名稱可獨立識別位置、並非於某一地點的附屬建物,或某一組織的內部單位。
詳述
- 在文獻當中,其前後文來說,該地點、組織名稱是當作「地名用途」。
說明:此點必須請文獻人員加以判斷。
- 例如:其中的「三學研修院」在這邊並沒有把組織當地點的用途,因此不需標記為placeName,當然後續也不需討論是否要建立規範資料庫紀錄。
「藉農禪寺而成立了三學研修院」 《歸程》法鼓全集光碟版 (06-01, p. 232, 16)
- 又例如:其中的「駐台譯經院」也沒有把組織當地點的用途,因此不需標記為placeName。
「當時先在農禪寺設立了美國佛教會的駐台譯經院,聘我擔任譯經院院長」《法鼓山故事》p. 0196
- 例如:
- 在文獻當中,提供該地點的座標,是否有助於閱讀,或有助於地圖上的呈現
說明:此點必須請文獻人員加以判斷。
- 例如:「東半球、西半球」 是一個地理學名詞,並非特定地名。此外,提供一半地球的座標,於理解上、地圖呈現上,都沒有幫助,因此不需標記為placeName。
- 該名稱必須為大眾所認知的具代表性名稱,並非於某一地點的附屬建物,或某一組織的內部單位。
說明:對於附屬建築物,由於一一標記過於繁雜,因此不予標記。
- 例如:基本上:龍華寺 應該標記,並紀錄於地名規範資料之中。
「重建的龍華寺,自亦未能倖免。嗣後由觀竺禪師的弟子們,承師遺志,自清德宗光緒元年至二十一年間(西元一八七五~一八九五年),先後再建大雄寶殿、方丈室樓房、金剛殿、三聖殿、彌勒殿、伽藍殿、客堂、齋堂、觀音殿、地藏殿、祖師殿、五百羅漢堂等,完成了江南有數的大寺院之景觀。」
而「先後再建大雄寶殿、方丈室樓房、金剛殿、三聖殿、彌勒殿、伽藍殿、客堂、齋堂、觀音殿、地藏殿、祖師殿、五百羅漢堂等,」裡面全部是附屬建築,不予標記。
- 例如:PL000000058821瓔珞關房(朝元寺)、PL000000058471招仙塔(靈光寺) 都屬附屬建築,不予標記。
- 例如: 建築群所含之建築不新增規範檔,亦不予以標記,如:「法鼓山的大殿」,地名層次為「法鼓山」,僅標記「法鼓山」。
- 例如:
- 對於或某一組織的內部單位:若僅有該名稱,但無提及大機構名稱,就無法識別時,不予標記。
- 例如:若提及「法鼓佛教學院的教務處」因「法鼓佛教學院」為大眾所認知的名稱,因此需要紀錄。
- 「教務處」為法鼓佛教學院內部組織,若無提及法鼓佛教學院而無法識別教務處時「教務處」不予標記。
事件標記
需標記於兩處:事件對應內文、事件連結。
事件對應內文
於事件對應內文處標記:
<anchor xml:id="a20.02"/>
- 其中 a20.02 表示行號為 2002 (XML中 <lb n="002002"/> 該行)
- 如果同一行有多個 anchor 就多加個序號,例如: <anchor xml:id="a20.14.1"/>, <anchor xml:id="a20.14.2"/>
事件連結
標記於XML檔中的< back>區段中:
< back> < div type="link"> < span from="#a20.02" to="#a20.05"> < link target="A023335 PL000000048152"/> < /span> < span from="#a20.05" to="#a20.06"> < link target="A023335 A023336 A023337 PL000000056125"/> < /span> < /div> < /back>
- < span> 中的 from, to 為 < anchor> 的id。
- < link> target 的值為相關的人名、地名id。
標記檢查原則
圖檔標記檢查
是否有漏標
核對圖檔標記清單所列圖檔:
(1) 是否均已標記。
(2) 若為漏標者,請補上標記。
(3) 若為無法標記者,請於備註欄填寫原因 (請勿空白)。
圖檔標記位置
(1) 判斷圖檔標記位置是否合宜並修改,若有討論空間請與工作人員討論,取得共識。
(2) 標記檔 (XML) 進行任何變動均記錄於 google 文件。
範例:
xml編號 | 圖檔編號 | 原標記位置 | 更改後位置 | 修改原因 | 修改人 | 修改日期 | 備註 | 複檢人 | 確認日期 |
---|---|---|---|---|---|---|---|---|---|
01-01.xml | SYA000297_001 | 一九七五年春 | 自序 | 相對應圖檔文字初始文字 | 黃仁順 | 2013/6/4 | 鄭安邦 | 2013/6/5 | |
01-01.xml | SYA000318_002 | 圖檔所引內容未在打字檔中被申述,所以做不標記處理。 | 黃仁順 | 2013/6/4 | 鄭安邦 | 2013/6/5 |
註:「原標記位置」、「更改後位置」請說明在<front>中或於何文字之前,若為後者請至少打五個字。
件數核對
該XML檔檢查完成後,記錄所含圖檔數(非標記數),例如:
作品名稱 | 系統圖檔數 | 核對圖檔數 | 備註 |
---|---|---|---|
01-01《明末佛教研究》 | 318 | 318 | |
01-03《戒律學綱要》 | 17 | 16 | 1個無法標記。 |
人事時地標記檢查
錯字處理流程
標記人員僅負責標記,原則上不對《法鼓全集》XML檔文字做更動,當發現疑似錯字時,請依下列流程處理:
一、確認該字為錯字,找出相關佐證資料。
二、核對《法鼓全集》紙本內容:
- 狀況一、紙本沒有錯,而 XML 檔有錯:直接修改錯字,並發信通知《法鼓全集》電子版負責人(邦信師兄)。
- 狀況二、紙本有錯:XML 檔不做處理,發信通知《法鼓全集》紙本編輯負責人(張晴師姐),副本予專案相關人員。