匿名
尚未登入
登入
DILA Wiki
搜尋
檢視 《佛教傳記文學視覺化平台》標記工作手冊 的原始碼
出自DILA Wiki
命名空間
頁面
討論
更多
更多
頁面操作
閱讀
檢視原始碼
歷史
←
《佛教傳記文學視覺化平台》標記工作手冊
由於下列原因,您沒有權限進行編輯此頁面的動作:
您請求的操作只有這個群組的使用者能使用:
使用者
您可以檢視並複製此頁面的原始碼。
==[http://buddhistinformatics.ddbc.edu.tw/gaosenggis/ 《佛教傳記文學視覺化平台》標記工作手冊] == 佛教傳記文學的視覺化與檢索 Visualizing and Querying the Buddhism of Biographies ===簡介及目的=== *傳記文學的價值不僅僅對於保存佛教史料具有相當貢獻,且對中國佛教思想亦有深遠之影響,另外也提供當時人們眼中的社會價值觀、著作紀錄、風俗民情等,亦是研究當時社會背景的重要參考。而且,也由於保存了當時語體的習慣用法,讓我們得以一窺語言發展的究竟。因此本研究結合TEI標記與Google earth地理資訊技術來視覺化各種附有學術價值的佛教傳記,例如粱、唐、宋、明四本高僧傳、比丘尼傳等等,並提供使用者以「時間」、「人物」與「地點」作為搜尋條件來搜尋相關的文獻內容,且其中「跨傳搜索」的功能,讓使用者的瀏覽不在局限於某單一傳記之中。 == Markup執行步驟 == ===TEI標記作業=== * 本工作手冊乃是大方向之介紹,實際執行細節仍須隨傳記之特色改變。 ====基本格式介紹==== * 範例如下 <br/><nowiki><div xmlns="http://www.tei-c.org/ns/1.0" xml:id="gsz0838c04shiYuanZhen"><head>唐鄧州烏牙山圓震傳</head> <p><anchor n="T.50.2061.0838c04"/><lb n="0838c04" ed="T"/><persName xml:id="A012516">釋圓震</persName>姓陳,<placeName corresp="CN0130682Z15AA">中山</placeName>人也。少警悟而尚學,入<lb ed="T" n="0838c05"/>庠序,研究五經。倏遇雲遊沙門寓宵,其父<lb ed="T" n="0838c06"/>為州衙吏,酷有道心,留是僧供施。<persName corresp="A012516">震</persName>禮奉<lb ed="T" n="0838c07"/>其僧,聽其談道,頗覺入神。捨儒典,披釋<lb ed="T" n="0838c08"/>經,頓辭所愛,往白磁山<!--找不到此地-->,禮<persName xml:id="A012517">智幽</persName>為師受<lb ed="T" n="0838c09"/>教。後遇<persName corresp="A005612">荷澤禪師</persName>得法,隱南陽<placeName xml:id="CN0411381M02AA">烏牙山</placeName>。先<lb ed="T" n="0838c10"/>是<placeName corresp="CN0411381M02AA">山</placeName>中多巨蛇,澤穴有毒龍,鄉人患之。<lb ed="T" n="0838c11"/>及<persName corresp="A012516">震</persName>居此,二物潛蹤。曾有一人形服且異,<lb ed="T" n="0838c12"/>致拜乃曰:「我在此已二百歲,今感無心之<lb ed="T" n="0838c13"/>化,絕慮之修,吾曹冥感超昇,可非<persName corresp="A012516">師</persName>之力<lb ed="T" n="0838c14"/>歟!」<date from="0790-01-24" to="0791-02-11" corresp="d55211905521573">貞元六年</date>終,享齡八十六,弟子奉全身<lb n="0838c15"/>入塔焉。</p></nowiki><br/><linkGrp><br/><link targets="#0838c09 #0838c14"/><br/><ptr type="person" target="#A012516"/><br/><ptr type="place" target="#CN0411381M02AA"/><br/><ptr type="time" target="#d54934085521573"/><br/></linkGrp><br/></div> * 存檔的檔名使用四碼流水號+僧名漢語拼音,採「駱駝式」拼寫。即除第一個漢字以外,所有的開頭字母都要大寫。例如釋圓震的檔名為:1070shiYuanZhen。[http://www.iq-t.com/SYSCOM/pingying2.asp 中文字轉拼音引擎]<br/><br/> * 文章全部包含在<nowiki><div></div></nowiki>中,而<nowiki><div xmlns="http://www.tei-c.org/ns/1.0" xml:id="gsz0838c04shiYuanZhen"></nowiki> 是說明TEI的版本,以及本篇文章的ID;ID為"gsz"+"首行行號"+"僧名漢語拼音(中間不留空格)"。<br/><br/> * 若有標題則使用<head>來標記,例如<nowiki><head>晉洛陽竹林寺淨檢尼傳一</head></nowiki>。<br/><br/> * 文本放在<nowiki><p></p></nowiki>標記中。<br/><br/> * <anchor n="T.50.2061.0838c04"/>說明此篇文章位於CBETA中的哪個章節。<br/><br/> * 校勘碼標記:<nowiki><ptr target="fn18"/></nowiki>,左為 "校勘18" 的寫法。<br/><br/> * 行號標記:<nowiki><lb ed="T" n="0326c01"/></nowiki>(參閱CBETA)<br/><br/> * 人名標記:<nowiki><persName xml:id="A012516">釋圓震</persName></nowiki>。其中人名ID為 "A012516"。<br/><br/> * 地名標記:<nowiki><placeName xml:id="CN0130682Z15AA">中山</placeName></nowiki>,其中地名ID為 "CN0130682Z15AA"。<br/><br/> * 時間標記:<nowiki><date from="0790-01-24" to="0791-02-11" corresp="d55211905521573">貞元六年</date>終</nowiki>。其中時間ID為 "d55211905521573"。<br/><br/> * 使用第一次出現的ID,其屬性使用"xml:id"。如: <nowiki><persName xml:id="A012516">釋圓震</persName></nowiki>。<br/><br/> * 若之後ID要再度使用(包括跨傳),其屬性使用"corresp"如:<nowiki><persName corresp="A012516">震</persName></nowiki>。否則scheme validation不會通過。所以在標記工作進行之前,必須取得工作的 .rng 或 .rnc<br/><br/> * 出現人名或是地名的代名詞,同樣要標記。<br/><br/> * Authorities 資料庫中有要使用的ID,則直接取用。<br/><br/> * 若是 Authorities 資料庫沒有適當的ID,則新增之。<br/><br/> * 新增ID方式與參考資料說明請參照: [http://wiki.ddbc.edu.tw/pages/「專案整合權威資料庫」工作手冊 「佛學規範資料庫(Buddhist Authority Database Project)」工作手冊]<br/><br/> ====標記通則==== * 可以先行尋找書籍與網路資料,查看是否有該僧人的介紹或是相關事蹟,將可幫助標記者了解艱深難懂的古文,更可以提高標記的品質。<br/><br/> =====主角的活動時間範圍===== * 在每一篇主角的人名標記中要再標記主角活動的時間範圍,若主角有確定的生卒年,則是取主角的十歲(生年+9)到卒年為他的活動時間範圍,並使用"from-to",例如釋圓震貞元六年終,享齡八十六,ID碼取用方式為714年的一月一號到貞元六年的最後一天,以求其最大範圍,標記為:<persName xml:id="A012516"><date from="0714" to="0790" type="default" xml:id="d54934085521573"/>釋圓震</persName>。<br/><br/> * 若只確定卒年而不確定生年,則使用"notBefore-to",並假設其年壽為一百歲。<br/><br/> * 而只確定生年而不確定卒年,則使用"from-notAfter",並假設其年壽為一百歲。<br/><br/> * 當生卒年都不確定,但確定歲數與知道在某個年號中卒時,則使用"notBefore-notAfter"。例如某僧人齊永明年間卒,年72。齊永明共 11年A.D. 483 - A.D. 494,則確定其「卒年」最晚不會超過494年,最早不會超過483年。因此十歲年為483-72+9=420,卒年為494,ID就取420年的第一天,跟齊永明年的最後一天,以求其最大範圍,也就是<date notBefore="0420" notAfter="0494" type="default" xml:id="d53860275412930"/>。<br/><br/> * 當生卒年與歲數都不確定,但知道在某個年號中卒時,也使用"notBefore-notAfter",例如某僧人齊永明年間卒,年不詳,則假設其僧人一百歲。齊永明共 11年A.D. 483 - A.D. 494,則確定其「卒年」最晚不會超過494年,最早不會超過483年。因此十歲年為483-100+9=392,卒年為494,ID就取392年的第一天,跟齊永明年的最後一天,以求其最大範圍,也就是<date notBefore="0392" notAfter="0494" type="default" xml:id="d53758005412930"/>。<br/><br/> * 當生卒年都不確定,但確定歲數與知道其在某個年號中生時,與當生卒年與歲數都不確定,但知道其在某個年號中生時,其處理方式與上面相同,也都使用"notBefore-notAfter",以求其最大範圍。<br/><br/> * 當生卒年、歲數與在那個年號中卒、生都不確定時,也是使用"notBefore-notAfter",並求其最大範圍,例如某僧人在齊永明年間做了某一件事,標記者可假定其僧人是在五十歲時做了那件事(其假定歲數要依前後文與各方資料判斷),並假定其年壽為一百歲,而齊永明共 11年A.D. 483 - A.D. 494,所以其十歲年數假定為483-50+9=442,卒年為494+50=544,ID就取442年的第一天,跟544年的最後一天,也就是<date notBefore="0442" notAfter="0544" type="default" xml:id="d53940635431682"/>。<br/><br/> =====人名===== * 在文章中出現的人物若有完整姓名的就要用規範碼標記之。<br/><br/> * 但若沒有完整姓名且無明確生卒年的,標記方式如下: <persName key="unknown">某某某</persName> <br/><br/> * 若出現指涉多人的專有名詞,例如竹林七賢、彌陀三聖等,則使用群組的方式標記,例如:<persName xml:id="G000001">竹林七賢</persName>。建立群組時仍需一一包含群組人物。<br/><br/> =====地名===== * 在文章中出現的所有地名都要標記。<br/><br/> * 若文本指涉的地名前面還包括一長串更大範圍的地名時,請標記文本指涉的地名就好,例如"天都長安京兆府草堂寺",則標記草堂寺ID即可。<br/><br/> *有時文本會出現指涉多處地名的專有名詞,例如五嶽、安西四鎮、三韓等等,則使用地名群組的標記方式,例如<placeName xml:id="CN0000000G01AA">五嶽</placeName>。<br/><br/> * 當無法確定確切的位置時,可使用最小可能範圍所在地區之區碼,並使用預設值座標的方式建立新ID,其詳細過程請參照: [http://wiki.ddbc.edu.tw/pages/「專案整合權威資料庫」工作手冊 「佛學規範資料庫(Buddhist Authority Database Project)」工作手冊]。<br/><br/> * 若碰到完全不知道地點的地名時,仍要建立新的ID碼,並選擇一個跨地區、大範圍的區域例如中國、華中、越南等等,並在經緯度的狀態欄勾選'''<待考>'''。例如當一個寺廟我們只知道在中國,則標為: : <placeName xmlid=CN0100000T01AA>XXX</placeName> =====時間===== * 請選擇Julian day number。<br/><br/> * 特指一天,則將該日的Authority ID日碼重複一次,例如<nowiki><date when="0394-03-26" xml:id="d53766155376615">晉太元十九年甲午之歲二月八日</date></nowiki>。<br/><br/> * 若是指某一段可以確定的時間,例如文本指涉開元二年三月、貞元六年、天寶年間、唐玄宗當政年間、整個明朝等,則使用"from-to",例如:<nowiki><date from="0790-01-24" to="0791-02-11" xml:id="d55211905521573">貞元六年</date></nowiki>,則以貞元六年第一日與最後一日之日碼為ID。<br/><br/> * 文本中指出是某個年號的初年或是末年,則選擇其年號的前四分之一的時段,或是後四分之一的時段。<br/><br/> * 文本有時不會直接寫出時間,而是描寫事件,例如"唐武帝廢佛之時",這時標記者也應該要標記出唐武帝打壓佛教的時間為何。<br/><br/> * 若文本中出現某年的季節,選擇上則是春(1月-3月)、夏(4月-6月)、秋(7月-9月)、冬(10月-12月)。(不是選擇西元年,而是選擇該年的曆法) =====非專有名詞的集合名詞===== * 若遇到只是為了寫作方便而出現的集合名詞,其名詞在某特定文章中有自己意義,例如二師、二聖,其標記方式如下: : <ref type="persName" target="#AXXXX #AXXXX ">XXX</ref> : <ref type="placeName" target="#CNXXXX #CNXXXX ">XXX</ref> =====代名詞===== * 當我們遇到人、地、時的代名詞時,則使用: : 人 → <ref type='''"person"''' target="#AXXXXXX">XXX</ref> : 地 → <ref type='''"place"''' target="#CNXXXXXA">XXX</ref> : 時 → <ref type='''"date"''' target="#5XXXXXXXX">XXX</ref> =====<linkGrp>===== * 定義: An event, recorded in the text, by which two or more marked up entities (one or more person(s), a place, a date) are understood to be related.<br/><br/> * event的定義包括了人物間有見過面,或是有互動這兩種情況。<br/><br/> * 共分為以下四種: ======第一種====== * 一人或多人,在一確切時間、確切地點所產生的事件。 * 標記方式如下: :<linkGrp> :<link targets="#0838c09 #0838c14"/>(此事件在CBETA文本中的行號範圍) :<ptr target="#A005757" type="person"/>(人) :<ptr target="#A005758" type="person"/>(人) :<ptr target="#CN410502T01AA" type="place"/>(地點) :<ptr target="#d54419125442276" type="time"/>(時間) :</linkGrp><br/><br/> ======第二種====== * 一人或多人,在一確切時間但無確切地點所產生的事件。<br/><br/> * 標記方式如下: :<linkGrp> :<link targets="#0838c09 #0838c14"/>(此事件在CBETA文本中的行號範圍) :<ptr target="#A005757" type="person"/>(人) :<ptr target="#A005758" type="person"/>(人) :<ptr target="#CN410502T01AA" type="place"/>(地點) :<ptr target="#d54419125442276" type="time"/>(時間) :</linkGrp><br/><br/> ======第三種====== * 一人或多人,在一確切地點但無確切時間所產生的事件。<br/><br/> * 標記方式如下: :<linkGrp> :<link targets="#0838c09 #0838c14"/>(此事件在CBETA文本中的行號範圍) :<ptr target="#A005757" type="person"/>(人) :<ptr target="#A005758" type="person"/>(人) :<ptr target="#CN410502T01AA" type="place"/>(地點) :<ptr target="#d54419125442276" type="time"/>(時間) :</linkGrp><br/><br/> ======第四種====== * 兩人以上,但沒有確切時間與地點的事件。<br/><br/> ====驗證檔案與上傳Occurred in==== * 所有的標記檔 (.xml) 都必須存放到同一檔案夾中,標記完成之檔案名稱必須登錄到 "GSZwrapper.xml" 中,並利用"gisSchema"來檢查各個檔案中是否發生應該標記"corresp"卻誤標成"xml:id"的錯誤。<br/><br/> * 並使用"GSZ2"檢查各個檔案中的"<linkGrp>"是否發生應該標記"xml:id"卻誤標成"corresp"的錯誤。<br/><br/> * 設定gisSchema路徑操作說明如下: :(a)打開"GSZwrapper.xml",並在Oxygen功能表上方,點選validate Doucment(紅色勾勾)旁邊的下拉式選單,並選擇Exteral validation。 :(b)在Validate with 視窗選擇RelaxNG schema。 :(c)於URL選擇設定gisSchema.rnc路徑後按確定即可。<br/><br/> * 設定GSZ2.xq路徑操作說明如下: :(a)打開"GSZ2.xq",並在Oxygen功能表上方,點選Configure Transformation Scenario,並選擇New,建立一個新的驗證程序。 :(b)之後選擇Edit,並在XML URL:的路徑中選擇GSZwrapper.xml。 :(c)在XQUERY URL:的路徑中選擇${currentFileURL} :(d)在FO Processor中什麼都不用填,在Output介面中,要勾Prompt for file、open in editor和XML。 :(e)設定完成之後,按介面上方的"Apply Transformation Scenario"(紅色放映的圖)即可開始檢查。<br/><br/> * 最後再利用Authority資料庫管理介面中的"規範碼檢查"介面,檢查檔案中所有的人名與地名規範碼是否有錯誤,若無錯誤程式將自動增加"Occurred in"。若要一次確認多個檔案, 請先將XML文本壓縮為.ZIP格式再上傳即可。[http://dev.ddbc.edu.tw/authority/XMLCheck/ 文本資料驗證介面]<br/><br/> * 驗證完畢之後,請在自己的電腦備份一份,再傳到網路硬碟備份兩份(工作檔&備份檔),以防止檔案遺失。<br/><br/> ===Authorities=== Authority (規範檔)是用以分辨單一實體 "Entity" 的唯一名稱或描述。目前所用到的規範檔只有"人"、"地"、 "時"。 ====人名 Authority 的建立:==== * "常用名"欄位通常為"姓名"、"法名"、"廟號"(皇帝)、"諡號"依序擇一使用。<br/><br/> * "常用名"之外的名稱則列於"別名"。包括僧傳中引用錯誤的人名也是如此。<br/><br/> * 人名若是出現於正史(如史記)之中,或是權威性的私史(如資治通鑑),則可以建立超連結,以資參考。<br/><br/> ====地名 Authority 的建立:==== * 中國地名ID直接引用自 "DDBC Authority"的地名碼。<br/><br/> * 地名座標取得依序為:中研院地名表、搜狗網站 、中國歷史地名大辭典、中華人民共和國地名大辭典。若不確定則於坐標欄旁勾選"待考"。<br/><br/> ====地名 Authority 編碼原則:==== *地名 Authority 編碼分為四段。<font color="#b8860b">現今行政區域</font>、<font color="#000099">屬性</font>、<font color="#FF33CC">流水號</font>、<font color="#006600">副碼</font>。如"大慈恩寺"為"<font color="#b8860b">CN0610113</font><font color="#000099">T</font><font color="#FF33CC">05</font><font color="#006600">AA</font>"。詳[http://wiki.ddbc.edu.tw/pages/地名編碼原則 地名編碼原則]<br/><br/> * 中國地區行政碼:請先參考「GB/T 2260-2002地名碼」檔案。由於郵編最大單位為縣市無法表達省級區域,故採用ISO3166延續碼。參考文件「http://zh.wikipedia.org/w/index.php?title=ISO_3166-2:CN&variant=zh-tw」<br/><br/> ====時間編碼原則:==== * 日期碼為儒略日碼(Julian Day Number, JDN)的修正版 Chronological Julian Day([http://en.wikipedia.org/wiki/Julian_day CJD])。但目前仍使用 CJD+3511565 的舊碼。<br/><br/> * 時間規範檔使用[http://zh.wikipedia.org/zh-tw/格里曆 格里曆](Gregorian calendar),而其格式為天文紀年法([http://en.wikipedia.org/wiki/Astronomical_year_numbering Astronomical year numbering])。<br/><br/> * 日期碼請利用[http://dev.ddbc.edu.tw/authority/time/ 時間規範檢索]對照查詢。<br/><br/> * 另外關於「時期碼」的部份,像是「唐朝」,她是從西元618/05/30(5458497)起,至907/04/15(5564009)結束,則其編碼為將兩個日期碼並列,為「54584975564009」共14碼。如此可以清楚在時間軸上的相對位置與長度。例如:唐太宗貞觀二年五月,時期碼為 54621585462187(628/06/07~628/07/06)。<br/><br/> == 校勘 == === 處理"字"在不同版本間有差異的問題 === * 若文本中出現明顯的錯誤,再加上CBETA中也有校正的紀錄,則可以修改成正確的字。例如周洛京魏國東寺天智傳(宋高僧傳)中出現"水昌元年",我們知道正確是"永昌元年",且CBETA中也有校勘紀錄,這樣的狀況將可以把"水"改成"永"。
返回到「
《佛教傳記文學視覺化平台》標記工作手冊
」。
導覽
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
wiki工具
wiki工具
特殊頁面
頁面工具
頁面工具
使用者頁面工具
更多
連結至此的頁面
相關變更
頁面資訊
頁面日誌