「佛學規範資料庫(Buddhist Authority Database Project)」答客問

出自DILA Wiki
於 2011年8月31日 (三) 10:24 由 imported>Putitz 所做的修訂 →‎專案碼:Z?????的地名註解應注意那些事項?

通則

說明欄問題

如何引用《文淵閣四庫全書電子版》?

本資料庫之縮寫為《淵四》,詳List of Abbreviations。而其頁碼僅能在「原文圖像」版面顯示。要快速拷貝書目位置,可於左下角書目位置點擊滑鼠右鍵,再點擊「拷貝書目位置」,即可複製。

若搜尋不到欲建置之人名或地名的直接相關資料,則採用間接相關資料。

以人名為例,若查找不到生卒年、出生地時,如何處理?
  • A. 以下假設幾種狀況,供建置者參考

1.生卒年、出生地均不詳者
(1) 則在工具書或文本中找有年代的人或事,來佐證其背景。
例如:A002878 釋慧生
南朝梁代僧。生卒年、籍貫均不詳。本住湘州,後入龍光寺,依旻公(467-527)學。於天監(502-519)初年入寂。(佛人:594;佛光:6024)
(2) 以著作佐其身份。
例如:A006957 盛熙明
西域龜茲人,撰《補陀洛迦山傳》、《遊補陀詩》。(g024p0327、g009p0144)
2.放文本中的資料
例如:A003047 竺慧開
釋法瑗(409-489)初出家事梁州沙門竺慧開。(T50n2059_p0376c01-05)

建置「規範資料庫」時,文獻查詢是否有其順序?

原則上以「規範資料庫」當中所提供的參考書目為第一優先考量,次之為網路資訊。 例如,高僧傳專案中的「人名」建置,其文獻查詢順序為:宋僧錄 → 疑年錄 → 佛百、佛光 → authority所提供的其他參考書目 → 網路資訊(維基等)

建置「規範資料庫」時,是否應一一標出文本中人名、地名之出處?

否。原則上,是「常名」標一次,各個「別名」各標一次即可。 詳參A003092智藏。

兩檔如何「合併」?

原則上,是 ID 碼大者合併到 ID 碼小者, 並請在將被合併之ID(ID碼大者)的note當中註明「合併至xxxxxx(ID碼)」。 例如,A003380 智藏 Note: 合併至A003092。

若遇須刪除資料與檔案,或須合併檔案時,如何處理?

至google文件中,「規範碼修改」之「人名規範修改」或「地名規範修改」填寫,報請維護人員刪除或修改或合併。

是否有建置者與維護者之交流園地?

有。在google文件中,「規範碼修改」之「人名規範維護日誌」或「地名規範維護日誌」。

若欲引用之文獻並未收錄於Authority Database之「參考書目」當中時,如何處理?

請主動與維護員討論是否收錄。若決定收錄,則請提供詳細書目給維護員新增。

呼噜噜網站若有問題,打不開?

維基文庫收錄《二十五史》並不完整,但現在已經達堪用的情形,請改引用維基文庫。而少部分因簡體轉繁體的問題尚未校出,請編輯者最好先閱讀過四庫或中研院的資料,再引用。呼噜噜網站則請勿再用。

若在維基文庫中檢索不到?

可直接用 firefox 開啟後,在網址列打入您要輸入的書名及卷號(卷號要用阿接伯數字) 例如:http://zh.wikisource.org/zh-hant/陳書/卷1

文本有錯誤時,處理方式?

在《中國佛寺史志彚刊》中「普陀迦新志」卷一 本迹 p. 67 第5行 破膈易心。啟彥倫之妙悟。

http://a.bonze.cn/wlsjwz/gygy/64.htm

劈胸现首,照慧目以光明。破膈易心,启彦伦之妙悟。


其 佛寺志 原文有可能引用錯誤,引用到《觀音慈林集》

《觀音慈林集》卷3:「釋彥倫
彥倫法師。蘊齊錢塘周氏。號清辯。幼歲試經得度。傳教觀於法明會賢師。甞患疫疾。百藥不治。遂力課觀音尊號。夢一婦人。以鑿開其胸。易其心。手捫摩之。患即愈。疇昔所覽。靡不通記。走筆成章。率歸典雅。咸謂辯才之證。」(CBETA, X88, no. 1644, p. 99, c21-p. 100, a2 // Z 2B:22, p. 316, b17-c4 // R149, p. 631, b17-p. 632, a4)

《佛祖統紀》

《佛祖統紀》卷14:「超果賢法師法嗣法師彥倫。
學超果賢師為有成。大觀元年主仙潭。撰教義名精微集四卷。賜號妙慧。又撰金剛經疏二卷。

法師蘊齊。錢唐周氏。號清辯。幼歲試經得度。傳教觀於法明會賢師。嘗患疫疾百藥不治。遂力課觀音尊號。夢一婦人以鑿開其胸易其心手捫摩之。」(CBETA, T49, no. 2035, p. 224, a19-26)


比較以上二經有可能紫色文字為《觀音慈林集》卷3原本脫落之文字

在《佛祖統紀》卷14,超果賢法師法嗣是有三位不同人。

《佛祖統紀》卷14:「超果賢法師法嗣 精微彥倫法師 清辯蘊齊法師 寶積彥 端法師」(CBETA, T49, no. 2035, p. 220, a25-27)

此筆人名資料,請問在規範資料庫內如何給id

A. 馬老師回覆如下: 破膈易心,启<persName id="A011296">彦伦</persName><note resp="grace">probably a mistake for <persName id="A011079">蘊齊</persName> (cf. 佛祖統紀 <ref>CBETA, T49, no. 2035, p. 224, a19-26</ref>)</note>之妙悟。

(note 的內容當然可以用中文寫)

不同生卒年或朝代做法?

若發現有二個不同卒年或生年,煩請加於註解內,如下 ID: A011303 釋僧伽 所示: 朝代不同也可同樣做法,請在Note:內註明。 並請在 Occurred in:內加上 CBETA連結

釋僧伽 ID: A011303 Dynasty:唐; 生年 +0628-01-01~+0628-12-31 卒年 +0710-04-09 生卒年查詢字串:卒於:唐, 中宗, 景龍, 四年, 三月, 初二日,83歲 生年註解:依記錄推算。 卒年註解:《宗統編年》錄為:「二月三日寂。」此從《宋高僧傳》(T50n2061_p0822a22;X86n1600_p0144c07)

在人名規範資料庫內,若遇不是人名時,如何處理?

請在此人名的 Note 欄位內,填入 title.。例:ID: A000798 梁錄,ID: A000910 開元附梁錄。

人名資料庫特有部分

新增

1.阿彌陀佛前身為無諍念王,請問人名資料庫同為一筆?

不是同一筆資料,需建二筆,一筆阿彌陀佛,一筆無諍念王。因為各為獨立主體。(2011.03.03規範資料庫會議)

人名問題

1.「帝號」前需不需要冠朝代?

「帝號」其實是根據「諡號」及「廟號」而來。以蕭衍而言,諡號為「武皇帝」,廟號為「高祖」。但由於「諡號」及「廟號」歷代多有重現,便經常在「帝號」之前冠上朝代以示區別。於是蕭衍常稱為「梁武帝」。至於「梁」是否應稱為「南梁」?依據搜尋CBETA的結果:「梁武」1335筆,「南梁武」0筆。顯然習慣上佛經不稱「南梁武帝」,所以僅填入「梁武帝」並不會損及精確率(Precision rate)。而這樣的結果也符合讀者的閱讀經驗,不至造成誤解。而如石敬塘,少有人知道其為「後晉高祖」;文獻上亦見「晉」與「後晉」雜用。此時冠上「後晉」是有幫助的,因為可以提高規範資料庫中的精確率與召回率(Recall rate),但若是以「後晉高祖」去搜CBETA,則會降低召回率(可能會將「晉高祖」濾掉)。這是使用上的區別,也是判別如何填寫欄位的思考依據。

籍貫問題

1.何謂「籍貫」?

漢典/籍貫:祖居或個人出生的地方。由於南北朝時非常重視門第,於是一個人除了姓氏宗族外,還需要交代「地望」。漢典/地望:①魏、晉以下,行九品中正制;士族大姓壟斷地方選舉等權力,一姓與其所在郡縣相聯繫,稱為地望。②指地理位置。如哈佛大學包弼德教授的中國歷代人物傳記資料庫(CBDB)就記錄地望。本資料庫未嚴格區分「出生地」「籍貫」「地望」,而以「籍貫」統稱。編輯者有需要的話可以在「說明欄」加以注記。

生卒年問題

生卒年出現二種以上說法時,如何處理?

此種情形多半出現在傳抄時筆誤,或是避諱,或是改朝換代更改年號等情形不一而足。此時應比對各版來源,以最早的版本為主,如同時有宋本及明本,則以宋本為主;而明本則注記在「說明」欄中。

人名規範資料,常名、別名是否冠上「姓」?(摘自20090615 DA會議記錄)

常名要冠姓,別名(字、號)不必一定冠姓,僧人不必一定冠「釋」。(依文本)

人名規範資料,人名中有缺字時?(摘自20090615 DA會議記錄)

人名欄用通用字表示,並在註解中說明。 人名:大[金*本] 註解欄:{大[btg008023401]}([缺字的id])

人名規範資料,常名若為破音字時?(摘自20090615 DA會議記錄)

可將其常名漢語拼音放進註解欄中,並用{}括住。例:漢拼{jiu1 mo2 luo2 shi2}

人名規範資料,人的生卒年跨朝代時,朝代欄位取 生年?卒年?多數年朝?(摘自20090615 DA會議記錄)

取卒年,且須建生卒年欄位的時間ID碼。

若知卒年及歲壽,如何換算生年?(摘自20090615 DA會議記錄)

生年=卒年-歲壽+1

孔子的生卒年到底是哪一天?

維基百科記為:「周靈王廿年(魯襄公二十二年,黃帝紀元2146年,前551年)夏曆八月廿七(現行陽曆9月28日)」又案孔子誕辰日:「儒略曆前552年10月9日,農曆9月21日,現行陽曆10月3日。」
《春秋.公羊傳》:「(襄公二十一年)十有一月庚子,孔子生。」《春秋.穀梁傳》:「(襄公二十一年十月)庚子,孔子生。」為何兩《傳》的月份不同?詳細解答參考孔子誕辰的推算
這裡說明的重點在於如何解讀古文,然後正確的記錄於規範檔中。
「魯襄公二十一年」為儒略曆BC552,規範檔-551年。秦以前的曆法目前猶莫衷一是,所以直接由日干支下手。得「BC552,-0551」所有「庚子日」。結果如下:

AID JDN 西元日期
5031412 1519847 (-0551-02-05)
5031472 1519907 (-0551-04-06)
5031532 1519967 (-0551-06-05)
5031592 1520027 (-0551-08-04)
5031652 1520087 (-0551-10-03)
5031712 1520147 (-0551-12-02)

由於「庚子日」只可能在十月或十一月,不會連續兩月都有。又根據《春秋.公羊傳》:「(襄公二十一年)九月庚戌朔,日有食之。冬十月庚辰朔,日有食之。」《春秋.穀梁傳》:「(襄公二十一年)九月庚戌朔,日有食之。冬十月庚辰朔,日有食之。」兩文相符,故必有一個「庚子日」所在是錯的。
在天文上,連續兩個月發生日食是不可能的。兩《傳》同時記載,除了天文異象外,就可能是天文官記載有誤。以NASA日食記錄查詢-551年,確實於8/20庚戌(JDN 1520037)有一個發生於遠東的日食,而下一個日食在下一年。故「九月庚戌朔,日有食之。」是可信的。庚戌之後第51日為庚子,所以庚子必在十月。而孔子生日,可推為JND 1520087(-551-10-3)。
根據參考文章孔子誕辰的推算亦為(-0551-10-03),故應採用1520087。這是double check的做法。
孔子卒日的判定較為困難,據《春秋.左氏傳》:「(哀公十六年)夏四月己丑,孔丘卒。」以《中國史曆日和中西曆日對照表》查該年為BC479(-478)四月為己卯朔,己丑為11日(JDN 1546536)。不過由於前一年(哀公十五年)將十六年子月作閏十二月,使得十六年實際為丑正。詳《春秋.左氏傳.哀公十五年》
如此一來,己丑便落在三月或五月,古代史家(如杜預、宋濂)多傾向「己丑」為「乙丑」(JDN 1546572)之誤。但奇怪的是該年又載:「春,王正月己卯。」己卯為閏十二月之晦日,正月應為庚辰朔,亦未書「己卯朔」。杜預注:「書此春,皆從告。」
由於這些結果都是數百年後的猜測,故仍建議保留原著的記錄。以古代農耕社會的情況,月建誤差一個月恐怕會引起饑荒,所以也有可能在閏錯(不當閏而閏)的情形下又做更正,只是沒有留下任何蛛絲馬跡。
所以這裡按照《中國史曆日和中西曆日對照表》的資料,記為JDN 1546536。但在卒年來源中,略敘原委。 附宋濂的辨疑文章。請參考孔子生卒歲月辨

古籍中的日期

古籍中日期的一些表示方法和異稱

地名資料庫特有部分

編碼問題

1.為何盆地可能歸類於「A」或「D」,而不統一?

本資料庫服務對象為佛學文獻,而非地形研究。對於讀者而言,搜尋資料庫時能順利耙梳出需要的地名才是最重要的。由於古文中對於地名的分類較為質樸,不外河川、山岳、沙漠等,所以除河川、山岳外,其他地形不予分類。例如:搜尋山西境內所有的河川(山岳),對於編輯者而言有所幫助;但是搜尋山西境內所有的盆地(台地),對於編輯者可能幫助不大,因為文獻中不做這樣的分類。反而地名描述的範圍大小,較可能為讀者所關心。故而在資料庫中僅將地名分為「點地名」(A、B、C),「面地名」(D、E)。而寺院為本資料庫研究核心,所以另立一類。請參考地名編碼原則#屬性碼說明:

2.何時編輯地名該使用最後二碼?

最後二碼的使用,其目的在於收納「說明某地名之內的特定區域或範圍的細項地名」。例如:法鼓佛教學院 圖資館。實際位於「法鼓山世界佛教教育園區」之內。「圖資館」之前若未冠「地名」實無法分辨其所以名何?故在說明此類地名時,必然在前後文中有「地名」範圍的限定。而其編碼也跟這些細項地名一樣,需要依從一個「地名編碼」,僅在最後二碼做區隔。目前以「AA」為「地名編碼」,而「AB」~「ZZ」共675碼為「細項地名編碼」。因此在判定何時使用「細項地名編碼」時的依據,就視該地名能否「自行獨力表達」,或必須依從其他「地名」來決定。但這樣的情形與存在眾多同名「地名」,而須冠以更大「地名」以作區隔有別。如「白馬寺」,為區隔是哪一座白馬寺,在文中通常會冠地名。則不屬於這一種情況。 另外,由於所有「細項地名」都可以引用「地名」的座標,所以也不建議使用於過度分散,或是跨行政區的細項地名。如仍不確定,請多參考資料庫中的「細項地名」。

問題: 1)短姑道頭,說 明: 進了普陀山佛國山門,往東南約300米處,便是短姑道頭。

 道頭位普陀山,但不是在山內,而是在沿海的地方,請問編碼:M(AB)? T? A? (Sophia 5-28)

2)龍沙,說 明: 為普濟寺之青龍,故名。飄沙累積,高丈餘。

 龍沙位寺院外的天然景觀,T(AB)?M(AB)? A? (Sophia 5-28)

以上兩例為文獻人員提供,對於如何判別,因為牽涉對全文的解讀,這裡僅作原則性的說明。 資料庫的使用情況不外乎:「新增」「查詢」「修改」「刪除」;而本資料庫特別著重於「正確的查詢」,這項功能的品質可以用二個「比率」來表示:「召回率(Recall rate)」、「精確率(Precision rate)」

  • 召回率:a/b。
  • 精確率:a/c。
召回率(高) 召回率(低)
精確率(高) 該傳回的都有傳回,且沒傳回垃圾 該傳回的不一定傳回,但沒傳回垃圾
精確率(低) 該傳回的都有傳回,但也傳回垃圾 該傳回的不一定傳回,還傳回許多垃圾

其中 a:傳回的正確資料。 b:資料庫中所存在的正確資料量。 c:所有傳回的資料。

本資料庫所有的努力就都在於提升召回率與精確率。例如增加別名就在於提高召回率;不冠地名就在於提高精確率。所以依編輯「細項地名」的原則:「短姑道頭」、「龍沙」能否是獨立的「地名」?或是必須依從於「普陀山佛國」「普濟寺」這項工作就由文獻人員自行判斷。如何可以提高「二率」那就是正確的做法。

常、別名問題

「京師」是通稱還是專名?

「京師」始見於《詩.大雅.公劉》:「京師之野」《詩經通義》:「謂可營立都邑之處。『京師之野』謂是京乃大衆所宜居之野也。季本曰『未有室廬故曰野』」《公羊傳.桓公九年》:「京師者何?天子之居也。京者何?大也。師者何?眾也。天子之居,必以眾大之辭言之。」《後漢書.竇何列傳》:「騰上言:『天子無外,乘輿所幸,即為京師』」;《金史.地理上》:「以燕乃列國之名,不當為京師號,遂改為中都。」由此可知「京師」為通稱。直到明永樂帝才下詔改北京為京師。《明史.志第十六》:「永樂元年正月建北京於順天府,稱為『行在』。二月罷北平布政使司,以所領直隸北京行部;罷北平都指揮使司,以所領直隸北京留守行後軍都督府。十九年正月改北京為京師。」而在明代之前,歷朝的國都是否建別名為「京師」,則因較不具鑑別度(有許多不同的京師,甚至一朝多個京師),如北魏曾都平城、洛陽、鄴城三地,故不建議使用。若要搜尋所有的國都,則在「備註」中有「國都」者就是。可以利用:進階選項/分類:Z/class_id(2):國都,搜尋。

座標問題

註解問題

專案碼:Z?????的地名註解應注意那些事項?

有專案碼的地名為中研院依據譚其驤所編《中國歷史地圖集》,將地圖存為電子文件而成,是自秦至清朝二千多年,其中「十五年」的疆域圖快照,另詳不可變資料。以中國本土而言,具有兩項特性:依朝代分,依行政區分。以唐朝「河東」為例,有「河東道」「河東郡」「河東縣」,在文獻中的表達如下:

T50n2061_p0736c26║壇。受成佛印。顯密二教皆聞博贍。關內河東(這裡指「關內道」與「河東道」CN0140881Z14AA)

T50n2060_p0619c02║釋慧旻。字玄素。河東人。(這裡指「河東郡」CN0140881Z15AA)

T50n2061_p0760c10║釋普寂。姓憑氏。蒲州河東人也。(這裡指「河東縣」CN0140881Z13AA,蒲州即河東郡。)

以上三個「河東」註解內容就可以引用《舊唐書.地理志》的資料。目前可稱為善本的電子資料為中研院的漢籍電子文獻,有校勘記。不過它所使用的網址為臨時的session,無法固定。所以資料來源目前以維基文庫為網址,雖然錯別字多(主要是因為由簡體字自動轉成繁體字造成),但我們認為未來這個地方的內容會逐步改善。

時間資料庫特有部分

文獻資料庫特有部分