匿名
尚未登入
登入
DILA Wiki
搜尋
檢視 《中國佛寺史志》標記作業 的原始碼
出自DILA Wiki
命名空間
頁面
討論
更多
更多
頁面操作
閱讀
檢視原始碼
歷史
←
《中國佛寺史志》標記作業
由於下列原因,您沒有權限進行編輯此頁面的動作:
您請求的操作只有這個群組的使用者能使用:
使用者
您可以檢視並複製此頁面的原始碼。
==標記總說== 1.本專案將以TEI-XML格式進行作業,對於文本中的人名、地名、時間皆加以標記 及建置資料庫,旨在提供高質量的數位化全文。 2.數位化的文本也將加入新式標點符號。 3.文本中的難檢字將採用Unicode字符, 若於Unicode字庫中尚未收錄的字,則將改以同義異體字代替,或者建立缺字檔。 4.TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。 「意義標記」著重在付予文字意義,例如:<persName>人名。 「樣式標記」著重在呈現的樣貌,例如:<lb/>(折行)。 TEI-XML標記著重於「意義標記」,而文本呈現的樣貌則多操縱於XSLT。 ==檔案架構== 《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。(例:重修普陀山志代碼g008) 每一志皆由一個主檔(例:重修普陀山志的主檔g008_main) 及數個小檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。 主檔內寫有版本資訊及小檔的鍊結,小檔內則是各卷的內容。 ==標記說明== ===頁碼=== 1頁碼放置的位置:置於<div>與<head>之間。 例1:<div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0"> <pb facs="1B009P003.jpg" n="0000a"/> <head resp="ddbc.da">普陀山志卷前</head> 例2:<div> <pb facs="1B009P022.jpg" n="0003"/> <head>重修普陀志叙</head> 2版本說明頁的頁碼、卷之前無頁碼的頁碼 格式:第一頁0000a,第二頁0000b,第三頁0000c 例:<div> <pb facs="1B009P003.jpg" n="0000a"/> <head resp="ddbc.da">版本說明</head> ps.由於卷首需要一個頁碼,因此「版本說明」的頁碼會被挪移到當卷第一個<head>之前。 (見頁碼放置的位置例1) 3插圖頁的頁碼 格式:插圖前頁頁碼+a 例:<pb facs="xBxxxPxxx n="0123a""/> 4空白頁 需標上當頁頁碼 例:<pb facs="1B009P043.jpg" n="0024"/> 5內文頁碼 <pb facs="1B009P294.jpg" n="0275"/> ===標題=== 1標題的標法 ● <head>標題</head> ● <head>標題</head><byline><persName>作者</persName></byline> ● <head resp="ddbc.da">自加標題</head> ● <head>標題<seg rend="font-size:small">副標題</seg></head> 2說明 (1)若篇章缺乏標題者,可「自訂標題」。 自加的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧, 以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。 文本標記的格式:<head resp="ddbc.da">自加的標題</head> 網頁樹狀目錄所呈現的樣式:(自加的標題) (2)標題後的副標題,可以<seg>(隨機分割)標記之。 例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head> #<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。 (3)若有長標題時,亦用長標題,不自訂短標題。 3標題亦可加新式標點符號。 ===人名=== 1 人名規範資料的建置(若欲建檔,請先以帳號密碼登入) ● 人名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/person/ ● 人名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「人名規範資料庫」] ● 人名規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問] 2 人名標記標法: <persName key="Axxxxxx">某某某</persName> <persName key="unknown">未知的人名</persName> <persName key="Gxxxxxx">人名群組</persName> <roleName>稱謂</roleName>(須包在<persName>內) <roleName type="honorific">尊稱</roleName>(須包在<persName>內) <name>族姓</name> 3 人名標記凡例 {| style="color:green;background-color:#ffffcc;" cellpadding="2" cellspacing="0" border="1" !稱謂型態 ! 凡例 ! 標記 |- |官稱 |<ul><li>韋左司</li><li>韋應物左司</li><li>杜副校長正民</li></ul> |<ul><li><persName>韋<roleName>左司<roleName></persName></li> <li><persName>韋應物<roleName>左司</roleName></persName></li> <li><persName>杜<roleName>副校長</roleName>正民</persName></li></ul> |- |地名當人名 |<ul><li>韋蘇州</li><li>塩官國師</li><li>臨濟</li><li>天童圓悟大師</li></ul> |<ul><li><persName>韋<placeName>蘇州</placeName></persName>(指韋應物)</li> <li><persName><placeName>塩官</placeName><roleName>國師</roleName></persName></li> <li><persName><placeName>臨濟</placeName></persName></li> <li><persName><placeName>天童</placeName>圓悟<roleName>大師</roleName></persName></li></ul> |- |連名 |<ul><li>大鶴居士鄭文焯</li><li>花之寺僧羅聘</li><li>華陽眞人陶貞白先生宏景</li></ul> |<ul><li><persName>大鶴<roleName>居士</roleName>鄭文焯</persName></li> <li><persName>花之寺僧羅聘</persName>(不加roleName)</li> <li><persName><placeName>華陽</placeName><roleName>眞人</roleName>陶貞白<roleName>先生</roleName>宏景</persName></li></ul> |- |子 |<ul><li>寒山子</li><li>殳子山夫</li><li>楊氏子</li></ul> |<ul><li><persName>寒山子</persName></li> <li><persName>殳<roleName type=”honorific”>子</roleName>山夫</persName></li> <li>如堂,寂光寺僧,澂江<name>楊</name>氏子(楊,在此指其族姓)</li></ul> |- |兒 |<ul><li>陵兒</li></ul> |<ul><li><persName>陵<roleName>兒</roleName></persName></li></ul> |- |公 |<ul><li>歐陽文忠公</li><li>忠定公燮元</li></ul> |<ul><li><persName>歐陽文忠<roleName type=”honorific”>公</roleName></persName></li> <li><persName>忠定<roleName type=”honorific”>公</roleName>燮元</persName></li></ul> |- |氏 |<ul><li>大雄氏(指佛)</li><li>孔雀氏(指阿育王)</li><li>俞氏</li></ul> |<ul><li><persName>俞氏</persName>(皆直標persName,不用標roleName)</li></ul> |- |師、本師 |<ul><li>本師阿彌陀如來(「非人」單純標人名,不加稱謂)</li></ul> |<ul><li>本師<persName>阿彌陀如來</persName></li> <li><persName>阿彌陀佛</persName></li> <li><persName>阿彌陀佛</persName>如來本地</li></ul> |- |大士、菩薩 |<ul><li>觀音大士</li><li>普賢菩薩(「非人」單純標人名,不加稱謂)</li></ul> |<ul><li><persName>觀音大士</persName></li> <li><persName>普賢菩薩</persName></li></ul> |- |山人 |<ul><li>漁洋山人</li></ul> |<ul><li><persName>漁洋山人</persName></li></ul> |- |上人 |<ul><li>悟上人</li></ul> |<ul><li><persName>悟<roleName type=”honorific”>上人</roleName></persName></li></ul> |- |老 |<ul><li>印老法師</li><li>南亭老和尚</li></ul> |<ul><li><persName>印<roleName type=”honorific”>老法師</roleName></persName></li> <li><persName>南亭<roleName type=”honorific”>老和尚</roleName></persName></li></ul> |- |老人 |<ul><li>南極老人</li><li>無著老人</li></ul> |<ul><li><persName>南極老人</persName>(慣用語、專名)</li> <li>惟我先師<persName>無著<roleName type=”honorific”>老人</roleName></persName>(一般稱謂,標<roleName>)</li> |- |翁 |<ul><li>壑翁相國(賈秋壑)</li></ul> |<ul><li><persName>壑<roleName type=”honorific”>翁</roleName><roleName>相國</roleName></persName></li></ul> |- |先生 |<ul><li>半農先生</li></ul> |<ul><li><persName>半農<roleName type=”honorific”>先生</roleName></persName></li></ul> |- |夫人 |<ul><li>許夫人</li><li>秦國夫人計氏</li></ul> |<ul><li><persName><roleName>秦國夫人</roleName>計氏</persName></li></ul> |- |諡號 |<ul><li>謚「大悟禪師」</li><li>賜號「廣慧妙悟智寶宏教禪師」</li><li>妙覺圓通慧慈普應輔國顯教灌頂弘善西天佛子大國師釋迦也失</li></ul> |<ul><li><persName>大悟<roleName>禪師</roleName></persName></li> <li><persName>廣慧妙悟智寶宏教<roleName>禪師</roleName></persName></li><li><persName><roleName>妙覺圓通慧慈普應輔國顯教灌頂弘善西天佛子大國師</roleName>釋迦也失</persName>。(皇帝賜給的封號與本身的名字連用時,可將封號變通為<roleName>。)</li></ul> |- |皇帝(皇后) |<ul><li>世宗憲皇帝</li><li>梁皇</li><li>慈寧皇太后</li></ul> |<ul><li><persName>世宗憲<roleName>皇帝</roleName></persName></li> <li><persName>慈寧<roleName>皇太后</roleName></persName></li></ul> |- |帥 |<ul><li>筱帥</li></ul> |<ul><li><persName>筱<roleName>帥</roleName></persName></li></ul> |- |君 |<ul><li>須直君</li><li>葛君</li></ul> |<ul><li><persName>葛<roleName type=”honorific”>君</roleName></persName></li></ul> |- |諱 |<ul><li>王諱舉(王舉)</li></ul> |<ul><li><persName>王</persName>諱<persName>舉</persName></li></ul> |- |} 4 人名規範資料建檔注意事項 (1)名字: a)常名、別名請冠上姓氏,以便利檢索。 b)每一語系中,應有一常名,餘則為別名。 (2)缺字:人名中有缺字時,人名欄位以通用字表示。 (3)朝代:以此人的卒年為依。 (4)籍貫:其地名朝代以此人的生年為依。 (5)生卒年 a)生年的計算:生年=卒年-歲壽+1 b)生卒年的取捨:若資料來源有干支年及西元年,以取干支年為準。 例:重顯(980~1052),宋代雲門宗僧。於皇祐四年入寂。 建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。 (6)是否為歷史人物:若非歷史人物,則在此欄位勾「否」。 (7)註解: a)以120個字為限(阿拉伯數字不算字數,標點符號算字數),並請使用全形標點符號。 b)若此人查不到生卒年,則應在註解欄的資料中盡可能節錄相關人事物的時間參考點。 c)僧人註解資料的基本要件:師承、師兄弟、著作、法嗣、事件時間。 d)引用資料,盡量以紙本、藏經或佛學辭典為優先。 使用網路資料時,應注意留存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。 e)引用資料時須註明資料來源。出處的作用:1).說明資料來源 2).幫助使用者搜尋(Finding Aid) f)「佛學規範資料庫」對於經常引用的參考工具書編有「簡稱」,引用這些參考書時請以這些「簡稱」為依。 g)Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。 (8)若是查詢不到任何資料的人名,請不用收錄至規範資料庫。(文本上標 key="unknown" 即可) 5 人名標記規則 (1)文本中出現的人名,皆應標記。(例外:書名號內的人名,不標記。) (2)標題後的人名是「作者」時的標法 <head>標題</head><byline><persName key="Axxxxxx">作者名</persname></byline> (<byline>:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。) (3)遇人名不確定是否為某人時,可加屬性值標示。 例:<persName key="A001606" cert="70%"> cert是表示標記者認為的正確度,是相對值,非絕對的。 (4)非人,非人界皆要標記。(2011/1/27回函決議) [[#三、人名|返三、人名]] ===地名=== 1 地名規範資料的建置(若欲建檔,請先以帳號密碼登入) ● 地名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/place/ ● 地名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 [http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E5%B0%88%E6%A1%88%E6%95%B4%E5%90%88%E6%AC%8A%E5%A8%81%E8%B3%87%E6%96%99%E5%BA%AB%E3%80%8D%E5%B7%A5%E4%BD%9C%E6%89%8B%E5%86%8A 編輯「地名規範資料庫」] ● 地名規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問] 2 地名標記 <xml code> 標法: <placeName key="xxxxxxxxxxxxxx">地名</placeName> <placeName key="unknown">未知的地名</placeName> <placeName key="xxxxxxxxxGxxxx">地名群組</placeName></xml> 3 地名標記凡例 {| border="1" cellpadding="0" cellspacing="0" |+ ! 型態 ! 凡例 ! 標記 |- |單純行政區地名 |杭州 |<placeName key="CN0330103Z19AA">杭州</placeName> (需配合文意而選擇朝代別) |- |單純自然區地名 |普陀山 |<placeName key="CN0330903M01AA">普陀山</placeName> |- |連名 |四川峨眉縣 |<placeName key="CN0511181Z02AA">四川峨眉縣</placeName> (以連名的最小地點為其ID) |- |地名中含人名 |遂賜額曰「天花尊者開巖院」 |<placeName key="CN0331023T57AA"><persName key="unknown">天花尊者</persName>開巖院</placeName> |- |寺內建築:一般 |大雄寶殿、放生池 |文本不標,資料庫不建 |- |寺內建築:具特殊意義 |阿育王寺舍利塔殿 |文本應標,資料庫應建 |- |地名群組 |五嶽 |<placeName key="CN0000000G07AA">五嶽</placeName> | |} 4 地名規範資料建檔注意事項 (1)地名尾碼非AA碼者,不可重新編碼,因為會牽涉到相同主碼的其他地名。 (2)Google map與衛星圖的經緯度有落差,在標經緯度時以衛星圖為主。 (3)地名的建置,註解欄注意事項請參閱[[4人名規範資料建檔注意事項]]內有關註解的條目。 5 地名標記規則 ● 文本中出現的地名,皆應標記,但除了(小地名不標外)。 ● 非人界、傳說中的地名,不用標記、建檔。 [[#四、地名|返四、地名]] ===時間=== 1 時間規範資料的查詢(若欲查詢,請先以帳號密碼登入) ● 時間規範資料庫網頁 http://dev.ddbc.edu.tw/authority/time/ ● 時間規範資料的問題討論,請參閱[http://wiki.ddbc.edu.tw/pages/%E3%80%8C%E4%BD%9B%E5%AD%B8%E8%A6%8F%E7%AF%84%E8%B3%87%E6%96%99%E5%BA%AB%EF%BC%88Buddhist_Authority_Database_Project%EF%BC%89%E3%80%8D%E7%AD%94%E5%AE%A2%E5%95%8F 「佛學規範資料庫」答客問] 2 時間標記 ● 標法: <date key="j+(起始時間碼)+(結尾時間碼)" notBefore-iso="起始西元年-月-日" notAfter-iso="結尾西元年-月-日">區段性的某時間</date> <date key="j+(開始時間碼)+(結束時間碼)" from-iso="開始西元年-月-日" to-iso="結束西元年月日">事件持續進行的時間</date> <date key="j+(當日時間碼)+(當日時間碼)" when-iso="西元年-月-日">時間點</date> <date key="unknown">未知的時間</date> 3 時間標記凡例 {|border="1" cellpadding="0" cellspacing="0" |- !時間型態 !凡例 !標記 |- |區段性的某時間 |余以光緒己卯游天台 |<date key="j24073722407755" notBefore-iso="1879-01-22" notAfter-iso="1880-02-09">光緒己卯</date> 說明:a)key2407372:光緒己卯年正月一日ID b)key2407755:光緒己卯年正月三十日 c)notBefore-iso:光緒己卯年正月一日ID d)notAfter-iso:光緒己卯年正月三十日 |- |明確日期 |萬曆庚戌年五月十六日 |<date key="j23092772309277" when-iso="1610-06-26">萬曆庚戌年五月十六日</date> |} 4 時間規範資料建檔注意事項 (1)佛寺志專案使用Julian day number時間系統,請確認介面是否選用此項。 (2)若未「登入」時間規範資料庫,查詢結果將不會自動計算「初年」、「末年」等較詳細之資訊。 (3)時間的查詢有多種管道:中國年(朝代、帝號、年號、年干支),西元年(三種方式),ID碼。 5 時間標記規則 (1)有明確年號、年代、或月日等的時間,皆應標記; 無法證知(從前後文或其他資料皆無法得知)的時間, 則可標記<date key="unknown">未知年的時間</date>。 (2)有些時間因文本錯誤以致無法找到id,可用note註解, 例:當穆王五十三年壬申二月十五子夜,入般涅槃 <date key="unknown">穆王五十三年壬申二月十五子夜</date> <note resp="ddbc.da">據《中國史厯日和中西厯日對照表》(方詩銘、方小芬編著,上海人民出版社2007)編載,周穆王只行到四十一戊戌年(-983)。</note> (3)初年,末年時間的擷取原則 取當朝、當年號、當年的前1/4為其初年,末1/4為其末年。 (4)時間為民國年的注意事項: A.民國十三年 → 用西曆 B.民國十三年冬 → 標示西曆民國十三年11月~民國十四年2月 (西曆:春3-5月,夏6-8月,秋9-11月,冬11-2月) C.民國十三年甲子 → 用農曆民國甲子年 D.民國十三年甲子冬 → 用農曆民國甲子年10~12月 (5)時間為民國年的查法: 登入網頁「兩千年中西曆轉換」http://sinocal.sinica.edu.tw/ 兌換出相對應的西元時間,再到時間規範資料庫換算ID碼即可。 例:民國壬寅年 兌換出為西元1962年2月5日~1963年1月24日 再到時間規範資料庫以西元年查詢為5949266~5949619 即<date key="d59492665949619" notBefore="1962-02-05" notAfter="1963-01-24"> (6)時間屬性的變更:(2011.01.20) notBefore,notAfter,from,to,when,全要加上-iso(計算0年) 如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso 例:<date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13">哀帝元壽間</date> (7)萬 丙子秋(=萬曆丙子秋) 例:<date>萬 丙子秋</date>(照標時間,空格不再處理。) (8)屬性key,notBefore,notAfter的先後順序不一,不會影響驗證或呈現。 例:<date key="j22968992296986" notBefore-iso="1576-08-05" notAfter-iso="1576-10-31">萬曆丙子秋</date> =<date notAfter-iso="1576-10-31" notBefore-iso="1576-08-05" key="j22968992296986">萬曆丙子秋</date> (9)當時間同時有年次、歲次時,可只標較詳細的歲次時間。 例:時宣統三年,歲在<date key="j24192292419229" when-iso="1911-07-11">辛亥六月旣望</date>,長洲葉昌熾謹記 (10)時間名詞+初、初年、末、末年、年:包進時間。 時間名詞+中、間、年間:不包進時間。 例1:<date>萬曆初</date> 例2:<date>萬曆三年</date> 例3:<date>萬曆</date>年間 (11)清光緒末年的時間計算問題(德宗&恭宗皆以光緒為年號) a)光緒末年,指德宗+恭宗的年代的末1/4。 阿賢:無法用程式計算,請各位自己計算。 b)志偉的意見:若有數個,則取最長的那一個末年,如上則取德宗光緒的末年即可。 (12)朝代,仍標時間,但不在輸出頁面(內文)上呈現,而以「朝代表」的方式附錄在索引項中。 6 知識備忘 (1)春=農曆1-3月,夏=農曆4-6月,秋=農曆7-9月,冬=農曆10-12月 (2)農曆月份的別名 一月:孟春、元春、開歲、端月、嘉月、正月。 二月:仲春、杏月、麗月、如月、花月。 三月:季春、晚春、暮春、季月、蠶月、桃月、桐月。 四月:孟夏、麥月、陰月、梅月、純陽。 五月:仲夏、榴月、蒲月、皋月、毒月。 六月:季夏、暑月、焦月、荷月、荔月。 七月:孟秋、新秋、蘭秋、蘭月、瓜月、巧月。 八月:仲秋、竹春、桂月、壯月。 九月:季秋、暮商、菊月、朽月、陽月、季秋。 十月:孟冬、初冬、開冬、露月、良月、陽月。 十一月:仲冬、辜月、葭月、龍潛月、冬月。 十二月:季冬、殘冬、臘月、冰月、嚴月。 [[#五、時間|返五、時間]] ===代名詞=== 1標法: <ref key="Axxxxxx">人名代名詞</ref> 例:<ref key="A003940">余</ref>(余指徐時泰) <ref key="xxxxxxxxxxxxxx">地名代名詞</ref> 例:待補 2標記時機:當詞意不明顯時才須標 [[#《中國佛寺史志》數位典藏工作手冊|返目錄]] ===註解(ddbc.da)=== 1.註解內無超連結 標法:<note resp="ddbc.da">註解文字</note> 例:梁視<note resp="ddbc.da">視,疑爲「祖」字。</note>普通三年 2.註解內有超連結 標法:<note resp="ddbc.da">註解文字(<ptr target="網址"/>,日期)</note> 例:應案<note resp="ddbc.da">「案」字,萬福禪寺網站此處作「索」。 (<ptr target="http://www.huangboshan.com/zisusifu.htm"/>,2010.05.04)</note>屐而自潸。(g010p0445) 3.註解引用自CBETA資料時 標法:<note resp="ddbc.da">CBETA經文(CBETA預設的引用格式)</note> 例:著作郎<persName key="A010335">顧允祖</persName><note resp="ddbc.da"> 《集神州三寶感通錄》卷1:「著作郎顧胤祖」(CBETA, T52, no. 2106, p. 405, a17)</note> 其他規則: (1)標題內的註解,請置於<head>內。 例:<head>于黃檗丈室堂第三代隱元隆琦國師 上堂九則 機緣三則<note resp="ddbc.da"> 按:標題為上堂法語九則,機緣三則;內文實則收錄上堂法語八則,機緣五則。</note></head> ===特字=== <syntaxhighlight lang="XML"> ● 特字處理的作業環境 皆以NotePad++軟體來處理UTF-8編碼的txt檔。 一、將現有txt檔更改為UTF-8編碼的方式: (1)點選另存新檔。 (2)在存檔畫面下方「編碼」那一欄選擇UTF-8。 二、以NotePad++開啟已更改編碼的txt檔案。 ● 特字處理: 特殊字處理的原則,首先是尋查有無unicode編碼字(包含Extention C), 然後再根據文字本身(或搭配前後文)是否易於辨識而做應對的標記。 一、有unicode編碼字 (1)此字易於辨識者(不會產生懷疑的),則直接採用unicode編碼字,不做任何標記。 例如:静,徳,録,䟽 (2)此字不易於辨識者(不易讀懂,罕用字),但有通用字時,則標記<choice>。 例如:㝎(定),灋(法),銕(鐵)。(見圖二) 標記:<choice><orig>文本原字(unicode)</orig><reg resp="ddbc.da">通用字</reg></choice> 範例:優曇華發<choice><orig>㝎</orig><reg resp="ddbc.da">定</reg></choice>中香 (通用字的查詢,可借助字書工具,如CBETA漢字資料庫,教育部異體字網站等) (3)若文字本身有歧義,易使讀者對句意產生誤會者(即文字本身雖為一般字,但在此另當別解時),則標記<choice>。 例如:縣(「懸」的通假字),餉(「晌」的通假字) 標法:<choice><sic>文本原字</sic><reg resp="ddbc.da">消歧字</reg></choice> 範例:萬靈八部<choice><sic>縣</sic><reg resp="ddbc.da">懸</reg></choice>望已久 二、無unicode編碼字 (1)此字易於辨識者(不會產生懷疑的),但有通用字時,則選用其通用字,而不做任何標記。 (a) 少一撇、多一點的字:不標記(選擇用通用字)。例:播,余。(見圖一) (b) 刻版慣例,書寫習慣:不標記(選擇用通用字)。例:於,所。(見圖一) (c) 搭配前後文易於辨識者:不標記(選擇用通用字)。例:關。(見圖一) (2)此字不易於辨識者(不易讀懂,罕用字),但有通用字時,則標記<reg>。 例如:[叠*毛]=㲲。(見圖三) 標法:<reg>通用字</reg> 範例:青天飛一錫,白<reg>㲲</reg>入孤雲。 (3)此字不易於辨識者(不易讀懂,罕用字),無通用字時,則標記<g>,並需建立缺字檔。(缺字建檔方法見【附一】) 例如:[悖*力]。(見圖四) 標法:<g ref="#字圖檔名"/> 範例:頓令須彌倒卓,<g ref="#btg086026901"/><!--[悖*力]-->𣿨全枯。 ● 訛字處理 文本中的錯字,包含看似錯誤但仍照實轉錄的字,則加以修訂。 訛字修訂:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice> 範例:一切殿宇皆頹<choice><sic>圯</sic><corr resp="ddbc.da">圮</corr></choice>剝落 ● 漏字處理 文本中的缺漏字,或模糊不清的字,或難以讀懂的字,則標「省略」標記(gap)。 1)缺漏字 標法:<gap extent="1" unit="chars" reason="lost"/> 2)模糊不清的字 標法:<gap extent="2" unit="chars" reason="unclear"/> 3)難以讀懂的字(例如草書字) 標法:<gap extent="3" unit="chars" reason="illegible"/> 4)缺漏一段文字 標法:<gap extent="unknown" unit="chars" reason="lost"/> (註)extent:此指字數 ● 底本本身的刪塗、訂正字 <choice><del>刪塗字</del><add>後人訂正字</add></choice> 例:<choice><del>梦</del><add>愛</add></choice>(g014p0156) 【附一】缺字建檔 佛寺志缺字庫網頁http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq 缺字建置步驟 1. 登入缺字庫網頁,輸入缺字的位置「第幾志、第幾頁、當頁第幾個字」, 按「新增一筆」,產生一個缺字id:<glyph xml:id="">。 缺字編碼原則:btg(佛寺志)XXX(志碼3碼)XXXX(頁碼4碼)XX(序號2碼) 例如:阿育王山志第298頁第4個缺字[口*斗]的id是:btg010029804 2. <glyphName>:選擇是否為unicode編碼字,若為unicode編碼字,則採用Decimal碼。 3. <charProp>:若知其發音,則點選「再增加一個charProp」。 (1) <localName>:若知其發音,則選pronunciation。 (2) <value>:欄內填入此字之漢語拼音。例:媽ma1,嗎ma5,恰qia4 (第幾聲用數字表示一聲、二聲、三聲、四聲、輕聲 = 1、2、3、4、5) 4. <mapping type>:有common(通用字)、cbeta(CBETA組字式)、cbetaNo(CB碼)、 unicode(unicode Decimal碼)、MoEvariant(教育部異體字編碼)五種型態, 依其資料一一增加mapping填入。 5. <note>:若對此字有特殊之考查,可add a note,描述考據的結果。 例:韻 [音*貟],異體字例,部件「口、厶」俗寫多彼此相訛,凡此皆可視為異體。 6. 填寫上述資料後,按「更新資料庫」,即完成一個缺字的建置。 【附二】缺字圖檔製作 1.原則:裁切文本掃瞄檔(.tif)作為字圖。(作法如下) 2.裁切字圖步驟(利用Gimp軟體處理) (1)開啟Gimp功能表「檔案」. (2)點選「開啟」. (3)選擇缺字當頁的掃瞄圖.ex:1B001P077 (檔案路徑Y:\Projects\fosizhi\master-data\images\tif\1Book001\1B001P077) (4)放大圖片以利裁切:點選「顯示」選擇「縮放1:1(100﹪)」. (5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆). (6)將「剪裁」圖形移至缺字字體,確認位置後在選取的字框內點選滑鼠左鍵2次,即出現裁切之缺字圖檔. (7)設定圖片尺寸:點選「影像」或「圖片」選擇「縮放影像」「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 水平及垂直解析度:72像素,完成後點選下方「縮放」即完成. (8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成 (9)缺字圖檔存放位置Y:\Projects\fosizhi\images\figure\gword\ (10)缺字圖檔請通知妙妙上傳到dev. ●●缺字給 CBETA Maha製作流程 (1)請Maha幫忙製作缺字 無CB碼、無組字式 者 (2)須製作(1)的二點資訊者,於缺字介面note註明maha (3)小花再以note註明的maha 彙整送給maha (4)缺字資訊的note寫法可參考缺字介面的(8)<add a note>: 為註記資訊用 ●●缺字圖上傳 (1) FTP informations: session:fosizhi host name:10.10.0.49 user name:april password:m4tjp (2)上傳位置 從 Y:\Projects\fosizhi\images\gword\ 複製到 ftp://dev.ddbc.edu.tw/fosizhi_gwords (3)從dev 到informatics 上傳時間為一週 ●●缺字在佛寺志網頁的呈現順序? 1.組字式 2.字圖 【附三】unicode編碼字 Unihan網站 http://www.unicode.org/charts/unihanrsindex.html 1.utf字符碼CJK漢字的範圍 * utf-32:U+20000- U+2A6DF(中日韓統一表意文字擴展B區) * utf-32:U+2A700-U+2B73F(中日韓統一表意文字擴展C區) * utf-32:U+2B740- U+2B81F(中日韓統一表意文字擴展D區) * Decimal:131072以上 (以上皆屬Extension的擴展字,可直接貼在文本) 2.若unicode編碼字在Oxygen編輯器下無法直接貼上時,則先以Notepad++開啟此檔, 並於內貼上此字、存檔,然後再轉接以Oxygen繼續作業。 此時經過Notepad++轉化的此缺字,將在Oxygen以□的形式呈顯, 但此字在網頁上應已可以如實呈現。 如果此字在介面仍無法顯現,請檢查是否已安裝Undicode擴充字型 Y:\Projects\fosizhi\work\tools\字型\ext_b\PMingLiU Update Pack.msi Y:\Projects\fosizhi\work\tools\字型\hanazono\hanazono.ttf </syntaxhighlight> *台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php *別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml [[#top|回目錄]] ===空格=== 標法: 1)<space quantity="1" unit="eng_chars"/>(一個英文半形空格) 2)<space quantity="1" unit="chi_chars"/>(一個中文全形空格) 註:quantity內可填空格字數 ===印章=== 標法:<stamp>印章上的文字</stamp> 例子:乾隆御覽之寶<stamp>清乾隆玉璽</stamp> 規則: 1.文章結尾署名的印章,可用<closer>包之。 例:<closer>萬曆丁未孟夏,賜進士第定海令椘潛樊王家撰</closer> <closer><stamp>樊王家印</stamp></closer>(這是個印章) ===表格=== 表格的標記元素: <table>:以表格形式呈現、包含在直行橫列中的文字內容 <row>:包含表格中的一列 <cell>:包含表格中的一個儲存格 <cell rows="列數">:表格合併列 <cell cols="欄數">:表格合併欄 實例:請參見中國佛寺志 g089p0254 ===詩偈=== 標記元素: <lg>(行組)包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。 <l>(詩行)包含詩文的一行,也許是不完整的詩行。 <caesura/> 標記韻律詩行可能被截斷的位置。 範例: <p>...其徒理公囑余文記之,故述師行實,以此重系之以賛。賛曰:</p> <lg><l>師負衣鉢<caesura/>循乞諸方</l> <l>持律嚴甚<caesura/>懴聲揚揚</l> <l>傳法天台<caesura/>卓錫育王</l> <l>重新紺殿<caesura/>舍利增光</l> <l>緇素皈仰<caesura/>佩德難忘</l> <l>玉几雲白<caesura/>娑羅樹蒼</l> <l>忽然示寂<caesura/>眷屬徬徨</l></lg> <p>噫!我知瓶公滅此生蓮,沼花綻金,渠極樂邦。</p> 注意事項: 1) <lg>與<p>是平行的結構,故<lg>與<p>不可互包。 應結束</p>後,再標<lg>。 2) 當詩詞跨頁時,照書換頁,不用顧及排版問題。 3) 詩偈不用標逗,詩句中間的間隔,以<caesura/>標示。 ===標記問答=== Q:格式問題:是否照書編排? A:數位文本不必全照書編排。 Q:敬格的情況,有空一格,有另起一行。 A:"敬格"統一都不須空格或另起一行。 Q:並列的文字。 A:不作並列標記。可標記縮小字<seg rend="font-size:small">及加括弧以區別之。 Q:文章中小字的標法 A:<seg rend="font-size:small">(縮小的字)</seg> ps. <seg>的標法,是著重在「樣式」(小字)上的呈顯,而非「意義」上的表示。 Q:標題中的小字 A:<seg rend="font-size:small">(縮小的字)</seg>(小字文多時標此,會強制折行) <seg rend="font-size:small;display:inline">(縮小的字)</seg>(標題小字不換行) Q:若印刷錯誤,文字內容重複時。 A:可用[註]標示。但若有跨頁,頁碼要放在note的外面。 Q:文本若超出可處理的範圍,如元朝蒙語譯文。 A:可不標句讀,但須於檔頭<teiHeader>作說明。 ==標逗== 1.《》與〈〉 書名的標符樣式:《》 詩篇名標符樣式:〈〉 2.偈頌中不使用標點符號,詩句中的分隔,以<caesura/>標示。 標法:<l>詩句<caesura/>詩句</l> 範例:<lg><l>稽首觀音<caesura/>大悲之主</l> <l>我今說偈<caesura/>畧讚所以</l> <l>所以者何<caesura/>所謂三摩</l> <l>菩薩證入<caesura/>常住寶陀</l><lg/> 3.有些寺志底本有黑點(•)白點(。),是否依照原文斷句? 答:以文意暢達為要,不必照原書的黑點白點逗句。 例:g081_05_p0214英宗 <date>正統十年春</date>,<date>旣望</date>,上造藏經,送安臺山普恩禪寺。 可改為:英宗 <date>正統十年春旣望</date>,上造藏經,送安臺山普恩禪寺。
返回到「
《中國佛寺史志》標記作業
」。
導覽
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
wiki工具
wiki工具
特殊頁面
頁面工具
頁面工具
使用者頁面工具
更多
連結至此的頁面
相關變更
頁面資訊
頁面日誌