《中國佛寺史志》標記作業

出自DILA Wiki
於 2011年3月25日 (五) 19:30 由 imported>Miaomiao 所做的修訂 →‎標記總說

標記總說

1.本專案將以TEI-XML格式進行作業,對於文本中的人名、地名、時間皆加以標記
  及建置資料庫,旨在提供高質量的數位化全文。
2.數位化的文本也將加入新式標點符號。
3.文本中的難檢字將採用Unicode字符,
  若於Unicode字庫中尚未收錄的字,則將改以同義異體字代替,或者建立缺字檔。
4.TEI標記元素的型態,可大分為「意義標記」與「樣式標記」。
 「意義標記」著重在付予文字意義,例如:<persName>人名。
 「樣式標記」著重在呈現的樣貌,例如:<lb/>(折行)。
  TEI-XML標記著重於「意義標記」,而文本呈現的樣貌則多操縱於XSLT。

檔案架構

《中國佛寺史志》以「志」為單位,每一部志皆有一代碼。(例:重修普陀山志代碼g008)
每一志皆由一個主檔(例:重修普陀山志的主檔g008_main)
及數個小檔(以卷為單位,例:重修普陀山志卷一g008_01)組成。
主檔內寫有版本資訊及小檔的鍊結,小檔內則是各卷的內容。

標記說明

頁碼

1頁碼放置的位置:置於<div>與<head>之間。
 例1:<div xml:id="g008_00.xml" xmlns="http://www.tei-c.org/ns/1.0">
      <pb facs="1B009P003.jpg" n="0000a"/>
      <head resp="ddbc.da">普陀山志卷前</head>
 例2:<div>
      <pb facs="1B009P022.jpg" n="0003"/>
      <head>重修普陀志叙</head>
2版本說明頁的頁碼、卷之前無頁碼的頁碼
  格式:第一頁0000a,第二頁0000b,第三頁0000c
  例:<div>
      <pb facs="1B009P003.jpg" n="0000a"/>
      <head resp="ddbc.da">版本說明</head>
  ps.由於卷首需要一個頁碼,因此「版本說明」的頁碼會被挪移到當卷第一個<head>之前。
    (見頁碼放置的位置例1)
 
3插圖頁的頁碼
  格式:插圖前頁頁碼+a
  例:<pb facs="xBxxxPxxx n="0123a""/>

4空白頁
  需標上當頁頁碼
  例:<pb facs="1B009P043.jpg" n="0024"/>

標題

1 標題的標法

● <head>標題</head>
● <head>標題</head><byline><persName>作者</persName></byline>
● <head resp="ddbc.da">自加標題</head>
● <head>標題<seg rend="font-size:small">副標題</seg></head>

2 說明

(1)若篇章缺乏標題者,可「自訂標題」。
 自加的標題將會出現在網頁左欄的樹狀目錄結構上,並程式會自動加上括弧,
 以與文本上實有的標題區分。但自加的標題不會呈現在網頁全文化的內文中。
 文本標記的格式:<head resp="ddbc.da">自加的標題</head>
 網頁樹狀目錄所呈現的樣式:(自加的標題)
(2)標題後的副標題,可以<seg>(隨機分割)標記之。
   例:<div><head>大安禪師<seg rend="font-size:small">上堂一則 機緣二則</seg></head>
    #<seg>(隨機分割)包含文件中任何隨機字詞層次的單元(包括其他分割元素)。

3 標題亦可加新式標點符號。


人名

1 人名規範資料的建置(若欲建檔,請先以帳號密碼登入)

   ● 人名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/person/
   ● 人名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 編輯「人名規範資料庫」 
   ● 人名規範資料的問題討論,請參閱「佛學規範資料庫」答客問

2 人名標記 <xml code>標法:

    <persName key="Axxxxxx">某某某</persName>
    <persName key="unknown">未知的人名</persName>
    <persName key="Gxxxxxx">人名群組</persName>
    <roleName>稱謂</roleName>(須包在<persName>內)
    <roleName type="honorific">尊稱</roleName>(須包在<persName>內)
    <name>族姓</name>

</xml>

3 人名標記凡例

稱謂型態  凡例  標記
官稱 <ul><li>韋左司</li><li>韋應物左司</li><li>杜副校長正民</li></ul> <ul><li><persName>韋<roleName>左司<roleName></persName></li>

<li><persName>韋應物<roleName>左司</roleName></persName></li> <li><persName>杜<roleName>副校長</roleName>正民</persName></li></ul>

地名當人名 <ul><li>韋蘇州</li><li>塩官國師</li><li>臨濟</li><li>天童圓悟大師</li></ul> <ul><li><persName>韋<placeName>蘇州</placeName></persName>(指韋應物)</li>

<li><persName><placeName>塩官</placeName><roleName>國師</roleName></persName></li> <li><persName><placeName>臨濟</placeName></persName></li> <li><persName><placeName>天童</placeName>圓悟<roleName>大師</roleName></persName></li></ul>

連名 <ul><li>大鶴居士鄭文焯</li><li>花之寺僧羅聘</li><li>華陽眞人陶貞白先生宏景</li></ul> <ul><li><persName>大鶴<roleName>居士</roleName>鄭文焯</persName></li>

<li><persName>花之寺僧羅聘</persName>(不加roleName)</li> <li><persName><placeName>華陽</placeName><roleName>眞人</roleName>陶貞白<roleName>先生</roleName>宏景</persName></li></ul>

<ul><li>寒山子</li><li>殳子山夫</li><li>朱氏子</li></ul> <ul><li><persName>寒山<roleName type=”honorific”>子</roleName></persName></li>

<li><persName>孔<roleName type=”honorific”>子</roleName></persName></li> <li><persName>殳<roleName type=”honorific”>子</roleName>山夫</persName></li> <li>寂窓照禪師,俗姓<persName>鄧</persName>。(鄧,在此指其本姓)</li> <li>如堂,寂光寺僧,澂江<name>楊</name>氏子(楊,在此指其族姓)</li></ul>

<ul><li>陵兒</li></ul> <ul><li><persName>陵<roleName>兒</roleName></persName></li></ul>
<ul><li>歐陽文忠公</li><li>忠定公燮元</li></ul> <ul><li><persName>歐陽文忠<roleName type=honorific>公</roleName></persName></li>

<li><persName>忠定<roleName type=honorific>公</roleName>燮元</persName></li></ul>

<ul><li>大雄氏(指佛)</li><li>孔雀氏(指阿育王)</li><li>俞氏</li></ul> <ul><li><persName>俞氏</persName>(皆直標persName,不用標roleName)</li></ul>
師、本師 <ul><li>本師阿彌陀如來(「非人」名稱只單純標<persName>)</li></ul> <ul><li><persName>本師阿彌陀如來</persName></li>

<li><persName>阿彌陀佛</persName></li> <li><persName>阿彌陀佛</persName>如來本地</li></ul>

大士、菩薩 <ul><li>觀音大士</li><li>普賢菩薩(「非人」名稱只單純標<persName>)</li></ul> <ul><li><persName>觀音大士</persName></li>

<li><persName>普賢菩薩</persName></li></ul>

山人 <ul><li>漁洋山人</li></ul> <ul><li><persName>漁洋山人</persName></li></ul>
上人 <ul><li>悟上人</li></ul> <ul><li><persName>悟<roleName type=honorific>上人</roleName></persName></li></ul>
<ul><li>印老法師</li><li>南亭老和尚</li></ul> <ul><li><persName>印<roleName type=honorific>老</roleName><roleName>法師</roleName></persName></li>

<li><persName>南亭<roleName type=honorific>老和尚</roleName></persName></li></ul>

老人 <ul><li>南極老人</li><li>無著老人</li></ul> <ul><li><persName>南極老人</persName></li>

<li>惟我先師<persName>無著<roleName type=honorific>老人</roleName></persName>(一般稱謂、敬稱,標示<roleName>)</li> <li>別號<persName>無著老人</persName>(專稱、別號,直用<persName>)</li></ul>

<ul><li>壑翁相國(賈秋壑)</li></ul> <ul><li><persName>壑<roleName type=honorific>翁</roleName><roleName>相國</roleName></persName></li></ul>
先生 <ul><li>半農先生</li></ul> <ul><li><persName>半農<roleName type=honorific>先生</roleName></persName></li></ul>
夫人 <ul><li>許夫人</li><li>秦國夫人計氏</li></ul> <ul><li><persName><roleName>秦國夫人</roleName>計氏</persName></li></ul>
諡號 <ul><li>謚「大悟禪師」</li><li>賜號「廣慧妙悟智寶宏教禪師」</li></ul> <ul><li><persName>大悟<roleName>禪師</roleName></persName></li>

<li><persName>廣慧妙悟智寶宏教<roleName>禪師</roleName></persName></li></ul>

皇帝(皇后) <ul><li>世宗憲皇帝</li><li>梁皇</li><li>慈寧皇太后</li></ul> <ul><li><persName>世宗憲<roleName>皇帝</roleName></persName></li>

<li><persName>慈寧<roleName>皇太后</roleName></persName></li></ul>

<ul><li>筱帥</li></ul> <ul><li><persName>筱<roleName>帥</roleName></persName></li></ul>
<ul><li>須直君</li><li>葛君</li></ul> <ul><li><persName>葛<roleName type=honorific>君</roleName></persName></li></ul>
<ul><li>王諱舉(王舉)</li></ul> <ul><li><persName>王</persName>諱<persName>舉</persName></li></ul>

4 人名規範資料建檔注意事項

(1)名字:
   a)常名、別名請冠上姓氏,以便利檢索。
   b)每一語系中,應有一常名,餘則為別名。
(2)缺字:人名中有缺字時,人名欄位以通用字表示。
(3)朝代:以此人的卒年為依。
(4)籍貫:其地名朝代以此人的生年為依。
(5)生卒年
   a)生年的計算:生年=卒年-歲壽+1
   b)生卒年的取捨:若資料來源有干支年及西元年,以取干支年為準。
     例:重顯(980~1052),宋代雲門宗僧。於皇祐四年入寂。
        建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。
(6)是否為歷史人物:若非歷史人物,則在此欄位勾「否」。
(7)註解:
   a)以120個字為限(阿拉伯數字不算字數,標點符號算字數),並請使用全形標點符號。
   b)若此人查不到生卒年,則應在註解欄的資料中盡可能節錄相關人事物的時間參考點。
   c)僧人註解資料的基本要件:師承、師兄弟、著作、法嗣、事件時間。
   d)引用資料,盡量以紙本、藏經或佛學辭典為優先。
     使用網路資料時,應注意留存穩定性較高的網址;論壇及新聞網等更新率較高的網址,請斟酌引用。
   e)引用資料時須註明資料來源。出處的作用:1).說明資料來源 2).幫助使用者搜尋(Finding Aid)
   f)「佛學規範資料庫」對於經常引用的參考工具書編有「簡稱」,引用這些參考書時請以這些「簡稱」為依。
   g)Occurs in是經由「權威碼檢查」驗證、上傳後所自動產生的。
(8)若是查詢不到任何資料的人名,請不用收錄至規範資料庫。(文本上標 key="unknown" 即可)

5 人名標記規則

(1)文本中出現的人名,皆應標記。(包括書名號內的人名)
   
(2)標題後的人名是「作者」時的標法
   <head>標題</head><byline><persName key="Axxxxxx">作者名</persname></byline>
  (<byline>:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)
   
(3)遇人名不確定是否為某人時,可加屬性值標示。
   例:<persName key="A001606" cert="70%">
    cert是表示標記者認為的正確度,是相對值,非絕對的。

(4)非人,非人界皆要標記。(2011/1/27回函決議)

返三、人名

地名

1 地名規範資料的建置(若欲建檔,請先以帳號密碼登入)

 ● 地名規範資料庫網頁 http://dev.ddbc.edu.tw/authority/place/
 ● 地名規範資料建檔方式,請參閱「佛學規範資料庫」工作手冊 編輯「地名規範資料庫」 
 ● 地名規範資料的問題討論,請參閱「佛學規範資料庫」答客問

2 地名標記 <xml code>標法:

   <placeName key="xxxxxxxxxxxxxx">地名</placeName>
   <placeName key="unknown">未知的地名</placeName>
   <placeName key="xxxxxxxxxGxxxx">地名群組</placeName></xml>

3 地名標記凡例

型態 凡例 標記
單純行政區地名 杭州 <placeName key="CN0330103Z19AA">杭州</placeName>

(需配合文意而選擇朝代別)

單純自然區地名 普陀山 <placeName key="CN0330903M01AA">普陀山</placeName>
連名 四川峨眉縣 <placeName key="CN0511181Z02AA">四川峨眉縣</placeName>

(以連名的最小地點為其ID)

地名中含人名 遂賜額曰「天花尊者開巖院」 <placeName key="CN0331023T57AA"><persName key="unknown">天花尊者</persName>開巖院</placeName>
寺內建築:一般 大雄寶殿、放生池 文本不標,資料庫不建
寺內建築:具特殊意義 阿育王寺舍利塔殿 文本應標,資料庫應建
地名群組 五嶽 <placeName key="CN0000000G07AA">五嶽</placeName>

4 地名規範資料建檔注意事項

(1)地名尾碼非AA碼者,不可重新編碼,因為會牽涉到相同主碼的其他地名。
(2)Google map與衛星圖的經緯度有落差,在標經緯度時以衛星圖為主。
(3)地名的建置,註解欄注意事項請參閱4人名規範資料建檔注意事項內有關註解的條目。

5 地名標記規則

● 文本中出現的地名,皆應標記,但除了(小地名不標外)。


返四、地名

時間

1 時間規範資料的查詢(若欲查詢,請先以帳號密碼登入)

 ● 時間規範資料庫網頁 http://dev.ddbc.edu.tw/authority/time/
 ● 時間規範資料的問題討論,請參閱「佛學規範資料庫」答客問

2 時間標記

● 標法:

<date key="j+(起始時間碼)+(結尾時間碼)" notBefore-iso="起始西元年-月-日" notAfter-iso="結尾西元年-月-日">區段性的某時間</date>
<date key="j+(開始時間碼)+(結束時間碼)" from-iso="開始西元年-月-日" to-iso="結束西元年月日">事件持續進行的時間</date>
<date key="j+(當日時間碼)+(當日時間碼)" when-iso="西元年-月-日">時間點</date>
<date key="unknown">未知的時間</date>


3 時間標記凡例

時間型態 凡例 標記
區段性的某時間 余以光緒己卯游天台 <date key="j24073722407755" notBefore-iso="1879-01-22" notAfter-iso="1880-02-09">光緒己卯</date>
說明:a)key2407372:光緒己卯年正月一日ID
     b)key2407755:光緒己卯年正月三十日
     c)notBefore-iso:光緒己卯年正月一日ID
     d)notAfter-iso:光緒己卯年正月三十日
明確日期 萬曆庚戌年五月十六日 <date key="j23092772309277" when-iso="1610-06-26">萬曆庚戌年五月十六日</date>


4 時間規範資料建檔注意事項

(1)佛寺志專案使用Julian day number時間系統,請確認介面是否選用此項。
(2)若未「登入」時間規範資料庫,查詢結果將不會自動計算「初年」、「末年」等較詳細之資訊。
(3)時間的查詢有多種管道:中國年(朝代、帝號、年號、年干支),西元年(三種方式),ID碼。

5 時間標記規則

(1)可查知的時間,皆應標記;無法證知(從前後文或其他資料皆無法得知)的時間,
  則可標記<date key="unknown">未知年的時間</date>。
(2)有些時間因文本錯誤以致無法找到id,可用note註解,
  例:當穆王五十三年壬申二月十五子夜,入般涅槃
  <date key="unknown">穆王五十三年壬申二月十五子夜</date>
  <note resp="ddbc.da">據《中國史厯日和中西厯日對照表》(方詩銘、方小芬編著,上海人民出版社2007)編載,周穆王只行到四十一戊戌年(-983)。</note>
(3)初年,末年時間的擷取原則
  取當朝、當年號、當年的前1/4為其初年,末1/4為其末年。
(4)時間為民國年的查法:
 登入網頁「兩千年中西曆轉換」http://sinocal.sinica.edu.tw/
 兌換出相對應的西元時間,再到時間規範資料庫換算ID碼即可。
 例:民國壬寅年
 兌換出為西元1962年2月5日~1963年1月24日
 再到時間規範資料庫以西元年查詢為5949266~5949619
 即<date key="d59492665949619"
     notBefore="1962-02-05" notAfter="1963-01-24">
(5)時間屬性的變更:(2011.01.20)
   notBefore,notAfter,from,to,when,全要加上-iso(計算0年)
   如:notBefore-iso,notAfter-iso,from-iso,to-iso,when-iso
   例:<date key="j17207281721285" notBefore-iso="-0001-02-03" notAfter-iso="0000-08-13">哀帝元壽間</date>
(6)萬 丙子秋(=萬曆丙子秋)
   例:<date>萬 丙子秋</date>(照標時間,空格不再處理。)
(7)屬性key,notBefore,notAfter的先後順序不一,不會影響驗證或呈現。
   例:<date key="j22968992296986" notBefore-iso="1576-08-05" notAfter-iso="1576-10-31">萬曆丙子秋</date>
   =<date notAfter-iso="1576-10-31" notBefore-iso="1576-08-05" key="j22968992296986">萬曆丙子秋</date>
(8)當時間同時有年次、歲次時,可只標較詳細的歲次時間。
   例:時宣統三年,歲在<date key="j24192292419229" when-iso="1911-07-11">辛亥六月旣望</date>,長洲葉昌熾謹記
(9)時間名詞+初、末:包進時間。
    例:<date key="j22956292299967" notBefore-iso="1573-02-12" notAfter-iso="1584-12-29">萬曆初</date>
   時間名詞+初年、末年:包進時間。
    例:<date key="j22956292299967" notBefore-iso="1573-02-12" notAfter-iso="1584-12-29">萬曆初年</date>
   時間名詞+中、間、年間:不包進時間。
    例:<date key="j22956292312983" notBefore-iso="1573-02-12" notAfter-iso="1620-08-18">萬曆</date>年間
(10)清光緒末年的時間計算問題(德宗&恭宗皆以光緒為年號)
 a)光緒末年,指德宗+恭宗的年代的末1/4。
    阿賢:無法用程式計算,請各位自己計算。
 b)志偉的意見:若有數個,則取最長的那一個末年,如上則取德宗光緒的末年即可。

6 知識備忘

(1)春=農曆1-3月,夏=農曆4-6月,秋=農曆7-9月,冬=農曆11-12月
(2)農曆月份的別名
   一月:孟春、元春、開歲、端月、嘉月、正月。
   二月:仲春、杏月、麗月、如月、花月。
   三月:季春、晚春、暮春、季月、蠶月、桃月、桐月。
   四月:孟夏、麥月、陰月、梅月、純陽。
   五月:仲夏、榴月、蒲月、皋月、毒月。
   六月:季夏、暑月、焦月、荷月、荔月。
   七月:孟秋、新秋、蘭秋、蘭月、瓜月、巧月。
   八月:仲秋、竹春、桂月、壯月。
   九月:季秋、暮商、菊月、朽月、陽月、季秋。
   十月:孟冬、初冬、開冬、露月、良月、陽月。
   十一月:仲冬、辜月、葭月、龍潛月、冬月。
   十二月:季冬、殘冬、臘月、冰月、嚴月。

返五、時間

代名詞

1標法:

<ref key="Axxxxxx">人名代名詞</ref>
例:<ref key="A003940">余</ref>(余指徐時泰)

<ref key="xxxxxxxxxxxxxx">地名代名詞</ref>
例:待補

2標記時機:當詞意不明顯時才須標


返目錄

註解(ddbc.da)

1.註解內無超連結
 標法:<note resp="ddbc.da">註解文字</note>
 例:梁視<note resp="ddbc.da">視,疑爲「祖」字。</note>普通三年
2.註解內有超連結
 標法:<note resp="ddbc.da">註解文字(<ptr target="網址"/>,日期)</note>
 例:應案<note resp="ddbc.da">「案」字,萬福禪寺網站此處作「索」。
(<ptr target="http://www.huangboshan.com/zisusifu.htm"/>,2010.05.04)</note>屐而自潸。(g010p0445)
3.註解引用自CBETA資料時
 標法:<note resp="ddbc.da">CBETA經文(CBETA預設的引用格式)</note>
 例:著作郎<persName key="A010335">顧允祖</persName><note resp="ddbc.da">
  《集神州三寶感通錄》卷1:「著作郎顧胤祖」(CBETA, T52, no. 2106, p. 405, a17)</note>

其他規則:

(1)標題內的註解,請置於<head>內。
  例:<head>于黃檗丈室堂第三代隱元隆琦國師 上堂九則 機緣三則<note resp="ddbc.da">
  按:標題為上堂法語九則,機緣三則;內文實則收錄上堂法語八則,機緣五則。</note></head>


特字

● 特字處理原則:

 特殊字的處理,第一優先是尋查有無unicode編碼字(包含Ext. C),
 接著再根據文字本身或搭配前後文做判斷。
 (以下說明參照圖檔1B011P039.jpg1B009P562.jpg特字對應處理表.pdf
 一、若此字易於辨識者(不會產生懷疑的,不管是否為unicode編碼字),則不做任何標記。
    (1)少一撇、多一點的字:不標記(選擇用通用字)。例:播,余。
    (2)刻版慣例,書寫習慣:不標記(選擇用通用字)。例:於/扵,所。
    (3)搭配前後文易於辨識者:不標記(選擇用通用字)。例:關,賴。
    
 二、若此字不易於辨識者(不易讀懂,罕用字,異體字,古體字),則:
    (1)有unicode編碼字,亦有通用字時。例:[㝎=定][銕=鐵][厺=去][灋=法]
       標法:<choice><orig>文本原字(unicode)</orig><reg resp="ddbc.da">通用字</reg></choice>
       範例:優曇華發<choice><orig>㝎</orig><reg resp="ddbc.da">定</reg></choice>中香
      (通用字的查詢,可借助字書工具,如CBETA漢字資料庫,教育部異體字網站等。)
      
    (2)無unicode編碼字,有通用字時。例:[叠*毛]=㲲
       標法:<reg>通用字</reg>。
       範例:無價白<reg>㲲</reg>殮金色身
    (3)無unicode編碼字,亦無通用字。例:[革*代]
       標法:<g ref="#btgzzzppppnn"/>(並需建立缺字檔)
       佛寺志字圖檔命名原則:#btg+志碼3碼+頁碼4碼+序碼2碼(序碼:此頁第幾個缺字)
       範例:捫蘿雲在<g ref="#btg010052801"/>,汲井月隨繩。
 三、若文字本身有歧義時,即文字本身雖為一般字,但在此另有別義,易使讀者對句意產生誤會者。
    例:[縣;懸][餉;晌]
    標法:<choice><sic>文本原字</sic><reg resp="ddbc.da">消歧字</reg></choice>
    範例:萬靈八部<choice><sic>縣</sic><reg resp="ddbc.da">懸</reg></choice>望已久
    範例:<choice><sic>餉</sic><reg resp="ddbc.da">晌</reg></choice>刻而返


● unicode編碼字

 Unihan網站 http://www.unicode.org/charts/unihanrsindex.html

1.utf字符碼CJK漢字的範圍

 * utf-32:U+20000- U+2A6DF(中日韓統一表意文字擴展B區)
 * utf-32:U+2A700-U+2B73F(中日韓統一表意文字擴展C區)
   Y:\Projects\fosizhi\work\tools\字型\ext_c\n3190.pdf
 * utf-32:U+2B740- U+2B81F(中日韓統一表意文字擴展D區)
   Y:\Projects\fosizhi\work\tools\字型\ext_d\ExtensionD
 * Decimal:131072以上
  (以上皆屬Extension的擴展字,可直接貼在文本。) 

2.若unicode編碼字在Oxygen編輯器下無法直接貼上時,則先以Notepad++開啟此檔,並於內貼上此字、存檔,

  然後再轉接以Oxygen繼續作業。此時經過Notepad++轉化的此缺字,將在Oxygen以□的形式呈顯,
  但在網頁上應已可以如實呈現。
  如果此字在介面仍無法顯現,請檢查是否已安裝Undicode擴充字型
  Y:\Projects\fosizhi\work\tools\字型\ext_b\PMingLiU Update Pack.msi
  Y:\Projects\fosizhi\work\tools\字型\hanazono\hanazono.ttf


● 缺字圖檔處理【Erica】

1.原則:裁切文本掃瞄檔(.tif)作為字圖。(作法如下)

2.裁切掃瞄檔製作字圖步驟(利用Gimp軟體處理)

  (1)開啟Gimp功能表「檔案」.
  (2)點選「開啟」.
  (3)選擇缺字當頁的掃瞄圖.ex:1B001P077
    (檔案路徑Y:\Projects\fosizhi\master-data\images\tif\1Book001\1B001P077)
  (4)放大圖片以利裁切:點選「顯示」選擇「縮放1:1(100﹪)」.
  (5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆).
  (6)將「剪裁」圖形移至缺字字體,確認位置後在選取的字框內點選滑鼠左鍵2次,即出現裁切之缺字圖檔.
  (7)設定圖片尺寸:點選「影像」選擇「縮放影像」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
  (8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成


● 建立缺字檔【Erica】

 佛寺志缺字庫網頁http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq
(1)缺字檔名編碼原則: btg086(志名)0327(頁碼) 01(第幾個缺字)。
   目錄缺字id:btgcal(目錄)XXXX(頁碼)XX(第幾個)
(2)登入佛寺志缺字庫網頁
(3)取碼目的:取得缺字碼<g ref="#btg086001701"/>標記內文及建置缺字組
(4)建置步驟說明:
  (a)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (b)產生缺字id後,即可輸入缺字資訊(如e).
(5)完成後,按「更新資料庫」.
(6)輸入缺字資訊須知,說明如下:
  (a)<glyph xml:id="btg086033701">: 為缺字id碼。
  (b)<glyphName>: 為unicode編碼。
     ●到 unicode網站 找cjk(Decimal)之下方編碼,例如:CJK IDEOGRAPH 15181
     ●其cjk(Decimal)之編碼=<mapping type="unicode">15181</mapping>
     ●若查無unicode編碼資料,請點選「Non Unicode Character」即可.
  (c)<charProp>: 標記<value>發音。
     ●到 漢語拚音字典 找漢語拼語,一律小寫,第幾聲用數字表示(一聲、二聲、三聲、四聲、輕聲 = 1、2、3、4、5),不知發音者以問號表示。
     ●<charProp>表示字的屬性、表達方法。比如說注音、發音。
  (d)<mapping type="cbeta">: 為組字式。
     ●組字方式均由 CBETA maha 統一組字,請參閱 CBETA漢字庫 打通用字或組字式以獲得組字式與CB碼。
  (e)<mapping type="cbetaNo"> : 為cbeta的CB碼。
     ●若查無CB碼資料,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入 maha 字樣即可.再以一志為單位,統一由程式人員:小花 處理.
     ●若 CBETA maha 回覆不收錄至CBETA漢字庫時,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入<不收錄至CBETA 漢字資料庫>字樣即可.
  (f)<mapping type="unicode"> : 為unicode編碼。
     ●Mapping說明:<mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、組字式、unicode碼。cjk與Unicode(id=decimal)的關係猶如cjk=一年甲班,Unicode=10號。
  (g)<mapping type="MoEvariant"> : 為教育部異體字編碼。
     ●到 教育部異體字網頁 找編碼。例如:b02420-001
     ●注意:沒有Undicode的字才要登錄教育部異體字編碼。
  (h)<add a note>: 為註記資訊用
     ●輸入 maha 字樣 : 申請缺字收錄至CBETA 漢字資料庫。目的:索取CB碼及組字式。
     ●maha回覆訊息後,提供註記「不收錄至CBETA漢字庫」或「這是BIG5系統字「丱」資訊用。
(5)完成後,按「更新資料庫」.

 ●●缺字給 CBETA Maha製作流程
(1)請Maha幫忙製作缺字 無CB碼、無組字式 者
(2)須製作(1)的二點資訊者,於缺字介面note註明maha
(3)小花再以note註明的maha 彙整送給maha
(4)缺字資訊的note寫法可參考缺字介面的(8)<add a note>: 為註記資訊用

 ●●缺字上傳
  (1) FTP informations:
      session:fosizhi
      host name:10.10.0.49
      user name:april    
      password:m4tjp

  (2)上傳位置  
     從 Y:\Projects\fosizhi\images\gword\
     到 0:/fosizhi/public_html/gword/

  (3)從dev 到informatics 上傳時間為一週

 ●●缺字在佛寺志網頁的呈現順序?
   1.組字式
   2.字圖

*台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
*別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml

● 勘字處理

勘字標法:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>

       <sic>:包含看似錯誤但仍照實轉錄的文本。
       <corr>:(更正)包含文本中看似錯誤並加以更正過後的文字。

例子:一切殿宇皆頹<choice><sic>圯</sic><corr resp="ddbc.da">圮</corr></choice>剝落


● 漏字處理

漏字標法:

1)<gap extent="1" unit="chars" reason="lost"/>(例如文本中的一個漏字)
2)<gap extent="2" unit="chars" reason="unclear"/>(例如文本中的二個模糊不清的字)
3)<gap extent="3" unit="chars" reason="illegible"/>(例如三個草書字,字跡清楚,但不知為何字)?
4)<gap extent="unknown" unit="chars" reason="lost"/>(漏字無法估計字數時)
  (註)extent:此指字數


空格

1)<space quantity="1" unit="eng_chars"/>(一個英文半形空格) 2)<space quantity="1" unit="chi_chars"/>(一個中文全形空格)

 註:quantity內可填空格字數


印章

*印章標記:<stamp>包含一個字詞,描述一個印記或是類似圖案。
 例:乾隆御覽之寶<stamp>清乾隆玉璽</stamp>


表格

*表格
 表格標記元素:<table>、<row>、<cell>
 表格合併列:<cell rows="列數">
 表格合併欄:<cell cols="欄數">
*例1(g089p0254)

<table> <row><cell rows="2">一、約部義</cell><cell>前四時</cell><cell>筌罤</cell></row> <row><cell>今法華</cell><cell>魚兔</cell></row> <row><cell rows="2">二、約教義</cell><cell>前三教</cell><cell>筌罤</cell></row> <row><cell>今圓教</cell><cell>魚兔</cell></row> <row><cell rows="2">三、約解義</cell><cell>言說教</cell><cell>筌罤</cell></row> <row><cell>契妙理</cell><cell>魚兔</cell></row> <row><cell rows="2">四、約行義</cell><cell>玄句開解</cell><cell>筌罤</cell></row> <row><cell>止觀立行</cell><cell>魚兔</cell></row> <row><cell rows="2">五、約玄義</cell><cell>釋名宗用教</cell><cell>筌罤</cell></row> <row><cell>諸部經體</cell><cell>魚兔</cell></row></table>

*例2(g089p0254)

<table> <row><cell>一、漸中開四</cell><cell cols="4">如破他宗,不識教體之妨,謂法華是漸圓,華嚴是頓圓。</cell></row> <row><cell>二、方等中四</cell><cell cols="4">四教並談曰方,四機普被曰等。</cell></row> <row><cell rows="4">三、別教𥪡<!--[竪]-->入四</cell><cell>十信</cell><cell rows="4">修</cell><cell>生滅四諦</cell><cell>藏</cell></row> <row><cell>十住</cell><cell>修無生四諦</cell><cell>通</cell></row> <row><cell>十行</cell><cell>修無量四諦</cell><cell>別</cell></row> <row><cell>十向</cell><cell>修無作四諦</cell><cell>圓</cell></row> <row><cell>四、十行橫學四</cell><cell cols="4">別教十行化他心切,橫出四四一十六門。</cell></row> <row><cell rows="4">五、涅槃追泯四</cell><cell cols="3">生生不可說</cell><cell>藏</cell></row> <row><cell cols="3">生不生不可說</cell><cell>通</cell></row> <row><cell cols="3">不生生不可說</cell><cell>別</cell></row> <row><cell cols="3">不生不生不可說</cell><cell>圓</cell></row> <pb facs="3B008P275.jpg" n="0254"/> <row><cell>六、涅槃追說四</cell><cell cols="4">有因緣故亦可得說,四句如前,但義同施權,卻更分別前四教也。</cell></row> <row><cell>七、法華施出四</cell><cell cols="4">從法華實理施四時三教,權理明無量義,從一清淨道施出二三四。</cell></row> <row><cell>八、法華開顯四</cell><cell cols="4">開四時三教,歸今法華,收多歸一也。</cell></row></table>


詩偈

● <lg><l>的注意事項
  <lg>與<p>是對等地位,故巢狀結構<lg>與<p>不可互包。應結束</p>後,再標<lg>。
● 當詩詞跨頁時,照書換頁,不用顧及排版問題。
● <caesura> 標記韻律詩行可能被截斷的位置。


標記問答

Q:格式問題:是否照書編排?
A:數位文本不必全照書編排。

Q:敬格的情況,有空一格,有另起一行。
A:"敬格"統一都不須空格或另起一行。

Q:並列的文字。
A:不作並列標記。可標記縮小字<seg rend="font-size:small">及加括弧以區別之。

Q:文章中所有小字的標法?
A:<seg rend="font-size:small">(縮小的字)</seg>
   ps. <seg>的標法,是著重在「樣式」(小字)上的呈顯,而非「意義」上的表示。

Q:若印刷錯誤,文字內容重複時。
A:可用[註]標示。
例:<note resp="ddbc.da">此段重複「文本重複的文字」</note>
   但若有跨頁,頁碼要放在note的外面。

Q:文本若超出可處理的範圍,如元朝蒙語譯文。
A:可不標句讀,但須於檔頭<teiHeader>作說明。

Q:
A: