「名山古剎-《中國佛寺史志》數位典藏」:修訂間差異

出自DILA Wiki
imported>April
imported>April
行 1,101: 行 1,101:
<syntaxhighlight lang="XML">
<syntaxhighlight lang="XML">


14. 皇明觀志metadata( 秀麗,99.03.10   小花)
1. 佛寺志網路版文本搜尋有問題。例如:g077尋找諸大道,但出現之頁碼數字是其他寺志的頁碼。( 玉蕙 99.03.10 小花)


2.皇明觀志metadata(秀麗,99.03.10  小花)


1. 元衡平搜尋不到(april,99.02.04  小花)


2. search過後的html, 因hightlight的關係,導致人名的字下線過長。(Sophia 2-08)( 小花)
3. 元衡平搜尋不到(april,99.02.04  小花)


3.檢視table 的匡線,cell 內若有gloss,網頁呈現上有雙隔線,需拿掉。(Sophia 2-10 小花)
4. search過後的html,因hightlight的關係,導致人名的字下線過長。(Sophia 2-08)(小花)
 
5.檢視table 的匡線,cell 內若有gloss,網頁呈現上有雙隔線,需拿掉。(Sophia 2-10 小花)
http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g009&cpage=0435
http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g009&cpage=0435


   目錄匡線無法移動。(Sophia 3-9)
   目錄匡線無法移動。(Sophia 3-9)


4.佛寺志電腦文本中點入「朝代時間」標記,出現之時間規範資料庫視窗,可移動及關閉的部份不在電腦螢幕視窗之內,因此,無法關閉或移動。〈玉蕙 2010.03.02 小花〉
6.佛寺志電腦文本中點入「朝代時間」標記,出現之時間規範資料庫視窗,可移動及關閉的部份不在電腦螢幕視窗之內,因此,無法關閉或移動。〈玉蕙 2010.03.02 小花〉
 
7.佛寺志電腦文本g017卷二中文字幕變成英文。《玉蕙 2010.03.02 simon》
 
8.佛寺志介面(april 99.03.08 小花)
9.缺字流程 (april 99.03.08 各位同仁)
 


5.佛寺志電腦文本g017卷二中文字幕變成英文。《玉蕙 2010.03.02 simon》


6.佛寺志介面(april 99.03.08 小花)


7.《昌國典詠》書名內的地名,是否需標記?(Sophia 2-23)
10.《昌國典詠》書名內的地名,是否需標記?(Sophia 2-23)


8. 討論:敬格標記
11. 討論:敬格標記
<gap extent="1" unit="chars" reason="respect"/>
<gap extent="1" unit="chars" reason="respect"/>
<space quantity="1" unit="chi_chars" reason="respect"/>(miao,2.23)
<space quantity="1" unit="chi_chars" reason="respect"/>(miao,2.23)
 若以此<space quantity="1" unit="chi_chars" reason="respect"/>為標記,schema無法通過驗證(秀麗)
 若以此<space quantity="1" unit="chi_chars" reason="respect"/>為標記,schema無法通過驗證(秀麗)


9.缺字流程 (april 99.03.08 各位同仁)
 
10.電腦維修責任歸屬  (april 99.03.08 各位同仁)
12.電腦維修責任歸屬  (april 99.03.08 各位同仁)
11. 妙妙與馬老師解讀文本的時間 (april 99.03.08 妙妙)
13. 時間正確的id請有,請修改文本 (april 99.03.08 各位同仁)
12. 時間正確的id請有,請修改文本 (april 99.03.08 各位同仁)
14. 妙妙與馬老師解讀 文本的 時間 (april 99.03.08 妙妙)
13. 佛寺志網路版 文本 搜尋有問題。例如:g077尋找諸大道,但出現之頁碼數字是其他寺志 頁碼。( 玉蕙 99.03.10 小花)
 





於 2010年3月10日 (三) 13:39 的修訂

名山古剎-《中國佛寺史志》數位典藏工作手冊

Archive of Buddhist Temple Gazetteers

簡介及目的

在中國佛教史料中,佛寺志是一種獨特而重要的文獻,它也是地方志或地方性歷史文獻之一。其主要內容在於:佛寺歷史沿革,建築、建設,高僧傳記、法語詩偈,法脈傳承,感應事跡等,亦有兼及佛寺所在地之地理、人文、風俗的記載,及地圖、建物圖、人像等。通常是由對區域、城市及寺院研究有興趣的學者所編寫,因此此類文獻乃收集各種文本編輯而成。本專案的研究目的,除將佛寺志的珍貴史料數位典藏,廣為流傳之外,並將進行相關佛寺志的書目研究和標記作業,使之成為研究中國佛教歷史不可或缺的數位文獻。適逢財團法人中華佛學研究所推動「漢傳佛教之歷史與教義」研究,本專案有幸獲得該研究經費贊助,執行期間從2008年1月至2010年12月。 有關佛寺志的收集,主要來源為20世紀所印刷的兩套木刻版:


   * Zhongguo Fosi Shizhi Huikan 中國佛寺史志彙刊. Taipei, 1980-1985. Compiled by Du Jiexiang 杜潔祥. 110 vols
   * Zhongguo fosizhi congkan 中國佛寺志叢刊. Hangzhou: Guangling shushe 廣陵書社 2006 . Compiled by Zhang Zhi 張智. 130 vols.

本專案預計於2010年之前,將完成超過200座寺志的數位化作業,並公開圖檔資料提供大眾免費使用,其中,至少有12座寺志將提供加上人物、時間與地點標記的數位化全文,同時,在本專案中所識別的人物、時間與地點之資料,將與其他專案的相同資料一併整合至本校「佛學規範資料庫Buddhist Authority Database」(http://authority.ddbc.edu.tw/)之中。除此之外,本專案至2011年之前,將完成相關佛寺志書目研究和標記作業,以提升本典藏之應用價值。

預算及人力

此專案預計執行年度為97~99,共計3年,由中華佛學研究所贊助。

第一年經費NT$57,000

第二年經費NT$1,094,942

第三年經費NT$1,024,380

人力:

程式設計 1人

時程控管 1人

目錄及經緯度建立 1人

標記人員 3人

後設資料建置人員 1人

義工 1人

執行單位:數位典藏組

進度及預算控管:柯春玉. 程式及介面撰寫:花金地. 標記:林智妙、游美燕、彭川芩、何易儒、王秀雯.林綉麗 權威資料庫:闕慧貞.葛賢敏

工具、資料路徑與操作技巧

工具

* 「方正apabi中國工具書資源全文數據庫」可用到99.04.15 http://reference.apabi.com/overseas/?cult=TW 
* 中國古代地名大詞典  http://www.gg-art.com/dictionary/index_b.php?bookid=33
* 法鼓愛搜尋 http://isearch.ddbc.edu.tw/ 
* 缺字流程:Y:\Projects\fosizhi\work\缺字處理
* 缺字介面:http://dev.ddbc.edu.tw/tomcat/exist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq
* Authority書籤:http://share.foxmarks.com/folder/rss/osyCa6r9nX
* 組字式規則 http://www.cbeta.org/data-format/rare-rule.htm 
* 中國大陸各省地方志書目查詢系統:http://webgis.sinica.edu.tw/place/
* CBETA 字辭典資料網(有big5的字代表可以打得出來,故不用組字式及給CB碼)
   http://dict.cbeta.org/word2/search.php
* oclc查詢系統(查詢書籍用) http://www.worldcat.org/search?q=%E4%B9%9D%E8%8F%AF%E5%B1%B1%E5%BF%97&fq=dt%3Abks&dblist=638&qt=first_page 
* 在線新華字典 http://xh.5156edu.com/html4/8952.html
* 標點符號用法  CBETA  http://www.cbeta.org/xb/table.htm
   教育部 http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo
* 出版物標點符號用法規範:Y:\Projects\fosizhi\work\tools
* 缺字查詢介面(維博士提供)維博士的缺字查詢網址: http://app.kita.zinbun.kyoto-u.ac.jp/ids-find
* 漢字檢索工具 http://mousai.kanji.zinbun.kyoto-u.ac.jp/ids-find     
* unicode 網址: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6b35
* 漢語拼音: http://www.iq-t.com/SYSCOM/pingying2.asp
* 文字轉拼音工具-1: http://tdc.putonghuaonline.com/tools2.html
* 文字轉拼音工具-2: http://www.iq-t.com/SYSCOM/pingying2.asp
* 繁簡轉換工具: http://tdc.putonghuaonline.com/tools3.html
* 教育部異體字字典:  http://dict.variants.moe.edu.tw/suo.htm
* 《重訂標點符號手冊》查詢網址:  http://www.edu.tw/files/site_content/M0001/hau/haushou.htm#suo
* 國語辭典:http://dict.revised.moe.edu.tw/index.html
* 漢典:http://www.zdic.net/
* 查詢書法字體(請輸入簡體檢索字):http://mail.google.com/mail/?hl=zh-TW&utm_source=zh-TW-et-more&utm_medium=et&utm_campaign=zh-TW&shva=1#sent/123071b89c999916
* TEI: http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/REF-ELEMENTS.html
*漢籍文獻資料庫 (二十五史)http://dbo.sinica.edu.tw/~tdbproj/handy1/index.html?
* 呼嚕嚕 hoolulu:http://www.hoolulu.com/core_zh/
* 宋史研究網:  http://www.ihp.sinica.edu.tw/~twsung/scholar/scholarframe.html
* 宋史檢索: http://www.ihp.sinica.edu.tw/~twsung/search/search.html
* MapABC地圖搜索:http://www.mapabc.com/localsearch.shtml
* Google地圖:http://ditu.google.com/
* 搜狗Sogou地圖:http://map.sogou.com/new/#c=13222250,3747750,11
* 維基百科:http://zh.wikipedia.org/w/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh-hant
* 法鼓維基首頁:http://wiki.ddbc.edu.tw/pages/%E9%A6%96%E9%A0%81
* 批次改檔名工具:UltraRename28b.exe
* 批次改檔名路徑J:\CND\Projects\2008BTG佛寺志\work\工具\UltraRename28b.exe 
* 同文堂(僅限Firefox網頁使用下載-簡繁體轉換):http://of.openfoundry.org/projects/333/download
* 復旦版歷史地名資料庫有歷史地名釋文  http://yugong.fudan.edu.cn/Chgisii/CHGIS_PII.asp
* cbeta網站 http://www.cbeta.org/download/cbreader.htm
* 台北版佛典集成 缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
* 字符編碼理解  http://www.donews.net/holen/archive/2004/11/30/188182.aspx
* 全字庫  http://www.cns11643.gov.tw/web/index.jsp
* UTF-8維基百科  http://zh.wikipedia.org/w/index.php?title=UTF-8&variant=zh-tw
* Unicode維基百科  http://zh.wikipedia.org/w/index.php?title=UTF&variant=zh-tw
* 十六進位維基百科  http://zh.wikipedia.org/w/index.php?title=十六進制&variant=zh-tw 
* 中研院中華文明之時空架構 http://ccts.ascc.net/framework.php?lang=zh-tw
* 吳疆教授(亞利桑那大學東亞研究所,對中國佛寺志有鑽研)
    網址:  http://bgis.coh.arizona.edu/ 
    聯絡信箱: jiangwu@email.arizona.edu

資料路徑

 ● 佛寺志逢甲網址 http://buddhistinformatics.ddbc.edu.tw/fosizhi/ui.html
 ● 佛寺志本校網址 http://dev.ddbc.edu.tw/fosizhi/index.html
 ● 修改後的資料上傳fosizhi/amituofo
 ● FTP上傳:名稱 fosizhi, 主機地址 dev.ddbc.edu.tw
 ● 清除折行多餘空格程式(doConcat.py):Y:\Projects\fosizhi\work\tools\cleanBK
 ● 缺字輸入介面 http://dev.ddbc.edu.tw/eXist/rest/db/fosizhi/xq/gaiji_input/gaiji.xq?#g000020
 ● 節點頁面網址: http://dev.ddbc.edu.tw/fosizhi/proxy2eXist.php?getTreeJson=yes
 ● 總目錄標記問與答,存放路徑  J:\CND\Projects\2008BTG佛寺志\work\標記\目錄\目錄標記問與答.odt
 ● 佛寺志作業時程 http://spreadsheets.google.com/ccc?key=py-MCl83eYhHl-WYd8FBcFA&hl=zh_TW
 ● 掃瞄檔 http://10.10.1.11/Temple_Gazetteers_Tiff/      密碼:tg_project
 ● 佛寺志專案工作檔: J:\CND\Projects\2008BTG佛寺志\work\
 ● 工作時數登記表  J:\CND\Projects\2008BTG佛寺志\行政\人事\工讀金\
 ● DDBC 檢索網址 http://isearch.ddbc.edu.tw/
 ● 人名、地名、時間權威檔login: http://authority.ddbc.edu.tw/login.html
 ● 人名權威檢索查詢:http://dev.ddbc.edu.tw/authority/person/ 
 ● 地名權威檢索查詢: http://dev.ddbc.edu.tw/authority/place/
 ● 時間權威檢索查詢: http://dev.ddbc.edu.tw/authority/time/
 ● 權威檔修改-Google文件:http://spreadsheets.google.com/ccc?key=p0_E_fq5EftFcnelXEWe6Jw&inv=chueh.huichen@gmail.com

操作技巧

   幾個快捷技巧:
   Alt+ Tab  切換文件
   Ctrl+ R   html重新整理
   在Oxygen下:
   Ctrl+ E   下標記
   Ctrl+Shift+ V  valid
   Ctrl+Shift+ W  well form
   Ctrl+Shift+ <  加註;取消註
   在Oxygen xpath下:(Perspective → Show Toolbar → XPath)
   //pb → 找所有<pb>(同理可推:找placeName---)
   //pb[@='0100'] → 找第100頁
   //persName[.='名字'] → 找出某人名
   使xml文件標記元素、屬性呈現中文化解說的方法
   在xml文件內
   →點選功能列上Document
   →XML Document
   →Associate Schema
   →RelaxNG Schema(Compact syntax),URL選用新的Schema
   →ok
   之後,就會在文件上看到新增的聯繫<?oxygen RNGSchema="../../schema/gazetteers.rnc" type="compact"?>
   而後,標記時,當打上角括,其所出現的元素表,每一個元素都會有中文解釋。或者,將游標移到元素或屬性上時,也會出現中文解釋。

返工具

觀念

1. 標記前先找該本的相關資訊,例如是否有白話本,是否已有標句好的文本等 2. 凡用電腦可一併處理的,就不一一標記

執行步驟

叢書目錄及地理資訊建立

叢書目錄

1. 明丹本共110冊,廣陵本共130冊之目錄,檔案路徑:

Y:\Projects\fosizhi\gazetteerXml\catalog\gazetteerCatalog.xml

2. 明丹本與廣陵本版本分析,檔案路徑如下列:

Y:\Projects\fosizhi\gazetteerXml\catalog\catalogGazetteers_main.xml

地理資訊

1. 明丹本檔案路徑:

Y:\Projects\fosizhi\gazetteerXml\catalog\gazetteerKMLzfsh.xml

2. 廣陵本檔案路徑:

Y:\Projects\fosizhi\gazetteerXml\catalog\gazetteerKMLzfc.xml

外包打字及轉加粗標

 ● 外包打字前置作業(春玉)
   影印文本:標記用
 ● 外包打字(以掃瞄檔給打字公司,不用給影印本)
   檔案路徑:
 1.https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4idGtaOUJWdldPcy1IclNpN1hmTi1YNlE&hl=zh_TW
 2. https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AuvdMMzuEgeWcHktTUNsODNlWWhIbC1XWWQ4RkJjRkE&hl=zh_TW
 ● 轉粗標:H, pb, P(春玉、小花)

掃瞄

   * 選擇掃瞄檔案儲存為Tiff
   * 解析度為400dpi 像素是 1945x2992
   * 8 bits 灰階。( 不是黑白 )
   * Tiff 轉 jpg(網頁用)
   * Jpg 為 Tif的4/1 像素是 486x768
   * jpg檔加浮水印
   * 切邊
   * 明丹本掃瞄明細:https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4idGtaOUJWdldPcy1IclNpN1hmTi1YNlE&hl=zh_TW
   * 廣陵本掃瞄明細:https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AvNiyYs1TA4icDJXeXRzRF9JNHJUcW5aczR0a1JaRnc&hl=zh_TW
   * 檔案:  Y:\Projects\fosizhi\images\
   * 處理人員:伯雍

Metadata 建置

* 建立掃瞄 Tiff 數位圖檔的 Metadata
* 一本佛寺志各頁的掃瞄圖檔放在同一資料夾
* 一本佛寺志掃瞄圖檔資料夾對應一個 Metadata 的檔案
* Metadata檔案內依序記錄每張掃瞄圖檔之資訊
* 每張圖檔資訊記於一組<div></div>
* 檔案放在: Y:\Projects\fosizhi\gazetteerTxt\
* 處理人員:家名,秀雯,琇麗,小花
 
舉例如下:

<div n="1Book005/1B005P011">
<list>
<item n="1">1B005P011</item>
<item n="2">內文</item>
<item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
<item n="4">g006p0978</item>
<item n="5">放生池</item>
</list>
</div>

內容說明:

 <item n="1">1B005P011</item>
  1)指數位圖檔的檔名。
  2)每一頁都有一個數位圖檔。

 <item n="2">內文</item>
 1)志文分成5個分類:a)書名頁或題詞 b)版本說明 c)杜目錄 d)內文 e)圖 f)空頁。

    注意:a)古文內的目錄,分類屬"內文",標題則作"目錄"。
      (因古籍內的目錄有頁碼,屬古籍內文的一份部,頁碼為g***p****。)
      b)杜潔祥編的目錄改為"杜目錄",以與"古籍內的目錄"以為區別。

 <item n="3">金陵梵刹志-金陵梵刹志卷二十二-放生池記</item>
  1)每頁的標題。
  2)以「-」(dash)表達漸層關係。
  3)以「/」(slash)隔開同一頁上的不同標題。
  4)若是空白頁,無標題,以”none”表示。

 <item n="4">g006p0978</item>
  1)頁碼:前3碼為志碼,後4碼為內文本身的頁碼。
  2)頁碼種類如下:

    a)書名頁頁碼(f+1碼數字):g***f*
    b)版本說明頁碼(無頁碼):g***p0000a   
    c)目錄頁碼(c+3碼數字):g***c***
    d)內文頁碼(p+4碼數字):g***p****
    
  注意:1)頁碼都以小寫表達,組成方式是:[志碼+頁碼]
       2)若插圖無頁碼,則以[前一頁的頁碼+英文字母]。
       3)需另外記錄插圖的數目,以作統計使用。
     4)無頁碼的編碼原則:前一頁頁碼+英文字母。

         a)舉例:

           g***p0011
           無頁碼-----------則編為:g***p0011a
           g***p0012

          b)版本說明,因無前一頁,故編為:g***p0000a  

 <item n="5">放生池</item>
  1)"可辨識"的前三個字,從每一頁的右上角數過來。
  2)若無前3個字,如空白頁,則以"none"表示。
  3)若遇糢糊不清的字,則向下遞補,取可辨識的字。(Sophia 10-14-2009 updated according to小花's saying.)

  注意:
  1)每一個數位檔都需對照文本,以確定數位檔沒有lost,
    若有任何一個lost,則後面所有的metadata資料無法與圖檔對照起來。
  2)若有數位檔檔lost的部份,請與伯雍聯繫,請他更正補上。

 缺字
 1)至cbeta漢字工具,教育部異體字網站,unicode查找。
 2)若無法貼上,需作缺字庫。(待續)

 完成檔案
 1)以.txt 存於 Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff
   與佛寺志的數位圖檔放在一起。
 2)每一個資料夾對應一個Metadata的檔案。
 3)資料夾 1Book001 表佛寺志第一輯的第一本數位圖檔,對應1Book001.txt
   (updated by Sophia 2009-06-25)


Metadata 問題與解答

1.目前的 type (書名頁;版本說明;目錄;內文),是否還要再加一個 "圖"的type?---可,
  type多增加一個圖&空頁
2. 若內文的漸層超過 3 個以上,是否只取前 3 個即可?---越詳細越好(make sense)
3. 前3個字若有一字印刷模糊或者難以辨識,是否可跳過?----以[?]表示
4.版本說明及內文插圖無頁碼?
 版本說明的頁碼:g***none; 內文插圖的頁碼:none (不作g,以跟版本說明作區別)(110冊約只有3~4個無頁碼)
5.若是空白頁,標題及末3個字處,統一以"none"表示。

返目錄


metadata 檔案匯入MIX標記架構內

MIX架構含:head, mix, map
處理人員:小花

標記(含電校、句逗、轉html及檢查等)

標記明細: https://spreadsheets.google.com/a/ddbc.edu.tw/ccc?key=0AuvdMMzuEgeWcHktTUNsODNlWWhIbC1XWWQ4RkJjRkE&hl=zh_TW

 
  *  卷前之【版前說明】或【卷前圖說】均放置g0××_00.xml檔案裡,以<div></div>包起來.(Erica;2009/01/19)
 
  *  卷前之【無頁碼】 標法為<pb facs="1B020P003.jpg" n="0000a"/>(Erica;2009/01/19)

標記重點:人名、地名、時間

1. 建置說明請參照凡例: 專案整合權威資料庫工作手冊

2. 查找不到的人名、地名,可以用key="unknown"標示。

(1)人名<persName>
文獻查詢順序:1)宋僧錄 2)疑年錄 3)佛百、佛光 4)Authority所提供的其他參考書目 5)網路資訊(請參照「專案整合規範資料庫」工作手冊 工作手冊1.編輯格式之第6項目說明)

●人名標記:<persName key="AXXXXXX">某某某</persName>

  說明:
  例一:今司寇平湖陸杲公來游茲山,瞻禮舍利。
  今司寇平湖<persName key="A004257">陸杲</persName>公來游茲山,瞻禮舍利。
  例二:明慧廣禪師,俗姓姚,諱讓義,梁溪人。年三十祝髮為沙門,法名真緣,道號慧廣。
  明<persName key="A007784">慧廣</persName>禪師,俗姓姚,諱<persName key="A007784">讓義</persName>,梁溪人。年三十祝髮為沙門,法名<persName key="A007784">真緣</persName>,道號<persName key="A007784">慧廣</persName>。

●人名規範資料庫建檔

須先申請帳號密碼
  *查詢人名id碼:"人名規範資料庫" http://authority.ddbc.edu.tw/person/
  *新增人名id碼:"人名規範資料庫維護" http://authority.ddbc.edu.tw/welcome.php
※人名規範資料庫建檔方式,請參閱 DDBC_wiki 「專案整合規範資料庫」工作手冊  建置「人名規範資料庫」

● 人名群組的標法

 <persName key="G000001">...</persName>

● 人名規範資料建檔注意事項

 ※人名規範資料,生卒年、籍貫欄位應填ID碼。
 ※註解欄中則不複註上方欄位(別名、生卒年、籍貫)中的資料,但有疑異者可記錄於註解欄中。
 ※人名規範資料中,常名要冠姓。
   別名(字、號)不必一定冠姓,僧人不必一定冠釋。(依文本)
 ※人名規範資料,人名中有缺字時,人名欄用通用字表示,並在註解中說明。
   例:人名:大[金*本] 註解欄:{大[unicode code]}
 ※人名規範資料中,常名若為破音字時,可將常名漢語拼音放進註解欄中,
   並用{}括住。例:鳩摩羅什{jiu1 mo2 luo2 shi2}
 ※人的生卒年跨朝代時,朝代欄位取卒年朝代。
 ※若知卒年及歲壽,生年的計算=卒年-歲壽+1
 ※人名生卒年的取捨,若資料來源有西元年及中元年,以取中元年為依。例:重顯(參看佛百)
  重顯,(980~1052)宋代雲門宗僧。於皇祐四年入寂。
  建檔時,卒年取皇祐四年(1052-02-04~1053-01-22),而不用1052年(1052-01-01~1052-12-31)。
有關人名的問與答
※王居士、母龔氏等是否標記?
  A:可。但請儘量在規範資料註解欄提供相關可辨識的訊息。
※某仙人,是否標人名、是否給id碼?
  A:否
※人名前的地名,地名不包進人名中。
   例:杭州徑山晦機元熈禪師
   <placeName>杭州徑山</placeName>杭<persName>晦機元熈<roleName>禪師</roleName></persName>
※討論特殊人名,未詳其姓氏,不需建檔authority ?
   例:取性道者 
※roleName 網頁呈現定義討論
  A:98.12.23 決議字樣為:官職名稱、稱謂(小花)
※如別名在前,姓氏在中,尊稱在後,例:中谿李公,其標法?
  A: 所有人名皆不需用<addName> 或 <forename>,用 <persName> 包起來即可。
  <persName key="A009373">中谿李<roleName type="honorific">公</roleName></persName>

返時間

(2)地名<placeName>
文獻查詢順序: 1)  Authority所提供的其他參考書目  2)  中國歷史地圖集  3)  網路資訊(維基等)
查詢地名id碼網址:"地名規範資料庫" http://authority.ddbc.edu.tw/place/新增地名id碼:"地名規範資料庫維護"http://authority.ddbc.edu.tw/login.html
   (e-lib→佛學研究平台→佛學地理名詞權威檢索→輸入地名後,按submit→取Project­_No碼
    作為xml:id碼) 
* 確認查找古今地理位置: 安裝 Super GIS 軟體
  (利用Super GIS所提供的地理圖層可幫助確認古今地名正確位置)
* 世界地圖: J:\CND\Projects\2008AuthorityDB\地理編碼\圖資\county.geo and .dbf
* ccts使用教學影片:J:\CND\Projects\2008AuthorityDB\SuperGIS2.2\CCTS\CCTS \ccts.swf
   (感謝GIS伯雍提供)
* 中央研究院提供地圖工具 http://gis.rchss.sinica.edu.tw/google/?p=301
(一)內文標記方式
  • 地名的標法
 例:<placeName key="Z13005440">雒邑</placeName>
  • 地名群組的標法:
 例:<placeName key="CN0000000G01AA">...</placeName>
(二)新增/修改地名之介面說明

新增資料建檔方式

●第一步驟說明:
          1.進入"地名規範資料庫維護"http://authority.ddbc.edu.tw/login.html
          2.跳出「有問題的地名」頁面時-不理會請Delete(快速鍵:Ctrl+ W 鍵)即可進入「地名檢索」頁面
          3.地名檢索下方「管理功能」點選「新增地名」
             * 地名檢索條目說明如下:
                                地名檢索字串:提供任一關鍵字即可。
                                編號搜尋:以CN碼為主。
                                Z碼搜尋 :以Z碼為主(中研院所提供之編碼)。
                                複合搜尋:複合關鍵字搜尋(隔開標點符號為逗號,)以利更快速精準的查詢功能。
                                          範例:浙江,四明山(此為複合關鍵字)
                                管理功能:僅提供有權限人員使用欄位。
          4.選擇「地理區域範圍」(三種區域包括:中國、中國境內跨區、其他國家)
 a)已知固定範圍之地理區域(中國)項目說明:        
   區 域:選擇地名之省、市、縣或區,確認最小範圍後點選「選取此地區」。(資料不足可選擇最大範圍-省)
   分 類:參考地名編碼原則之「屬性編碼」方式,選擇適當代碼。
   獲得編碼:選「按此取得編碼」(請再次檢查編碼的正確性)。
   編碼結果:選「使用此碼」(新增編碼成功後,不可隨意更改編碼。)
   清除資料:可重填(重點原則是尚未點選「使用此碼」之前)。 
 b)跨區(中國)項目說明:   
   先選擇一個區域:參考中華人民共和國行政區劃之「中國政區」區域範圍說明。
   分 類:參考地名編碼原則之「屬性編碼」方式,選擇適當代碼。
●第二步驟說明:
          1.取得編碼後出現「修改地名」視窗
          2.繼續填寫「基本資料」欄
   Level:(不必填)
   朝 代:慣用名-使用條件為『不受年代變動的影響之地名』。(範例:長江、四明山..等)
   經緯度:座標來源可利用Google Map 『我的地圖』之『更多小工具』新增 getLatLongPlus2
   座標型態:選擇條件說明:
          1.已考定(精確)-已確定之精確座標位置
          2.已考定(預設值)-須進一步雙重確認
          3.待考-尚未考察或須待確認 
          4.不可考-已考察並確定此地名不存在或無可考
   拼 音:(不必填)
   說 明:(可不必填)填寫須具備以下條件:
          1.簡潔說明(僅提供地名本身須註解部分,不提供文本相關資料。)
          2.使用全形標點符號,如下所示:,。、;:!?.「」『』()《》〈〉[]…… 
          3.提供來源出處(須參考「專案整合權威資料庫」工作手冊 凡例之1.3 註解 note項目說明)
   加入超連結:引用網路資料之網址。
             操作方式說明:先置入網址於說明欄內,並複製全選網址後,再一次點選「加入超連結」貼上網址按確定即可。
●第三步驟說明:
          1.繼續填寫「地名部分」欄
          2.「常名」:須符合當時年代所常用之名稱(僅可提供一個常名),於「是否常名」欄中選「是」即可。        
●第四步驟說明:
          1.按「修改資料」即成功完成新增建檔。(切記:若沒有先按「修改資料」而繼續登錄以下之項目「新增來源資料」將面臨前功盡棄的殘酷事實。)
          2.其他別名:限定條件須為同年代(因特殊地理位置或其他原因而給予的名稱(可提供多個名稱)),均於「是否常名」欄中選「否」即可。
●第五步驟說明:
          1.再次新增/修改地名時,於"地名檢索結果"頁面,點選「修改這筆資料」即可。
          2.「新增來源資料」(source)僅須登錄一筆即可。範例:g017p0001
 ※基本資料欄中須注意事項:
  a)必備四樣資訊:朝代、經緯度、地名部分、來源資料。
  b)文本之寺院內建築必須給ID及經緯度。常名建置。範例:慧因寺妙應殿
    ex:<placeName key="CN××××××T××AB">寺院內建築</placeName>(ID=CN××××××T××AB)
  c)引用網路資料時,須註明出處來源資料:網址、名稱、引用日期。
  d)尋找網路資料時,優先採用順序以Authority所列的參考書目,為主要引用網路資料。
  e)也可引用文本作為出處來源資料參考。
  f)失落或無可考的建築物及地名可不提供經緯度,但文本須標記並於
    地名權威資料庫建置地名以供日後檢索。
建築物 XML(文本內文) 地名基本資料欄 經緯度
存在 給I D 標<placeName key="×××"> 須建檔 提供最大範圍 例如:省、區、寺院
不存在 給I D 標<placeName key="×××"> 須建檔 提供最大範圍 例如:省、區、寺院
無可考 不給I D 文本標<placeName>以顏色區分 須建檔 不給

修改資料建檔方式

        ●第一步驟說明:進入"地名檢索結果"頁面
        ●第二步驟說明:點選「修改這筆資料」(編碼和行政區不可修改)
        ●第三步驟說明:「地名部分」及「新增來源資料」僅開放新增或修改,無法執行刪除動作。
        ●第四步驟說明:新增別名時,於下方「新增其他別名」後,按「新增」即可。(限定條件須為同年代的別名)
※修改資料中須注意事項:
  a)編碼和地理區不輕易改編碼。
  b)若需改編碼後務必登錄權威碼修改申請隱藏該筆資料,以利後端程式人員通告相關人員。
  c)資料庫無刪除動作,僅可向authority維護人員報修登錄權威碼修改隱藏該筆資料。
※註:
 地名範例:四川行都司(明) 
 a)編 碼: CN513401Z39AA
  PrjNo:Z02018021
  Class_id:02_ BF(BF表示軍地)


● 有關地名的問與答
 ※注意:Google上的地圖與衛星圖的經緯度不一致,有很大的落差,在標經緯度時以衛星圖為主,原Authority內定的Map是以地圖為主,現已將Map改成Mix。另外,因衛星圖沒有較小的市街道名,故無法精確將經緯度落在正確的位置上。(by Sophia 6-10)
 ※查不到的地名,不用建檔(98.09.28洪老師詢問馬老師決議)

返地名

(3)時間<date>

● 查詢時間id碼網址:"時間規範資料庫" http://authority.ddbc.edu.tw/time/

● 時間的標法說明: (a)有些時間因文本錯誤以致無法找到id,以note註解,例:<note resp="ddbc.da">此段重複「文本重複的文字」</note>

(b)為明確時間點的標法(某年某月某日)(用when)

<date when="西元年-西元月-西元日" xml:id="d(此日id碼)(此日id碼)">內文時間</date>
  例:<date when="1610-07-06" key="d58208525820852">萬曆庚戌年五月十六日</date>

(c)為區段時間點的標法(某年或某月中的某些日子)(用notBefore notAfter)

例1:<date key="d57020065702359"
     notBefore="1285-02-06" notAfter="1286-01-25">至元廿二年</date>
   (notBefore:至元廿二年的第一天    notAfter:至元廿二年的最後一天)
例2:<date key="d59174915929893" notBefore="1875" notAfter="1909">清光緒年間</date>
   (notBefore:清光緒的第一天    notAfter:清光緒的最後一天)

(d)事件進行為持續整個時段(用from to)

例:明逕壁立禪師,生崇禎壬午年五月念七日寅時,雍正甲辰四月十二日說偈訣眾。
壽<date key="d58325275862427" from="1642-06-23" to="1724-05-04">八十三</date>

● 初年,末年時間的擷取原則

 取當朝、當年號、當年的前1/4或末1/4

● 時間為民國的標法說明:

 *查詢ID: 用檔案 GISapD\資料表\ADDate&SB西元與日干支
  例: 民國十三年甲子九月 (出自 : 泉州開元寺志  第十一頁  第二行 )
  步驟一 : 至 http://destiny.xfiles.to/tools/calendarVS.html 查詢西元日期;
          結果為 西元 1924年9月29日至 1924 年10月27日
  步驟二 : 開啟GISapD\資料表\Addate&SB西元與日干支;
          找 ADDate中 +1924-09-29 的日期 ; 
          得到 DateID 為5935623查詢 +1924-10-27 則得到DateID碼為5935651
  步驟三 : 得到ID碼後則可標記為<date when="1924" key="d59356235935651">
          第二次出現及以後 , 則標為<date when="1924" key="d59356235935651">
● 有關時間的問與答
 ※萬 丙子秋 (=萬曆丙子秋)
   A:照標時間,空格不再處理。例:<date> 萬 丙子秋</date>
 ※<date>: key notBefore notAfter  次序是否統一?
   A:不必統一。元素中若有多個屬性,其先後順序不會影響驗證或呈現。
 ※康熙年間,"年間"是否包進時間?
   A:可包進時間內。
 ※時間id之初年及末年的範圍討論? (erica 10.15 洪老師)
   A: 維持現狀取1/4範圍.
 ※朝代
   *東晉
   *十六國:成漢、前趙、後趙、前涼、前燕、前秦、後燕、後秦、
           西秦、後涼、南涼、西涼、北涼、南燕、北燕、胡夏
   *南朝:劉宋、南齊(蕭齊)、南梁(蕭梁)、陳
   *北朝:北魏(元魏)、東魏、西魏、北齊、北周
   *隋
   *唐
   *五代:後梁、後唐、後晉、後漢、後周
   *十國:前蜀、後蜀、吳、南唐、吳越、閩、楚、南漢、荊南、北漢
   *宋
       
   
  • Datecode查詢為id碼(d59356235935651)返回查詢系統

返人名

(4)"群組"的標記
●網底顏色區分:粉紅底→代表群組
            蘋果綠→代表個人
●規範資料"群組"的建置
  人名群組:<persName key="G000001">...</persName>
  地名群組:<placeName key="CN0000000G01AA">...</placeName>

建置【來源出處】注意事項

 ● 出處在 CBETA 者。請建置在「新增來源資料」 CBeta Links欄位中
例如:X65no1295_p716a23
 ● 出處在 文本 者。請建置在「新增來源資料」  Source  Links欄位中
例如:g017p0036
 ● 「註解」中來源出處請使用全形標點符號,如下所示:
,。、;:!?.「」『』()《》〈〉…… 標點符號用法,可參   http://www.edu.tw/files/site_content/M0001/hau/c2.htm注意事項:  
1.生卒年中「-」連接號使用全形標點符號。例如:通容(1593-1661)。
2.每一個別名之間以「;」分號(半形或全形皆可)隔開。
 ● 「註解」內容之來源出處請使用全形標點符號,並參照以下範例:
一.同一來源出處請使用「全形頓號」標點符號隔開
例1:佛光:480、405
例2:(http://baike.baidu.com/view/322497.html、http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw,2008.12.23)
二.不同來源出處請使用「全形分號」標點符號隔開
例1:佛光:480;佛百:4053.1
例2:(http://baike.baidu.com/view/22260.html,2008.12.02;佛光:480;http://baike.baidu.com/view/1225413.html,2008.12.23)
三.日期前的標點符號請使用「全形逗號」隔開
例1:(http://baike.baidu.com/view/22260.htm,2008.12.02)
注意事項: 
1.使用網路出處來源,需注意其穩定性及權威性。建議參照使用Authority所提供網路資料Authority。
2.出處來源中的網址,需注意其長短,避免網址太過隴長EX:短:http://zh.wikipedia.org/wiki/雷峰 EX:長:http://zh.wikipedia.org/w/index.php?title=%E7%83%8F%E9%8E%AE&variant=zh-tw

代名詞

 
 1.標記時機:當詞意不明顯時才要標

 2.代名詞的標法:<ref key="Axxxxxxx">代名詞</ref>
   例如:<ref key="A003940"></ref>(A003940指徐時泰)
        
 3.由於頁面太多超連結,請各位標記人員以"頁"為單位,相同之人、事、物、時、地(包括代名詞),
   皆不用再重複標記。

返目錄

註解

 
 1.文本註解無論是何種類型,一律採用此種標記為<gloss></gloss>
   例如:上有橫地<gloss>疑當作池</gloss>
 2.在標題內之註解,置於<head>內.
   例如:<head><gloss>共計五十九峰</gloss></head>
<note>中有連結網址時:
  <note resp="ddbc.da"><ptr target="網址"/>註解描述</note>

例1:url是網路資料時
柔兆<note resp="ddbc.da"><ptr  target="http://baike.baidu.com/view/651760.html"/>
歲陽名之一,指太歲在"丙"。</note>

例2:url是CBETA資料時
僧會<note resp="ddbc.da"><ptr  target="http://w3.cbeta.org/cgi-bin/goto.pl?linehead=T49n2038_p0931b12">
釋道二教流傳入中國,歷代以來皆設官以領之。明代,縣設僧會司,置僧會一員,掌本縣僧道事。</ref></note>
(?linehead=T49n2038_p0931b12:這一段(行首資訊)須自行手動加在網址列上)

內文漏字或難以辨認時

* 標法參考以下網頁:

  http://tei.oucs.ox.ac.uk/P5/Guidelines-web/zh-tw/html/ref-gap.html#
  範例:2個圓圈刪去,輸入<gap extent="2" unit="chars" reason="lost"/>
        extent: 被省略的文字量  unit: 資料型態

  * 內文漏字,須插入「字」其標法:

  範例: 
        原文: 元祐四年
        標法: 元<add>延</add>祐四年

勘字

(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。

圖檔或圖檔內有文字標記法

印章(視為圖檔)標記法如下:
<figure>
    <figDesc><signatures></signatures></figDesc>
    <graphic url="1B020P024.jpg"/>
</figure>
 <figure>
  <head>標題</head>
   <figDesc>讓此表可以檢索到的圖說,以半形標點符號間隔文字</figDesc>
    <graphic url="cwdc01p085a.jpg"/>
 </figure>(己有掃瞄圖檔故圖不顯示)

內文去多餘空格或照書斷行的作法

 * 照書斷行需去空白的作法(清除折行多餘空格):
    1.使用doConcat.py程式
    2.程式存放路徑:Y:\Projects\fosizhi\work\tools\cleanBK
    3.將要處理的檔案放在srcXml資料夾內(mian檔不須放)
    4.利用FreeComander內的"DOS視窗"執行doConcat.py程式
      Y:\CND\Projects\work\tools\cleanBK>doConcat.py(按Enter)
    5.再到output資料夾中,就可看到轉好的新檔案了

在文本標完後,建立事件<linkGrp>

 ※ 暫先不建立此事件<linkGrp>,馬老師將找專家做)
   說明:辨識文本中的事件,建立其「人、時、地」的連結群組
    例:
   <linkGrp>
     <ptr type="person" target="#G0292"/>
     <ptr type="person" target="#G1273"/>
     <ptr type="place" target="#TX5132241"/>
     <ptr type="time" target="#d405666405666"/>
   </linkGrp>

返目錄

標記問答

● 宗派(例如賢首宗)及普門菩薩是否標記?

A:不標

● 寺院內建築(例如華嚴經閣)是否標記?

A:要標。

● 內文中提到的相關「著作」是否標記?

A:不標。

● 格式問題:是否照書編排?

A:可依文本實際內容標記,不用照書排版。

● 並列文字的標法?

A:例:副寺<list rend="inline"> <item>惠秀</item>  <item>舜普</item> 
      <item>永施 </item></list>校刊

● 標題(head)+作者(persname)於同一行的標法?

A:<head>標題</head>  <byline><persname>作者</persname></byline>
   (註:<byline> 包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處即署名之意。)

● 標題後有副標題的標法?

     
例:<head>大安禪師<seg type="toc" rend="smallType">上堂一則 機緣二則</seg></head> 
       註:seg(隨機分割) 包含文件中任何隨機字詞層次的單元。
          toc=table and content
          rend表示"如何呈現"

● 文本段落無標題時,文中可否自添標題?

   
A:否。可將自添標題放於段落屬性中。例:<div type="入院法語一">

● 人名權威建檔,製作資料來源(source)是否登錄?

A:不必登錄,規範資料庫檢驗通過後,將自動冠上每志的第一筆出處。

● 引語是否需標<cit><quote>?

A:否

● <lg><l>的注意事項

<lg><l><p>是對等地位,故不可包在<p>中。應結束</p>後,再標<lg>

● 行後有小字的標法? 例:寶慶三年正月日牒尚書省印#行書

A:寶慶三年正月日<note rend="smallType">牒尚書省印行書</note>

● pb放置的位置?

A:放<div>與<head>中間。例:<div><pb n="0095"/><head>

● 文字出現於兩行的行中時,是否照文本排版標記?

A:不用照原文排版 
    

● 文本中人名資料中的<字號或別名>無法確實查證時,該如何標記?

  例:<persName key="A003937">姚二煜葆明</persName>甫
A:無論是別名或字均以<addName></addName>包起來即可.
  例:<persName key="A003937">姚二煜<addName>葆明</addName> </persName>甫

● 遇人名不確定是否為某人時,可加屬性值標示。

例1:<persName type="unknown">某某某</persName>此為完全不明或查找不到確認
   此人身份資料時用
例2:<persName key="A001606" cert="70%">cert 是表示標者自認為的正確度,
   是相對的,非絕對的。

● 圖檔標記:url 圖檔檔名?

  <figure><figDesc>圖說</figDesc><graphic url="掃瞄檔檔名.jpg"/></figure>
例:<graphic url="3B004P001.jpg"/>(註:P為大寫,頁碼為三碼)

● 空白頁的處理

A:只需標上頁碼
例:<pb n="0248"/>

● 文末的"印"是否需標記?

A:<figure><figDesc><signatures>「樊王家」方印</signatures></figDesc></figure>

● <author>與<docAuthor>之異同? (<author>在<body>內無法valid)

suggest: <docAuthor>指題名頁的作者, <author>指內文的作者以為區別
 A:可用<byline><persName type="author">唐王勃</persName></byline>

● 若印刷錯誤,大段內容重複時?

A:可用[註]標示。例:<note resp="ddbc.da">此段重複「文本重複的文字」</note>,
  這樣,內文會消失,只出現[註].

● 文字漏段的標記: <gap extent="unknown" unit="chars" reason="lost"/>

● 行後小字的標法

可使用<gloss>

● 訛字標記、今體字標記:

(1)訛字標記:<choice><sic>文本的字</sic><corr resp="ddbc.da">修訂後的字</corr></choice>
  <sic> 包含看似錯誤但仍照實轉錄的文本。
  <corr> (更正) 包含文本中看似錯誤並加以更正過後的文字。
(2)通用字或今體字標記:<choice><orig>文本的字</orig><reg resp="ddbc.da">一般化的字</reg></choice>
  <orig> (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。
  <reg> (一般化) 標誌一般化或規格化處理過的文字。

● 版本說明及內文插圖無頁碼時,如何標示頁碼?

版本說明的頁碼標法:<pb n="0000a" facs="xBxxxPxxx"/>(0000+a)
內文插圖的頁碼標法:<pb n="0123a" facs="xBxxxPxxx"/>(插圖前頁頁碼+a)
xBxxxPxxx 指的是圖檔的檔名,
可自行自以下資料夾找相對應的圖檔即可。
Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff

● 當詩詞跨頁時

 <l><item>遇跨頁時,照書換頁,不用顧及排版問題。

●敬格的問題?

 A:可以不照書斷行或空格。若要照書空格時,
 應標<space quantity="1" unit="chars"/>
 (1個單位是一個半形的距離。標記內不可有不明的空格。)


●人名前的朝代是否需建置時間標記?

 A:可不標。

●名勝是否需建置? 如朝音洞,蓮花洋。

 A:可不標,但如找得到,亦可標。

●文本若出現非標記可處理的範圍,可不標句讀。

 須於<teiHeader>作一個說明程式。例如:元朝蒙文文言文,可不標句讀。

●變更標記事項說明如下:

1.xml:id 及 corresp 均修訂為 key
2.修訂範圍包括:人(persName)時(date)地(placeName)及代名詞(ref)標記xml:id 及 corresp
3.範例說明:
(1)原標記
  <persName xml:id="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>
(2)原標記
  <persName corresp="A000883">攝摩騰</persName>
  修訂為:
  <persName key="A000883">攝摩騰</persName>

● 若無從考證的地名,是否建置地名規範資料? 沒有id的人名、地名,是否允許存在於標記文本中?

 A:若無從考證的人地名,不用建置人地名規範資料。
    標記文本中,允許沒有id的人名、地名存在。

● 「南海補陀山寶陀禪寺」的地名標記。

 a)<placeName>南海補陀山寶陀禪寺</placeName>
 b)<placeName>南海補陀山</placeName><placeName>寶陀禪寺</placeName>
 c)<placeName>南海</placeName><placeName>補陀山</placeName><placeName>寶陀禪寺</placeName> 
 A:南海補陀山<placeName>寶陀禪寺</placeName>。

● 標點符號。

 a)經謂:「莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。」
 b)經謂:莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。
 c)經謂,莊嚴施之周於沙 □[註]界,不若一經一偈流布之功。
 A:若是經文原文引用,則用a,若是意義引用,則用b,不可用c。

● space的單位(chars)有2種:

 1) <space quantity="1" unit="chars"/>:表達的是一個英文半形的距離。  
 2) <space quantity="1" unit="chi_chars"/>:表達的是一個中文全形的距離。

● 居士姓王名禮, how to tag persName?

 A:<persName key="A009780"><add>姓</add>王<add>名</add>禮</persName> 

● 若文內只有天干地支,但沒有年,是否須tag?

 A:不用。

● 書法草寫體字體無法辨認時,標記tag?

 A:<gap extent="2" unit="chars" reason="illegible"/>。

返標記問答-第一題

缺字處理流程

定義:

凡非unicode編碼系統字者,或古字打不出來的,皆作缺字處理。
台北版電子佛典集成缺字作法參考 http://taipei.ddbc.edu.tw/jiaxing_rare.php
別譯雜阿含缺字檔範例參考 http://buddhistinformatics.chibs.edu.tw/BZA/getsource.xql?src=b074T02.0101.0498b25.xml


  1. 判斷是否為缺字
  2. 圖檔處理
  3. 內文標記
  4. 介面輸入
  5. 缺字上傳
  6. 相關知識

判斷是否為缺字

Unihan網站:http://www.unicode.org/charts/unihanrsindex.html
. extension B 內碼範圍:2000~2A6cf

1. 如果一個字有不同寫法,具特別意義則要做缺字

2. 可判斷是那個字,只是寫法不同(以下以阿育王山志第1冊為例) 例如:母p0205、偈p0015、役p0044、民p0047、岷p0387 ==>不做缺字

3. 寫法很奇怪,但可判斷出是什麼字 例如:最p0101、投p0173、備p0124 ==>用通用字

4. 為某種原因而做的文字,例如公諱或私諱字 ==>以缺字處理

5. ==>書法字不用做缺字

圖檔處理

 (1)unicode網站如果有圖檔,請第一優先download用此字圖。
 (2)不採用教育部異體字圖檔。
 (3)若此字為unicode所無,則用Gimp工具,裁切文本掃描原始檔(.tif)作為字圖。(作法如下)

利用Gimp軟體處理缺字圖檔
【98.01.19 Erica】
 *裁切掃瞄檔缺字步驟
(1)開啟Gimp功能表「檔案」.
(2)點選「開啟」.
(3)選擇掃瞄檔案ex:2Book022(路徑:Y:\Projects\fosizhi\images\Temple_Gazetteers_Tiff)中缺字頁碼.
(4)放大圖片以利裁切:點選「顯示」選擇「縮放2:1(200﹪)」.
(5)點選「工具」選擇「變換工具」中的「剪裁」圖形cut(形狀類似一支筆).
(6)將「剪裁」圖形移至缺字字體,確認位置後在選取的字框內點選滑鼠左鍵2次,即出現裁切之缺字圖檔.
(7)設定圖片尺寸:點選「影像」選擇「縮放影像」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(8)點選「檔案」選擇「另存新檔」並提供檔名ex:btg077009601.gif再點選下方「Gif影像檔」按2次「儲存」即完成.

 *針對已下載缺字圖片設定尺寸之轉檔步驟
(1)開啟Gimp功能表「檔案」
(2)點選「開啟」(路徑:先前已下載的缺字圖檔ex:btg×××××××××.jpg之資料夾)
(3)設定圖片尺寸--點選「圖片」選擇「縮放圖片」設定尺寸:45X47(點一下右邊鐵鍊圖形--目的是解除固定) 解析度:72像素,完成後點選下方「縮放」即完成.
(4)點選「檔案」選擇「另存新檔」並提供檔名ex:btg×××××××××.gif再點選下方「Gif影像檔」按「儲存」後,即出現另一視窗請不要勾選任何選項按「儲存」即完成.

返目錄

內文標記

●缺字標記:
<g ref="#btg086001701"/>
字圖檔案命名原則:btg+志碼3碼+頁碼4碼+序碼2碼(序碼:此頁第幾個缺字)

介面輸入

(a)缺字id編碼原則: btg086(志名)0327(頁碼) 01(第幾個缺字)。目錄缺字id:btgcal(目錄)XXXX(頁碼)XX(第幾個)
(b)登入缺字網頁[1]
(c)取碼目的:取得缺字碼<g ref="#btg086001701"/>標記內文及建置缺字組
(d)建置步驟說明:
  (1)輸入第一列缺字位置之「冊、頁數、第幾個」 完成後,按下「新增一筆」.
  (2)產生缺字id後,即可輸入缺字資訊(如e).
(e)完成後,按「更新資料庫」.
(f)輸入缺字資訊須知,說明如下:
  (1)<glyph xml:id="btg086033701">: 為缺字id碼。
  (2)<glyphName>: 為unicode編碼。
     ●到 unicode網站 找cjk(Decimal)之下方編碼,例如:CJK IDEOGRAPH 15181
     ●其cjk(Decimal)之編碼=<mapping type="unicode">15181</mapping>
     ●若查無unicode編碼資料,請點選「Non Unicode Character」即可.
  (3)<charProp>: 標記<value>發音。
     ●到 漢語拚音字典 找漢語拼語,一律小寫,第幾聲用數字表示(一聲、二聲、三聲、四聲、輕聲 = 1、2、3、4、5),不知發音者以問號表示。
     ●<charProp>表示字的屬性、表達方法。比如說注音、發音。
  (4)<mapping type="cbeta">: 為組字式。
     ●組字方式均由 CBETA maha 統一組字,請參閱 CBETA漢字庫 打通用字或組字式以獲得組字式與CB碼。
  (5)<mapping type="cbetaNo"> : 為cbeta的CB碼。
     ●若查無CB碼資料,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入 maha 字樣即可.再以一志為單位,統一由程式人員:小花 處理.
     ●若 CBETA maha 回覆不收錄至CBETA漢字庫時,請登錄至「更新資料庫」上方之「add a note」按鍵點選後,輸入<不收錄至CBETA 漢字資料庫>字樣即可.
  (6)<mapping type="unicode"> : 為unicode編碼。
     ●Mapping說明:<mapping/>可以用另一個系統來表示這個字的方法,比如說cb碼、組字式、unicode碼。cjk與Unicode(id=decimal)的關係猶如cjk=一年甲班,Unicode=10號。
  (7)<mapping type="MoEvariant"> : 為教育部異體字編碼。
     ●到 教育部異體字網頁 找編碼。例如:b02420-001
     ●注意:沒有Undicode的字才要登錄教育部異體字編碼。
  (8)<add a note>: 為註記資訊用
     ●輸入 maha 字樣 : 申請缺字收錄至CBETA 漢字資料庫。目的:索取CB碼及組字式。
     ●maha回覆訊息後,提供註記「不收錄至CBETA漢字庫」或「這是BIG5系統字「丱」資訊用。
(e)完成後,按「更新資料庫」.

缺字給 CBETA Maha製作流程

(1)請Maha幫忙製作缺字 無CB碼、無組字式 者
(2)須製作(1)的二點資訊者,於缺字介面note註明maha
(3)小花再以note註明的maha 彙整送給maha
(4)缺字資訊的note寫法可參考缺字介面的(8)<add a note>: 為註記資訊用

缺字上傳

(1) FTP informations:

   session:fosizhi
   host name:10.10.0.49
   user name:april    
   password:m4tjp

(2)上傳位置

  從 Y:\Projects\fosizhi\images\gword\
  到 0:/fosizhi/public_html/gword/

相關知識

. 如果缺字在介面如法顯現,請安裝字型
  Y:\Projects\fosizhi\work\tools\字型\unicode字型\HAN NOM B(A).ttf

缺字呈現順序

‧unicode

‧通用字(異體字)

‧組字式

驗證

1. main的檔頭有用all.nrc刪除
2.schema路徑 
  Y:\Projects\fosizhi\gazetteerSchema\schema\.rnc
3.設定Schema路徑操作說明如下:
  a)在Oxygen功能表上方,點選Document中valid--Exteral validation。
  b) 在validate with 視窗 選擇RelaxNG schema。
  c)於URL選擇設定schema路徑(參考2.)後按確定即可。
4.回到main檔按Oxygen功能表上方的紅勾勾驗證(沒有點點的)確認已valid及確認其他卷well formoed
5.開啟eXist程式上傳
6.若樹狀結構有變更,請先更新節點[2]
7.開啟佛寺志網頁,按重新整理即可。

規範資料庫檢查(洪老師撰寫的程式)

occured in 人名出現的原則 1. 不同志,有別名=每一筆都會出現 2. 不同志,同名=每一筆都會出現 3. 同志,有別名=每一筆都會出現 4. 同志,不同卷,同名=只會出現第一筆

xml轉html

安裝oxygen 9.1 由gxxx_main.xml主檔 呼叫html.xsl

1.開啟gxxx_main.xml主檔,點Configure Transformation Scenario鈕(鉗子+小紅三角形)
  進入轉檔介面,選New(第一次建立html檔後,
  若所設定的路徑都沒變動的話,以後直接點Transformation now即可;
  若有要更改路徑的話,點Edit進入介面去修改即可)
2.進入Edit scenario 介面
  a)點XSLT,在XSL URL欄,點選html.xsl檔案的置放路徑(J:\CND\Projects\2008BTG佛寺志\work\標記\標記進行中\html.xsl)
  b)點Output,在Save As欄點選html檔案的置放路徑,為html檔命名,然後點OK
3.此時進入到下一個介面,點Transform now,即可產生html檔案
4.轉檔不成功時:修改option/preference/xml/xml parser/xinclude option中有3個選項全打勾

安裝 exist.jnlp 上傳檔案

1. * 沒有java要先安裝(t/java/jdk/jdk-6-windows-i586.exe)
2. 啟動 exist.jnlp 檔才能上傳維護
3. 上傳前具備條件:
   (1)main主檔要經valid驗證 --沒有點點的紅勾勾
    (2)其他子檔要well form--藍勾勾
4. Uaername:btg → Password:btg →確定
5. 點選BTG(快點兩下)→點選xml(快點兩下)
6. 若要上傳整冊,切勿點選冊數,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(整冊)→Select files or directories store →Close
7. 若要上傳單卷
   請點選冊數,進入冊數後切勿點選分卷,而要直接點擊工具列上面的 新增icon(+)
   找到來源檔案(單卷)→Select files or directories store →Close

● 佛寺志網址: http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g008


● 更改節點網址: http://10.10.0.49:8080/fosizhi_json/

● HTML檔介面定案:人名/地名/時間 分三種顏色。

 例如:  地名 與 地名代名詞<ref>--------綠色
        時間 與 時間代名詞<ref>--------藍色
        別名 與 人名代名詞<ref>--------紅色
        人名(常名)--------------------加底線 (紅色)



上傳

使用方法:
(一)將欲上傳的檔案,放在Y:\Projects\fosizhi\eXist_upload中
(二)打開上傳網頁http://dev.ddbc.edu.tw/fosizhi/upload/index.php
      1.填上帳號fosizhi,密碼amituofo
      2.點選"重新檢視"(將會看到預備上傳的檔案)
      3.點選"上傳XML"(不用理會之後出現的Validation Error! )
         Upload successful!

建立參考書目

●中研院書目參考網址:http://74.125.95.132/search?q=cache:JpyJD9HKveUJ:saturn.ihp.sinica.edu.tw/~dahcr/916c5-b4.doc宋人傳記資料索引&cd=8&hl=zh-TW&ct=clnk

●參考書目人名與書名的中英文寫法<author><hi>Wei</hi> Songshan 魏嵩山</author><title>Zhong Guo Lishi Diming Dacidian 中國歷史地名大辭典</title>

●內文「註」的參考書目寫法(april 9/3)例如:趙一新總編。《杭州佛教文獻叢刊‧慧因寺志》卷七。 (杭州出版社,年代) 參考網址 http://www.ddbc.edu.tw/zh/academic_publishing/submissions_format.html

●存放路徑 Y:\Projects\fosizhi\gazetteerXml\bibliography\gazetteerBibl.XML

● 處理人員:參與此專案有參考到任何書籍者

待解決內部問題討論

1.佛寺志網路版文本搜尋有問題。例如:g077尋找諸大道,但出現之頁碼數字是其他寺志的頁碼。(玉蕙 99.03.10 小花)

2.皇明觀志metadata(秀麗,99.03.10  小花)


3. 元衡平搜尋不到(april,99.02.04  小花)

4. search過後的html,因hightlight的關係,導致人名的字下線過長。(Sophia 2-08)(小花)

5.檢視table 的匡線,cell 內若有gloss,網頁呈現上有雙隔線,需拿掉。(Sophia 2-10 小花)
http://dev.ddbc.edu.tw/fosizhi/ui.html?book=g009&cpage=0435

  目錄匡線無法移動。(Sophia 3-9)

6.佛寺志電腦文本中點入「朝代時間」標記,出現之時間規範資料庫視窗,可移動及關閉的部份不在電腦螢幕視窗之內,因此,無法關閉或移動。〈玉蕙 2010.03.02 小花〉

7.佛寺志電腦文本g017卷二中文字幕變成英文。《玉蕙 2010.03.02 simon》

8.佛寺志介面(april 99.03.08 小花)
9.缺字流程 (april 99.03.08 各位同仁)




10.《昌國典詠》書名內的地名,是否需標記?(Sophia 2-23)

11. 討論:敬格標記
<gap extent="1" unit="chars" reason="respect"/>
<space quantity="1" unit="chi_chars" reason="respect"/>(miao,2.23)
若以此<space quantity="1" unit="chi_chars" reason="respect"/>為標記,schema無法通過驗證(秀麗)


12.電腦維修責任歸屬  (april 99.03.08 各位同仁)
13. 時間正確的id請有,請修改文本 (april 99.03.08 各位同仁)
14. 妙妙與馬老師解讀文本的時間 (april 99.03.08 妙妙)



[[http://www.example.com 連結標題]]

最新公告

"請註明紀錄者姓名及日期"

1.地名尾碼非AA碼者,"不可重新編碼",若要改碼,要用"新增"。(miao,1.28)
2.<table>跨頁,若有合併列,須加算1列合併,以安置頁碼。(miao,1.28)
3.<table><head>的標法。(miao,2.04)

返目錄