佛寺志點校

出自DILA Wiki

佛寺志點校

佛寺志點校須知

Oxygen的Author作業模式

一、作業軟體

 Oxygen

二、作業軟體環境設定(以v.20為例)

 1.字型及字體大小
  Oxygen介面→功能列Options→Preferences→Appearance→Fonts→右欄Author default font→選擇 Serif字型、設定符合視覺的字體大小
 2.自動折行
  Options→Preferences→Editor→Edit Modes→Text→右欄Line wrap這一項要打勾
 3.取消自動縮排模式
  Options→Preferences→Editor→Format→右欄取消所有縮排(indent)的設定
 4.取消打字或貼上文字時的自動縮排
  Options→Preferences→Editor→Format→XML→右欄取消Indent兩個項目的縮排

三、作業介面

 打開檔案後,請切換介面至Author模式

四、作業流程

 以一篇文章為單位,大致須經歷三回合作業。
 1.第一輪:添加標點
 2.第二輪:電子文本與底本逐字校對
 3.第三輪:全文複檢

四、作業要點

 1. 添加標點時
  1) 請以全形標點符號添加。
  2) 遇有艱澀難懂的章句,須查找參考資料。
  3) 最好在每一志的作業之前,先上圖書館或上網查找相關的參考資料。
 2. 校對文字時
  1) 若是後人打錯字,請直接依底本改正。
  2) 若是底本本身有錯字,請以[錯字>正字]的格式訂正。
  3) Author模式下的符號使用
   修訂字:[底本字>修訂字]
   刪字:[-衍字]
   加字:[+漏字]
   提供通用字:底本異體字[=通用字]
   加註:[註:註文]
 3.全文複檢時
  順讀文章,檢查有無需要修改之處。

五、注意事項

 1. 文中有小三角形符號,乃TEI標記的轉換符號,請小心勿刪。
  Author模式下的標記轉換符號.jpg

 2. 內文排版有依照原書斷行,請勿改變文字之行位。
 3. 頁面中的每行空白,代表一個空白頁數,請勿刪除空行。
 4. 標點原則:
  1) 行首字不下標點符號(除了前引號、前書名號等成對的前符號)。
  2) 行尾字不放前引號、前書名號等。
 5. 內文中,有些段落已添加標點,係先前標記人員所標,可修改。
 6. 若發現有疑異之處,可隨時與組長反應與交流;或請記錄下來,交檔時一併匯報。

六、參考工具

 1. 參考相關版本
 1) 查詢各大圖書館有無參考書。
  國內圖書館整合查詢 https://metacat.ntu.edu.tw/
 2) 上網檢索參考資料,通常截選一個句子或數個詞彙作關鍵字詞,每個關鍵詞間以一個空隔分開。
 3) 若是僧人事蹟,可查找CEBTA相關資料。
 2. 異體字參考網站
  1) 漢典 http://www.zdic.net/
  2) CEBTA漢字資訊網 http://dict.cbeta.org/word/search.php
  3) 開放康熙字典http://kangxi.adcs.org.tw/kangxizidian/
  4) 教育部異體字字典http://dict.variants.moe.edu.tw/variants/rbt/home.do

七、特別說明

 1. 有關序文
  序文通常是較深邃的,因為它是全志內容的縮影結晶,有些敘述要待閱讀各章內文後才容易了解。
 2. 有關表格
  遇表格,可至佛寺志網頁掃描圖上做對照。若需製圖,請與組長討論製圖方式。(例:g061 p.93雪峰志卷四.東土祖師系圖譜)

八、佛寺志網站(開發版)

 http://dev.dila.edu.tw/fosizhi/

TXT作業

一、前言

 為了便利不熟悉Extensible Markup Language的點校夥伴進行標點作業,我們將原本的xml作業文件中的TEI標記語法轉換成了一些符號,製成txt格式的純文字檔。
 轉化後的純文字檔,將以行號及指定的特殊符號做為文件回復成xml的重要依據,因此請點校員務必謹慎地對待文件中的各種符號。

二、特殊符號說明

 以下符號,代表TEI標記,非屬標點符號。
 1.【標題】:代表標題(含編輯群添加的標題)
 2. |A>B|:代表文字校訂(A是底本訛字,B是訂正字)
 3. |A=B|:代表提供通用字(A是底本異體字,B是通用字)
 4. |+xxx|:代表補充漏字(xxx是漏字)
 5. ∠A B C D⊿:代表詩句格式(ABCD為詩句)
 6.〖底本原註〗:代表底本本身的註文
 7. ㊟點校註⊘:代表標記員所加的註文
 8. «小字»:代表小字
 9. □:代表缺漏字
 10.⊙小標籤⊙:代表一種標貼(常用於詩句末的小題名)

三、作業符號說明

 點校員的作業標記符號表示法(與既有的TEI標記符號有別)
 1.修改打錯字:{打錯字>底本字}。
 2.修訂底本訛字:[底本訛字>訂正字]
 3.提供通用字:[底本異體字=通用字]
 4.刪除衍字:[-文本的衍字]
 5.補充漏字:[+漏字] (通常隨後會附註參考來源)
 6.加註:[註:xxxxxx]
  例: [註:據某書校訂。]

四、文件說明

 1. 底本原件:見 佛寺志網頁右欄掃描檔(或至當地圖書館借書)
 (中國佛寺史志彙刊,杜潔祥主編,台北:丹青圖書公司,1985)
 2. 點校作業檔為txt文件,以卷為單位。內容排版「依原書斷行」。

五、點校流程

 點校作業要點有二:「添加新式標點」及「逐字校對文字」。
 以一篇文章為單位,大致須經歷三回合作業。
 1.第一輪,在文中添加新式標點。
  遇有艱難文句,可查找參考資料。最好作業前先備好參考書。
 2. 第二輪,作業檔與底本對讀,逐字校對文字。
  修訂、增減文字或添加註解時,請依規則加上[]符號。
 3. 第三輪,全篇文章再順讀一回,複檢。

六、注意事項

 1. 請使用全形標點符號作業。

   常用標點符號,。、:;《》〈〉「」『』!?――.…[]
  第一層引號請用「」,第二層引號請用『』
 書名號請用《》,卷名號或篇名號請用〈〉

 2.校對文字以底本為準。若底本字是電腦無法打出,則可適時以其通用字替代。
  查字工具:
   1) CBETA漢字資訊網
   2) 教育部異體字字典
   3) 漢典
   4) 開放康熙字典

 3.對於重複出現的異體字,只在當志第一次出現時提供通用字。 其後出現的異體字,逕以其通用字替代。(全卷搜尋、取代)

 4. 長行中的詩句,請以標點符號標記。例如,
  詩曰:「A句,B句;C句,D句。」
  已製成詩行的詩句(頭尾有∠⊿符號者),不須再添加任何標點符號(含書名號),只需校對文字。

 5. 若發現有疑異之處,可隨時與組長反應與交流;或請記錄下來,交檔時一併匯報。

佛寺志異體字處理規則(2018年版)

一、異體字問題分析

 1.無法周全。(並非所有字都找得到編碼字)
  例:1)𤣥玄、□(少一畫的弦)弦;
    2)𠔏共、□(多一畫的洪)洪;
    3)□(少一畫的翻)翻;
    4)□(多一畫的釋)釋;
    5)槪概、□(無近似字)慨;
    6)青靑;淸清;□(無近似字)情
 2. 費時耗工。====   例:吕呂;宫宮
 3. 意義不大。====   例:青靑;淸清
 4. 造成檢索的漏洞。====   例:眞真;圗圖;𠀉丘

二、問題解決

 以通用字直接取代異體字,但為難辨識的異體字提供通用字。

三、價值評估

 1. 減少造字或字圖,避免影響網頁速度。
 2. 提高作業速率,但不影響文意。
 3. 便於閱覽
 4. 便於檢索

四、異體字處理規則(以「一志」為單位)

 1. 對於易辨識(字型差異小,不會產生懷疑的)的異體字,直接以通用字取代。

   例:靑→青,槩→概,爲→為,眞→真

 2. 對於不易辨識(字型差異大)的異體字,於當志第一次出現時,保留異體字,提供通用字,並以choice標記。其後出現的相同異體字,則以通用字取代。
  例:[灋=法],[𣦸=死],[灾=災],[麤=粗]


參考【古籍整理規範】

 一、按照當代古籍整理的學術規範,凡是原文獻的「用字」使用「俗字」、「簡字」、「異體字」等同音同義的字,皆應該著錄為當代「通用字」,只有「假借字」必須照錄。當然,當原文獻涉及「文字學」或屬於「出土文獻」時,就必須完全依其用字著錄。文中過多的異體字,將妨礙閱讀。——杜潔祥《近四十年來中國佛寺志彙編出版概說》

 二、現代人閱讀我國古代典籍,會感覺一字多形的現象比比皆是。即使你繁體字識讀不成問題,也時不時地會被怪模怪樣的字攔住去路,要去翻閱字書,很難暢通無阻地徑直看下去,甚而至於廢卷而歎。就如同吃上一碗米飯,常常有砂子稗粒硌牙,須停箸不斷地挑剔,到頭來程度不同地會影響胃口。毫無疑問,異體字是古籍閱讀的一大障礙,對於古籍整理者來說,異體文書處理是一道繞不過去的坎。——彭君華〈古籍整理中的異體字、訛文書處理〉,安徽省古籍整理出版辦公室.《古籍研究》2017年第2期136-139

 三、試看甲骨文字、戰國楚簡文字、兩漢簡牘文字、南北朝隋唐碑刻文字、敦煌寫本文字,或其他古書抄本,就會感覺到異體字觸目皆是。然而,甲骨文中的異體字一般不會持續到戰國時代,戰國六國異體字也不會持續到兩漢文字中,六朝異體字大多數也不會持續到宋明刻本中。這說明異體字的產生是自然的,其消亡也是自然的。文字異形的規範工作歷代都有,最早而且最有成效的是秦始皇對六國文字的統一。——華東師範大學中國文字研究與應用中心 詹鄞鑫〈再談異體字問題.異體字的廢除問題〉