缺字 SOP 流程

出自DILA Wiki
(重新導向自缺字SOP流程

FSOP.jpg

異體字判定SOP流程圖

SOP.jpg

異體字判定SOP流程圖說明

一、一般注意事項

1.所有異體字之判斷應以教育部異體字辭典之字形檢索之結果為標準。
2.所謂「異體字判定」斷除了異體字本身之判斷外,亦包含其通用字的正確判斷。
3.所有異體字判定,不能僅針對字形判讀,其字義、字音亦應列入考量範圍。否則極易發生誤判。

例如:「誌」的其中一異體字作「識」,而「識」又自為正體字,因此應據文意小心判讀,方能決定其通用字為「誌」或「識」。

4.凡字形小異於通用字者,如部件之缺筆、增筆、位移等情況,不可任意輕忽略過,應以教育部異體字辭典檢索之結果為準。

例如:「兌」為正體字,其異體字形「兑」明見於教育部異體字辭典中,則「兑」即應視為一異體字。

5.凡俗字、古今字、避諱字、簡體字(「簡體」謂古書中之簡化字,非謂大陸及日本使用之簡體字),無拘其自身是否另兼他字之正體,皆應視為異體字。

例如:「体」為「體」的簡化字,又為「笨」的異體字;「体」雖自為正體字,卻為「體」、「笨」的異體字形,因此「体」即應作異體字處理。

6.俗字、古今字、避諱字、簡體字即使其自身字形為正體,亦當視為異體字。倘文獻出現其正體則登錄正體,倘出現其異體則登錄其異體。登錄後應作註解及標記附加說明。
7.冷僻字、難字即使自為正體,基於其形音義非普遍通用,廣義上亦應視為異體字,登錄後應作註解及標記附加說明。
8.草書及手寫字不在異體字判別範圍內,但若有俗字、古今字、避諱字、簡體字、冷僻字、難字等使用情況,則應視為異體字。
9.通假、假借等狀況不視為異體字。

例如:「蹻」為「屩」的假借現象,各有其本義,非由字形孳乳而產生的異體關係,雖文獻中有彼此借用的現象,亦不視為異體字。

10.若通假、假借所使用之字形異於通用字時,則應視為異體字。

例如:「嬴」通假作「贏」使用時,本不視為異體字。但此通假字「嬴」倘有使用異體字的狀況作 時,則當然視為異體。

11.教育部異體字辭典檢索結果中,其辭條中有謂「通某字」時,大抵屬於通假及假借現象,不作異體字處理。
12.日韓新造漢字,其形音義為其本國所獨有,不視為異體字。
13.印刷不清及版工等問題不視為異體字,可在經驗原則下事先排除,以免徒費精力。
14.印刷不清或版工問題應以教育部異體字辭典檢索結果為判準。凡字形小異者,於教育部異體字辭典檢索結果中未發現相同字形者,乃可不作處理。
15.在教育部異體字辭典檢索結果中,一異體字另作他字正體、另作他字異體、另作他字俗體時,皆應登錄其本字於資料庫中。

例如:「廼」為「迺」之異體字形,又為「乃」之異體字形,因此「廼」在文獻中即有可能作「乃」或「迺」。除了據文意小心判斷外,亦應同時登錄其本字於資料庫中。

16.在教育部異體字辭典檢索結果中,若有二字互為正體、異體時,亦皆應登錄於資料庫中。
17.在教育部異體字辭典檢索結果中,倘有一異體字之字形特異於正體,形構上極其近似某一異體而略有小異,則應登錄其最近似之異體字形於資料庫中。惟登錄後應作註解及標記附加說明。
18.在教育部異體字辭典檢索結果中,倘有一異體字之正體字又兼作他字之異體時,應同時登錄其關聯性。
19.倘有一字經多次檢索,無法判斷其形、音、義或找不出通用字時,可連同前後文,一併交由專人判讀。為免工作時間零碎切割,可累積一定數量後,再交予專人處理。

二、流程圖步驟說明 (一)、步驟一「狀況判別」注意事項

1. 狀況一流程 (不知本字為何時) ,通常為字形問題而導致字義、字音難以辨別。但往往亦有字形得以辨認,但卻屬於古今字、俗字、避諱字、簡體字的情況,極容易被忽略,凡此皆當歸於狀況一流程下處理,宜據上下文意,小心判讀。
2.草書及手寫字一般不作異體字處理,但若有屬於古今字、俗字、避諱字、簡體字的使用情況,亦應視為異體字,在狀況一流程下處理。
3.狀況二流程(已知本字為何時),前提是字義、字音已確認無疑,惟字形有別於通用字,方適用於此流程。倘字義、字音於前後文中滯礙不通,雖字形得以辨認,亦當歸於狀況一流程下處理。

(二)、步驟二「形音義判斷」注意事項

1.狀況一流程下,由於異體字和通用字之間具有音同、義同之特性,因此此一步驟當以掌握其音、義為首要。
2.狀況一流程下,輸入檢索字形方案有三:

(1). 以倉頡、無蝦米等輸入法直接輸入該字形進行檢索,此為查詢異體字最快捷方案。 (2). 倘無法輸入該字形,則可據古籍前後文文意、語辭、形聲偏旁等線索,預設出一通用字後,逕入教育部異體字辭典網站進行檢索,此為標準方案。 (3). 倘無法預判出字形,則可利用工具書或檢索網站,透過部首、部件、筆劃、字音等方式直接查詢該異體字,此為最後方案。

3.狀況二流程下,字形小異於通用字者,如部件之缺筆、增筆、位移等情況,極可能即為異體字,不可以己意任意略過。已處理過之字形,可默記其形體變化,久而久之即可掌握其變化規律,加快處理速度。
4.狀況二流程下,既以「已知其本字」為前提,因此直接輸入其通用字形檢索即可。
(三)、步驟三「驗證及確認」注意事項
1.此步驟之異體字判定以教育部異體字辭典之字形檢索之結果為標準。倘有明為異體字,卻未見於教育部異體字辭典之情況,處理方式有二:

(1).字形特異於通用字而小異於某一異體字者,應視為與該字形體最近似之異體字。惟登錄於系統後,應作註解及標記附加說明。 (2).字形特異於通用字且所有異體字亦無與其近似者,則該字暫不處理。惟須另作註解及標記於文獻紙本上,以待日後處理。

2.上述兩種處理方式,狀況二流程下(已知其本字)之「字形小異」者不計在此列。
3.狀況二流程下,凡檢索出字形後均須重新審視文獻前後文文意是否與該字義相符,若有可疑,應以狀況一之流程重新處理。
4.其餘問題請參見一般注意事項。

(四)、步驟四「結果導出」注意事項

1.教育部異體字辭典網站檢索結果中,凡有另列「又作某字之異體」、「又作正體」或「古今字作某」、「俗字作某」等情況,均須將所有字形一併登錄於資料庫中。
2.冷僻字、難字在登錄資料庫時,應作字音及字義之註解。可參考教育部異體字辭典辭條之解釋,擇其精要另作註記。


◎「特字流程圖」與「異體字判別流程圖」二者間的關聯及適用情況

一、特字流程圖與異體字判別流程圖二者間的關係及定位

特字流程圖與異體字判別流程圖兩者皆是為解決文獻缺字問題所設計之流程圖,二者設計目的雖同,其輕重廣狹、適用情況、使用對象卻截然有別,倘不加區辨,極易產生混亂,故而應先從兩者之間的關係及定位說起:

1.二流程圖以特字流程圖為主,異體字判別流程圖為輔;以特字流程圖為優先,異體字判別流程圖為其次。
2.特字流程圖考量首重在缺字判定的原則問題上;異體字判定流程圖則著重於異體字之形、音、義的辨別問題上。
3.特字流程圖作為缺字判定之基本原則,全體工作人員一體適用;異體字判定流程圖則適用於「特字」處理人員。

二、特字流程圖與異體字判別流程圖二者間的具體適用情況

所有缺字處理以特字流程圖為第一序之作業流程。當確定該字無Unicode編碼,而進入「特字處理步驟」時,視情況需要,則可採用異體字判別流程圖。其具體適用情況如下:

1.凡難字、冷僻字需區辨其自身為正體或異體、或不知是否另有通用字時。
2.凡字形小異,需區辨為字形本身訛變或單純僅屬印刷板工問題時。
3.凡字形特異,本字不復辨識時,或字形訛變近於他字而需加以區辨時。
4.凡文獻前後文文義可疑,涉及一字多兼他義、多兼他形的問題時。

◎缺字及標記使用工具書可參見

Y:\Projects\fosizhi\work\tools\缺字及標記使用工用書