「缺字 SOP 流程」:修訂間差異

出自DILA Wiki
imported>April
(新頁面: 異體字判定SOP流程圖說明 一、一般注意事項 1. 所有異體字之判斷應以教育部異體字辭典之字形檢索之結果為標準。 2. 所謂「異體字判定」斷...)
 
imported>April
無編輯摘要
行 2: 行 2:


 一、一般注意事項
 一、一般注意事項
1. 所有異體字之判斷應以教育部異體字辭典之字形檢索之結果為標準。
1.所有異體字之判斷應以教育部異體字辭典之字形檢索之結果為標準。
2. 所謂「異體字判定」斷除了異體字本身之判斷外,亦包含其通用字的正確判斷。
2. 所謂「異體字判定」斷除了異體字本身之判斷外,亦包含其通用字的正確判斷。
3. 所有異體字判定,不能僅針對字形判讀,其字義、字音亦應列入考量範圍。否則極易發生誤判。
3. 所有異體字判定,不能僅針對字形判讀,其字義、字音亦應列入考量範圍。否則極易發生誤判。

於 2010年5月25日 (二) 16:20 的修訂

異體字判定SOP流程圖說明

一、一般注意事項 1.所有異體字之判斷應以教育部異體字辭典之字形檢索之結果為標準。 2. 所謂「異體字判定」斷除了異體字本身之判斷外,亦包含其通用字的正確判斷。 3. 所有異體字判定,不能僅針對字形判讀,其字義、字音亦應列入考量範圍。否則極易發生誤判。 例如:「誌」的其中一異體字作「識」,而「識」又自為正體字,因此應據文意小心判讀,方能決定其通用字為「誌」或「識」。 4. 凡字形小異於通用字者,如部件之缺筆、增筆、位移等情況,不可任意輕忽略過,應以教育部異體字辭典檢索之結果為準。 例如:「兌」為正體字,其異體字形「兑」明見於教育部異體字辭典中,則「兑」即應視為一異體字。 5. 凡俗字、古今字、避諱字、簡體字(「簡體」謂古書中之簡化字,非謂大陸及日本使用之簡體字),無拘其自身是否另兼他字之正體,皆應視為異體字。 例如:「体」為「體」的簡化字,又為「笨」的異體字;「体」雖自為正體字,卻為「體」、「笨」的異體字形,因此「体」即應作異體字處理。 6. 俗字、古今字、避諱字、簡體字即使其自身字形為正體,亦當視為異體字。倘文獻出現其正體則登錄正體,倘出現其異體則登錄其異體。登錄後應作註解及標記附加說明。 7. 冷僻字、難字即使自為正體,基於其形音義非普遍通用,廣義上亦應視為異體字,登錄後應作註解及標記附加說明。 8. 草書及手寫字不在異體字判別範圍內,但若有俗字、古今字、避諱字、簡體字、冷僻字、難字等使用情況,則應視為異體字。 9. 通假、假借等狀況不視為異體字。 例如:「蹻」為「屩」的假借現象,各有其本義,非由字形孳乳而產生的異體關係,雖文獻中有彼此借用的現象,亦不視為異體字。 10. 若通假、假借所使用之字形異於通用字時,則應視為異體字。 例如:「嬴」通假作「贏」使用時,本不視為異體字。但此通假字「嬴」倘有使用異體字的狀況作 時,則當然視為異體。 11. 教育部異體字辭典檢索結果中,其辭條中有謂「通某字」時,大抵屬於通假及假借現象,不作異體字處理。 12. 日韓新造漢字,其形音義為其本國所獨有,不視為異體字。 13. 印刷不清及版工等問題不視為異體字,可在經驗原則下事先排除,以免徒費精力。 14. 印刷不清或版工問題應以教育部異體字辭典檢索結果為判準。凡字形小異者,於教育部異體字辭典檢索結果中未發現相同字形者,乃可不作處理。 15. 在教育部異體字辭典檢索結果中,一異體字另作他字正體、另作他字異體、另作他字俗體時,皆應登錄其本字於資料庫中。 例如:「廼」為「迺」之異體字形,又為「乃」之異體字形,因此「廼」在文獻中即有可能作「乃」或「迺」。除了據文意小心判斷外,亦應同時登錄其本字於資料庫中。 16. 在教育部異體字辭典檢索結果中,若有二字互為正體、異體時,亦皆應登錄於資料庫中。 17. 在教育部異體字辭典檢索結果中,倘有一異體字之字形特異於正體,形構上極其近似某一異體而略有小異,則應登錄其最近似之異體字形於資料庫中。惟登錄後應作註解及標記附加說明。 18. 在教育部異體字辭典檢索結果中,倘有一異體字之正體字又兼作他字之異體時,應同時登錄其關聯性。 19. 倘有一字經多次檢索,無法判斷其形、音、義或找不出通用字時,可連同前後文,一併交由專人判讀。為免工作時間零碎切割,可累積一定數量後,再交予專人處理。

二、流程圖步驟說明 (一)、步驟一「狀況判別」注意事項 1. 狀況一流程 (不知本字為何時) ,通常為字形問題而導致字義、字音難以辨別。但往往亦有字形得以辨認,但卻屬於古今字、俗字、避諱字、簡體字的情況,極容易被忽略,凡此皆當歸於狀況一流程下處理,宜據上下文意,小心判讀。

2.草書及手寫字一般不作異體字處理,但若有屬於古今字、俗字、避諱字、簡體字的使用情況,亦應視為異體字,在狀況一流程下處理。 3.狀況二流程(已知本字為何時),前提是字義、字音已確認無疑,惟字形有別於通用字,方適用於此流程。倘字義、字音於前後文中滯礙不通,雖字形得以辨認,亦當歸於狀況一流程下處理。

(二)、步驟二「形音義判斷」注意事項 1. 狀況一流程下,由於異體字和通用字之間具有音同、義同之特性,因此此一步驟當以掌握其音、義為首要。 2. 狀況一流程下,輸入檢索字形方案有三: (1). 以倉頡、無蝦米等輸入法直接輸入該字形進行檢索,此為查詢異體字最快捷方案。 (2). 倘無法輸入該字形,則可據古籍前後文文意、語辭、形聲偏旁等線索,預設出一通用字後,逕入教育部異體字辭典網站進行檢索,此為標準方案。 (3). 倘無法預判出字形,則可利用工具書或檢索網站,透過部首、部件、筆劃、字音等方式直接查詢該異體字,此為最後方案。 3. 狀況二流程下,字形小異於通用字者,如部件之缺筆、增筆、位移等情況,極可能即為異體字,不可以己意任意略過。已處理過之字形,可默記其形體變化,久而久之即可掌握其變化規律,加快處理速度。 4. 狀況二流程下,既以「已知其本字」為前提,因此直接輸入其通用字形檢索即可。

(三)、步驟三「驗證及確認」注意事項

1. 此步驟之異體字判定以教育部異體字辭典之字形檢索之結果為標準。倘有明為異體字,卻未見於教育部異體字辭典之情況,處理方式有二: (1).字形特異於通用字而小異於某一異體字者,應視為與該字形體最近似之異體字。惟登錄於系統後,應作註解及標記附加說明。   (2).字形特異於通用字且所有異體字亦無與其近似者,則該字暫不處理。惟須另作註解及標記於文獻紙本上,以待日後處理。 2. 上述兩種處理方式,狀況二流程下(已知其本字)之「字形小異」者不計在此列。 3. 狀況二流程下,凡檢索出字形後均須重新審視文獻前後文文意是否與該字義相符,若有可疑,應以狀況一之流程重新處理。 4. 其餘問題請參見一般注意事項。

(四)、步驟四「結果導出」注意事項 1. 教育部異體字辭典網站檢索結果中,凡有另列「又作某字之異體」、「又作正體」或「古今字作某」、「俗字作某」等情況,均須將所有字形一併登錄於資料庫中。 2. 冷僻字、難字在登錄資料庫時,應作字音及字義之註解。可參考教育部異體字辭典辭條之解釋,擇其精要另作註記。