成一老和尚著作專案

出自DILA Wiki
於 2020年4月8日 (三) 13:42 由 imported>Tsairung lin 所做的修訂 →‎OCR校對規範

範圍

  • 《成一老和尚全集》共計 41 冊。

修訂

  • P:\2020成一老和尚著作\07修訂

ABBY前製作業

以ABBYY處理,一面一頁。

  • 1.PDF 辨識
  • 2.轉成 TXT Document

OCR前置作業

  1. 由於書籍需先歸還,故請影印店掃描黑白PDF、影印2份正本,以供校對。
  2. 彩色封面、表格、照片由助理掃描存檔。

OCR

  • P:\2020成一老和尚著作\05Work\03OCR
  • P:\2020成一老和尚著作\05Work\05專案助理處理

OCR後置作業

  1. 用程式自動處理
    1. 以下符號刪除:
      1. 日文、半行英數字
      2. 〖〗;,'ヾー+ゝ>>乂广] «丄=〜()££丨¢!}♦ @§€© % $¥“® _ -——o〇◎》.••^ i{!*°< m±# <»&„~"■▲▼§/ |lIi #〇—:/〆卜?口
    2. 半行空白,轉為換行。

OCR校對規範

  • 1.以Visual Studio Code校對。字數參考:「非空白字符數」。
  • 2.頁碼:請打在每一頁文字的開頭,自己獨立的一行。
例如:p1。序格式:a1
例如:遇空白頁直接寫頁碼,如頁六無內容,頁七開始有內容,則第一行:p6,第二行:p7。
  • 3.內縮空兩格請輸入:tab鍵
  • 4.需要如書一樣換行。
  • 5.雙行夾註,請加入〔〕符號:
例如:《智光大師法彙》p3,〔國民大會代表〕〔滿分優婆塞〕 蔡運辰法名寬運拜撰......
  • 6.「圖片檔案」的文字請刪除。(專案助理之後將以掃描檔方式呈現。)
  • 7.「隔頁書名」請刪除。(專案助理會處理。)
  • 8.「頁眉」請刪除。(專案助理會處理。)
  • 9.「目錄」請刪除。(專案助理會處理。)
  • 10.出版資訊請刪除。(專案助理會處理。)
  • 11.標題、粗體、科判、結尾語不須處理。(專案助理後續標記。)
  • 12.異體字,請參考異體字表格:保留原書字體。(遇到異體字先保留原書異體字體,留待二校同時保留原書字體及正體字(正規化)。)
例如:四「衆」弟子
  • 13.如果打不出該文字,或者無法判斷該文字是否有誤。
例如:異體字,請先打上●
  • 14.經文之前,請標示英文字母J(不用內縮空兩格)。
例如:《華嚴一乘教義章集解》p10:
建立一乘第一,		教義攝益第二,						
古今立教第三,		分教開宗第四,
乘教開合第五,		教起前後第六,
決擇其義第七,		施設異相第八,
所詮差別第九,		義理分齊第十。
  • 15.破折號輸入:——(請複製該格式)
  • 16.音界號 . / 書名號 《 》 〈 〉 ,請按原書處理。
  • 17.針對有疑問的字詞,請「列表清單」。
例如:第四冊,p91,絕對沒有那「們」(疑為「麼」)
  • 18.針對內容有疑慮部分,請「列表」參照。