「成一老和尚著作專案」:修訂間差異

出自DILA Wiki
imported>Tsairung lin
imported>Tsairung lin
行 9: 行 9:
=OCR前置作業=
=OCR前置作業=


*1.請影印店掃描PDF一面一頁 ,並以ABBYY處理。由於書籍需先歸還,故影印兩份黑白正本以供校對
*1.請影印店掃描PDF一面一頁。
*2.助理掃描彩色封面、表格、照片存檔。
*2.助理掃描彩色封面、表格、照片存檔。
*3.用程式跑,把以下符號刪除:〖〗;,'ヾー+ゝ>>乂广] «丄=〜()££丨¢!}♦ @§€© % $¥“® _ -——o〇◎》.••^ i{!*°< m±# <»&„~"■▲▼§/ |lIi #〇—:/〆卜パナムニミィイマベずゼドげギぞブぢぎぶ1234567890ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz?あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろプゲバぐザざダズデがごでぐノハコ々シヌソメアンキォアホルサヤレオエユントレ口
*3.用程式跑,把以下符號刪除:〖〗;,'ヾー+ゝ>>乂广] «丄=〜()££丨¢!}♦ @§€© % $¥“® _ -——o〇◎》.••^ i{!*°< m±# <»&„~"■▲▼§/ |lIi #〇—:/〆卜パナムニミィイマベずゼドげギぞブぢぎぶ1234567890ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz?あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろプゲバぐザざダズデがごでぐノハコ々シヌソメアンキォアホルサヤレオエユントレ口

於 2020年3月20日 (五) 09:55 的修訂

範圍

  • 成一老和尚著作專案共計 41 冊。

ABBY前製作業(一面掃成一頁) 例如第三冊:

  • 1.PDF 辨識
  • 2.轉成 TXT Document

OCR前置作業

  • 1.請影印店掃描PDF一面一頁。
  • 2.助理掃描彩色封面、表格、照片存檔。
  • 3.用程式跑,把以下符號刪除:〖〗;,'ヾー+ゝ>>乂广] «丄=〜()££丨¢!}♦ @§€© % $¥“® _ -——o〇◎》.••^ i{!*°< m±# <»&„~"■▲▼§/ |lIi #〇—:/〆卜パナムニミィイマベずゼドげギぞブぢぎぶ1234567890ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz?あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろプゲバぐザざダズデがごでぐノハコ々シヌソメアンキォアホルサヤレオエユントレ口
  • 4.空白處已處理自動斷行。
  • 5.位置P:\2020成一老和尚著作\05Work\03 OCR

OCR校對規範

  • 1.以Visual Studio Code校對。字數參考:非空白字符數。
  • 2.頁碼:請打在每一頁文字的開頭,自己獨立的一行。格式例如:p1 p2
  • 3.內縮空兩格請輸入:tab鍵
  • 4.需要如書一樣換行。
  • 5.雙行夾註,加入〔〕符號:

例如:《智光大師法彙》p3 〔國民大會代表〕〔滿分優婆塞〕 蔡運辰法名寬運拜撰

  • 6.「圖片檔案」的文字請刪除,將以掃描檔方式呈現。
  • 7.「隔頁書名」請刪除。
  • 8.「頁眉」請刪除。
  • 9.「目錄」請刪除。
  • 10.出版資訊請刪除
  • 11.異體字,請參考異體字表格:保留原書字體。例如四「衆」弟子
  • 12.如果打不出該文字,或者無法判斷該文字是否有誤,例如:異體字,請先打上●
  • 13.經文前標示英文字母J(不用內縮空兩格)。
  • 14.破折號輸入:——(請複製該格式)
  • 15.針對有疑問的字詞,請「列表清單」:例如第四冊,p91,絕對沒有那「們」(疑為「麼」)
  • 16.針對內容有疑慮部分,請「列表」參照。