「《賢度法師著作集》數位化專案標記手冊」:修訂間差異

出自DILA Wiki
imported>Sinyue
imported>Sinyue
行 1: 行 1:
=工作準備=
=工作準備=
==Word轉XML步驟==
==Word轉XML步驟==
* 開 DOC
(1) 開 DOC
* 全選→字型設為新細明體
(2) 全選→字型設為新細明體
* 列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
(3) 列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
* 將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行.
(4) 將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行.
* 編輯 TXT,去掉頁首、頁尾的書名、章節名.
(5) 編輯 TXT,去掉頁首、頁尾的書名、章節名.
* 使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml.
(6) 使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml.
   **自動加上頁碼、行號
   *自動加上頁碼、行號
   **直式標點轉橫式標點
   *直式標點轉橫式標點

於 2013年11月5日 (二) 19:45 的修訂

工作準備

Word轉XML步驟

(1)開 DOC (2)全選→字型設為新細明體 (3)列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf (4)將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行. (5)編輯 TXT,去掉頁首、頁尾的書名、章節名. (6)使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml.

 *自動加上頁碼、行號
 *直式標點轉橫式標點