《賢度法師著作集》數位化專案標記手冊

出自DILA Wiki
於 2013年11月5日 (二) 19:39 由 imported>Sinyue 所做的修訂 →‎工作準備:Word轉XML
(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

工作準備:

Word轉XML步驟

1.開 DOC 2.全選→字型設為新細明體 3.列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf 4.將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行. 5.編輯 TXT,去掉頁首、頁尾的書名、章節名. 6.使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml.

 (1)自動加上頁碼、行號
 (2)直式標點轉橫式標點