「《賢度法師著作集》數位化專案標記手冊」:修訂間差異
出自DILA Wiki
imported>Sinyue |
imported>Sinyue |
||
行 1: | 行 1: | ||
=工作準備= | =工作準備= | ||
==Word轉XML步驟== | ==Word轉XML步驟== | ||
(1)開 DOC | (1)開 DOC<br> | ||
(2)全選→字型設為新細明體 | (2)全選→字型設為新細明體<br> | ||
(3)列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf | (3)列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf<br> | ||
(4)將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行. | (4)將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行.<br> | ||
(5)編輯 TXT,去掉頁首、頁尾的書名、章節名. | (5)編輯 TXT,去掉頁首、頁尾的書名、章節名.<br> | ||
(6)使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml. | (6)使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml.<br> | ||
*自動加上頁碼、行號 | *自動加上頁碼、行號 | ||
*直式標點轉橫式標點 | *直式標點轉橫式標點<br> |
於 2013年11月5日 (二) 19:46 的修訂
工作準備
Word轉XML步驟
(1)開 DOC
(2)全選→字型設為新細明體
(3)列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
(4)將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行.
(5)編輯 TXT,去掉頁首、頁尾的書名、章節名.
(6)使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml.
*自動加上頁碼、行號 *直式標點轉橫式標點