「《賢度法師著作集》數位化專案標記手冊」:修訂間差異
出自DILA Wiki
imported>Sinyue |
imported>Sinyue (→圖檔掃描) |
||
行 17: | 行 17: | ||
*檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images | *檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images | ||
*命名:如:01.010.png、02.011.png……(01為冊數,010為頁碼) | *命名:如:01.010.png、02.011.png……(01為冊數,010為頁碼) | ||
=檔頭= |
於 2013年11月5日 (二) 19:56 的修訂
工作準備
Word轉XML步驟
1. 開 DOC
2. 全選→字型設為新細明體
3. 列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
4. 將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行。
5. 編輯 TXT,去掉頁首、頁尾的書名、章節名。
6. 使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml
- 自動加上頁碼、行號
- 直式標點轉橫式標點
圖檔掃描
- 掃描圖檔:
- 彩色圖:TIFF,全彩,300DPI
- 黑白圖:PNG,256灰階,300DPI
- 網頁:採用72DPI
- 檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images
- 命名:如:01.010.png、02.011.png……(01為冊數,010為頁碼)