《賢度法師著作集》數位化專案標記手冊

出自DILA Wiki
於 2013年11月5日 (二) 20:10 由 imported>Sinyue 所做的修訂 →‎div

工作準備

Word轉XML步驟

1. 開 DOC
2. 全選→字型設為新細明體
3. 列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
4. 將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行。
5. 編輯 TXT,去掉頁首、頁尾的書名、章節名。
6. 使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml

  • 自動加上頁碼、行號
  • 直式標點轉橫式標點

圖檔掃描

  • 掃描圖檔:
    • 彩色圖:TIFF,全彩,300DPI
    • 黑白圖:PNG,256灰階,300DPI
  • 網頁:採用72DPI
  • 檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images
  • 命名:如:01.010.png、02.011.png……(01為冊數,010為頁碼)

檔頭

<teiHeader>
    <fileDesc>
      <titleStmt>
        <title>華嚴學講義</title>
        <author>賢度法師</author>
        <funder>台北市華嚴蓮社</funder>
        <principal>賢度法師</principal>
      </titleStmt>
      <editionStmt>
        <edition>Version 1.0, TEI P5 <date when="2013"/></edition>
      </editionStmt>
      <publicationStmt>
        <availability><p>本電子檔智慧財產權屬於台北市華嚴蓮社,不得散佈發行。</p></availability>
      </publicationStmt>
      <sourceDesc>
        <bibl>
          <title level="s">華嚴學海系列</title><biblScope></biblScope>
          <title level="m">華嚴學講義</title>
          <publisher>台北市華嚴蓮社</publisher>
          <date when="2012-09-10">中華民國一〇一年九月十日</date><edition>八版三刷</edition>
        </bibl>
      </sourceDesc>
    </fileDesc>
    <revisionDesc>
       <change when="2013-10"><name>周邦信</name> MS Word 轉為 TEI P5 標記</change>
    </revisionDesc>
</teiHeader>

XML Elements

div

head

p

quote

list

pb

lb

figure

table