《賢度法師著作集》數位化專案標記手冊

出自DILA Wiki
於 2013年11月6日 (三) 14:42 由 imported>Sinyue 所做的修訂 →‎全集統一預設樣式

工作準備

Word轉XML步驟

1. 開 DOC
2. 全選→字型設為新細明體
3. 列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
4. 將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行。
5. 編輯 TXT,去掉頁首、頁尾的書名、章節名。
6. 使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml

  • 自動加上頁碼、行號
  • 直式標點轉橫式標點

圖檔掃描

  • 掃描圖檔:
    • 彩色圖:TIFF,全彩,300DPI
    • 黑白圖:PNG,256灰階,300DPI
  • 網頁:採用72DPI
  • 檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images
  • 命名:如:01.010.png、02.011.png……(01為冊數,010為頁碼)

檔頭

<teiHeader>
    <fileDesc>
      <titleStmt>
        <title>華嚴學講義</title>
        <author>賢度法師</author>
        <funder>台北市華嚴蓮社</funder>
        <principal>賢度法師</principal>
      </titleStmt>
      <editionStmt>
        <edition>Version 1.0, TEI P5 <date when="2013"/></edition>
      </editionStmt>
      <publicationStmt>
        <availability><p>本電子檔智慧財產權屬於台北市華嚴蓮社,不得散佈發行。</p></availability>
      </publicationStmt>
      <sourceDesc>
        <bibl>
          <title level="s">華嚴學海系列</title><biblScope></biblScope>
          <title level="m">華嚴學講義</title>
          <publisher>台北市華嚴蓮社</publisher>
          <date when="2012-09-10">中華民國一〇一年九月十日</date><edition>八版三刷</edition>
        </bibl>
      </sourceDesc>
    </fileDesc>
    <revisionDesc>
       <change when="2013-10"><name>周邦信</name> MS Word 轉為 TEI P5 標記</change>
    </revisionDesc>
</teiHeader>

XML Elements

div

head

<div><head></head></div>

p

標記散文的段落。 例:《華嚴學講義》p. 9

<p>佛有三身:身即聚集之義。</p>

quote

quote包p

獨立一個段落的引文,例:《華嚴學講義》p. 329

<quote><p>若欲成就此功德門,應修十種廣大行願。何種為十?一者禮敬諸
佛,二者稱讚如來,三者廣修供養,四者懺悔業障,五者隨喜功德
,六者請轉法輪,七者請佛住世,八者常隨佛學,九者恆順眾生,
十者普皆迴向。</p></quote>

list

  • list:(list) 包含以列表方式呈現的任何連續項目。
  • item:包含列表中的一個項目。

例:《華嚴學講義》p. 248

<list>
<lb n="248.04"/><item>一、約證,於十地中,斷一切障惑。</item>
<lb n="248.05"/><item>二、約位,於十住上,已去斷一切惑障。</item>
<lb n="248.06"/><item>三、約行,於十信終心,斷一切障惑。</item>
<lb n="248.07"/><item>四、約實,一切惑障,本來清淨,故無可斷。</item>
</list>

pb

頁碼記錄於 pb 元素的 n 屬性,例如:

<pb n="1"/>
  • 空白頁的頁碼暫時保留

lb

在 <lb> 的屬性 n 之前換行,n 屬性的格式為"頁碼.行號"

<pb n="1"/><lb 
n="1.01"/><div><head></head><lb 
n="1.02"/><p>當一個人面對現實世界的種種黑暗、罪惡、貧窮、愚痴等卑劣的環境,以<lb 
n="1.03"/>及人性的貪、瞋、痴、慢、疑等煩惱時,應該是要厭棄它,而逃到一個,如西<lb

figure

圖內無文字

<figure><graphic url="01.010.png"/></figure>

圖檔標題

不出現於目錄的圖檔標題,例:《華嚴學講義》p. 133

<figure>
<head>賢首時儀教觀圖:</head>
<graphic url="01.133.png"/>
</figure>


table

例:《華嚴學講義》p. 33

<table>
<head>附表:</head>
<lb n="31.02"/>
<row>
<cell>經名</cell><cell>內容</cell><cell>譯者</cell><cel>時間</cell><cell>地點</cell>
</row>
<lb n="31.03"/>
<row>
<cell>九卷梵本,攜入中<lb n="31.04"/>國,華嚴前分三萬<lb n="31.05"/>六千偈三十四品<lb n="31.06"/>《六十華嚴》。</cell><cell>三十八品略本。<lb n="31.04"/>缺十定品,七處八會<lb n="31.05"/>未完整。
舊譯教學價<lb n="31.06"/>值高,稱為晉經。</cell><cell>支法嶺佛馱跋陀羅<lb n="31.04"/>尊者主譯,與沙門法<lb n="31.05"/>業、慧嚴等百餘人。</cell><cell>東晉義熙十四年<lb n="31.04"/>至元熙二年。
<lb n="31.05"/>西元四一八年至<lb n="31.06"/>四二○年。</cell><cell>遮拘槃國<lb n="31.04"/>道場寺<lb n="31.05"/>華嚴堂</cell>
</row>
...
</table>

<lb>的位置

  • 表格的列與列之間換行的 <lb> 放在 <row> 與 <row> 之間。

無框線


例:《華嚴學講義》p. 185
<table rendition="no_border">
<lb n="185.02"/><row><cell>德相十玄:</cell><cell>業用十玄:</cell></row>
<lb n="185.03"/><row><cell>⑴同時具足相應德</cell><cell>⑴同時具足相應用</cell></row>
<lb n="185.04"/><row><cell>⑵相即德</cell><cell>⑵相即用</cell></row>
<lb n="185.05"/><row><cell>⑶相在德</cell><cell>⑶相在用</cell></row>
<lb n="185.06"/><row><cell>⑷隱顯德</cell><cell>⑷相入用</cell></row>
<lb n="185.07"/><row><cell>⑸伴德</cell><cel>⑸相作用</cell></row>
<lb n="185.08"/><row><cell>⑹同體成即德</cell><cell>⑹純雜用</cell></row>
<lb n="185.09"/><row><cell>⑺具足無盡德</cell><cell>⑺隱顯用</cell></row>
<lb n="185.10"/><row><cell>⑻純雜德</cell><cell>⑻主伴用</cell></row>
<lb n="185.11"/><row><cell>⑼微細德</cell><cell>⑼微細用</cell></row>
<lb n="185.12"/><row><cell>⑽如因陀羅網德</cell><cell>⑽如因陀羅網用</cell></row>
</table>

儲存格跨欄或跨列

  • row 元素表示表格的一列
  • cell 元素表示表格的一格
  • cell 元素的 cols 屬性表示這一格跨了幾欄
  • cell 元素的 rows 屬性表示這一格跨了幾列
  • 跨三欄:<cell cols=”3”>
  • 跨三列:<cell rows=”3”>

框線不顯示

  • 上框線不顯示:<cell rend="border-top:none">
  • 下框線不顯示:<cell rend="border-bottom:none">
  • 左框線不顯示:<cell rend="border-left:none">
  • 右框線不顯示:<cell rend="border-right:none">

全集統一預設樣式

  • <quote>:標楷體,整段內縮兩格。
  • <lg>、<list>:整段內縮兩格。
  • <figure>與
下的<head>不於目錄裡呈現。

css

邊界

margin

  • 左邊界1個字:margin-left:1em

padding(內距)

  • padding-left:1em

例:《華嚴學講義》p. 182

<cell rend="padding-left:1em;">因陀羅網境界門</cell>

text(文字)

縮排

  • 首行縮排2個字:text-indent:2em(負值變成凸排)
  • 置中:text-align:center
  • 靠右:text-align:right

例:《華嚴學講義》p. 9 首行內縮2個字,第二行內縮3個字,要設左邊界3個字,首行縮排-1個字

<p rend="margin-left:3em;text-indent:-1em">㈠理法之聚集稱為法身,滅除一切煩惱等障,而具足一切之諸善法故。為<lb 
n="9.08"/>證顯實相真如之理體,無二無別,常住湛然稱為法身,是如來藏的顯現<lb 
n="9.09"/>狀態。</p>

字體

  • 粗體:font-weight:bold

css