《賢度法師著作集》數位化專案標記手冊
出自DILA Wiki
工作準備
Word轉XML步驟
1. 開 DOC
2. 全選→字型設為新細明體
3. 列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
4. 將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行。
5. 編輯 TXT,去掉頁首、頁尾的書名、章節名。
6. 使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml
- 自動加上頁碼、行號
- 直式標點轉橫式標點
圖檔掃描
- 掃描圖檔:
- 彩色圖:TIFF,全彩,300DPI
- 黑白圖:PNG,256灰階,300DPI
- 網頁:採用72DPI
- 檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images
- 命名:如:01.010.png、02.011.png……(01為冊數,010為頁碼)
檔頭
<teiHeader>
<fileDesc>
<titleStmt>
<title>華嚴學講義</title>
<author>賢度法師</author>
<funder>台北市華嚴蓮社</funder>
<principal>賢度法師</principal>
</titleStmt>
<editionStmt>
<edition>Version 1.0, TEI P5 <date when="2013"/></edition>
</editionStmt>
<publicationStmt>
<availability><p>本電子檔智慧財產權屬於台北市華嚴蓮社,不得散佈發行。</p></availability>
</publicationStmt>
<sourceDesc>
<bibl>
<title level="s">華嚴學海系列</title><biblScope>二</biblScope>
<title level="m">華嚴學講義</title>
<publisher>台北市華嚴蓮社</publisher>
<date when="2012-09-10">中華民國一〇一年九月十日</date><edition>八版三刷</edition>
</bibl>
</sourceDesc>
</fileDesc>
<revisionDesc>
<change when="2013-10"><name>周邦信</name> MS Word 轉為 TEI P5 標記</change>
</revisionDesc>
</teiHeader>
XML Elements
div
head
<div><head>…</head>…</div>
p
標記散文的段落。 例:《華嚴學講義》p. 9
<p>佛有三身:身即聚集之義。</p>
quote
quote包p
獨立一個段落的引文,例:《華嚴學講義》p. 329
<quote><p>若欲成就此功德門,應修十種廣大行願。何種為十?一者禮敬諸
佛,二者稱讚如來,三者廣修供養,四者懺悔業障,五者隨喜功德
,六者請轉法輪,七者請佛住世,八者常隨佛學,九者恆順眾生,
十者普皆迴向。</p></quote>
list
- list:(list) 包含以列表方式呈現的任何連續項目。
- item:包含列表中的一個項目。
例:《華嚴學講義》p. 248
<list>
<lb n="248.04"/><item>一、約證,於十地中,斷一切障惑。</item>
<lb n="248.05"/><item>二、約位,於十住上,已去斷一切惑障。</item>
<lb n="248.06"/><item>三、約行,於十信終心,斷一切障惑。</item>
<lb n="248.07"/><item>四、約實,一切惑障,本來清淨,故無可斷。</item>
</list>
pb
頁碼記錄於 pb 元素的 n 屬性,例如:
<pb n="1"/>
- 空白頁的頁碼暫時保留
lb
在 <lb> 的屬性 n 之前換行,n 屬性的格式為"頁碼.行號"
<pb n="1"/><lb
n="1.01"/><div><head>序</head><lb
n="1.02"/><p>當一個人面對現實世界的種種黑暗、罪惡、貧窮、愚痴等卑劣的環境,以<lb
n="1.03"/>及人性的貪、瞋、痴、慢、疑等煩惱時,應該是要厭棄它,而逃到一個,如西<lb
figure
圖內無文字
<figure><graphic url="01.010.png"/></figure>
圖檔標題
不出現於目錄的圖檔標題,例:《華嚴學講義》p. 133
<figure>
<head>賢首時儀教觀圖:</head>
<graphic url="01.133.png"/>
</figure>
table
例:《華嚴學講義》p. 33
<table>
<head>附表:</head>
<lb n="31.02"/>
<row>
<cell>經名</cell><cell>內容</cell><cell>譯者</cell><cel>時間</cell><cell>地點</cell>
</row>
<lb n="31.03"/>
<row>
<cell>九卷梵本,攜入中<lb n="31.04"/>國,華嚴前分三萬<lb n="31.05"/>六千偈三十四品<lb n="31.06"/>《六十華嚴》。</cell><cell>三十八品略本。<lb n="31.04"/>缺十定品,七處八會<lb n="31.05"/>未完整。
舊譯教學價<lb n="31.06"/>值高,稱為晉經。</cell><cell>支法嶺佛馱跋陀羅<lb n="31.04"/>尊者主譯,與沙門法<lb n="31.05"/>業、慧嚴等百餘人。</cell><cell>東晉義熙十四年<lb n="31.04"/>至元熙二年。
<lb n="31.05"/>西元四一八年至<lb n="31.06"/>四二○年。</cell><cell>遮拘槃國<lb n="31.04"/>道場寺<lb n="31.05"/>華嚴堂</cell>
</row>
...
</table>
<lb>的位置
- 表格的列與列之間換行的 <lb> 放在 <row> 與 <row> 之間。
無框線
例:《華嚴學講義》p. 185
<table rendition="no_border">
<lb n="185.02"/><row><cell>德相十玄:</cell><cell>業用十玄:</cell></row>
<lb n="185.03"/><row><cell>⑴同時具足相應德</cell><cell>⑴同時具足相應用</cell></row>
<lb n="185.04"/><row><cell>⑵相即德</cell><cell>⑵相即用</cell></row>
<lb n="185.05"/><row><cell>⑶相在德</cell><cell>⑶相在用</cell></row>
<lb n="185.06"/><row><cell>⑷隱顯德</cell><cell>⑷相入用</cell></row>
<lb n="185.07"/><row><cell>⑸伴德</cell><cel>⑸相作用</cell></row>
<lb n="185.08"/><row><cell>⑹同體成即德</cell><cell>⑹純雜用</cell></row>
<lb n="185.09"/><row><cell>⑺具足無盡德</cell><cell>⑺隱顯用</cell></row>
<lb n="185.10"/><row><cell>⑻純雜德</cell><cell>⑻主伴用</cell></row>
<lb n="185.11"/><row><cell>⑼微細德</cell><cell>⑼微細用</cell></row>
<lb n="185.12"/><row><cell>⑽如因陀羅網德</cell><cell>⑽如因陀羅網用</cell></row>
</table>
儲存格跨欄或跨列
- row 元素表示表格的一列
- cell 元素表示表格的一格
- cell 元素的 cols 屬性表示這一格跨了幾欄
- cell 元素的 rows 屬性表示這一格跨了幾列
- 跨三欄:<cell cols=”3”>
- 跨三列:<cell rows=”3”>
框線不顯示
- 上框線不顯示:<cell rend="border-top:none">
- 下框線不顯示:<cell rend="border-bottom:none">
- 左框線不顯示:<cell rend="border-left:none">
- 右框線不顯示:<cell rend="border-right:none">
全集統一預設樣式
- <quote>:標楷體,整段內縮兩格。
- <lg>、<list>:整段內縮兩格。
- <figure>與
css
邊界
margin
- 左邊界1個字:margin-left:1em
padding(內距)
- padding-left:1em
例:《華嚴學講義》p. 182
<cell rend="padding-left:1em;">因陀羅網境界門</cell>
text(文字)
縮排
- 首行縮排2個字:text-indent:2em(負值變成凸排)
- 置中:text-align:center
- 靠右:text-align:right
例:《華嚴學講義》p. 9 首行內縮2個字,第二行內縮3個字,要設左邊界3個字,首行縮排-1個字
<p rend="margin-left:3em;text-indent:-1em">㈠理法之聚集稱為法身,滅除一切煩惱等障,而具足一切之諸善法故。為<lb
n="9.08"/>證顯實相真如之理體,無二無別,常住湛然稱為法身,是如來藏的顯現<lb
n="9.09"/>狀態。</p>
字體
- 粗體:font-weight:bold