「《賢度法師著作集》數位化專案標記手冊」:修訂間差異
出自DILA Wiki
imported>Sinyue (→框線不顯示) |
imported>Sinyue (→p) |
||
行 55: | 行 55: | ||
==p== | ==p== | ||
標記散文的段落。 | |||
例:《華嚴學講義》p. 9 | |||
<syntaxhighlight lang="XML"> | <syntaxhighlight lang="XML"> | ||
<p> | <p> 佛有三身:身即聚集之義。</p> | ||
</syntaxhighlight> | </syntaxhighlight> | ||
於 2013年11月6日 (三) 09:08 的修訂
工作準備
Word轉XML步驟
1. 開 DOC
2. 全選→字型設為新細明體
3. 列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
4. 將 PDF 內的文字複製出來存成 TXT,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行。
5. 編輯 TXT,去掉頁首、頁尾的書名、章節名。
6. 使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml
- 自動加上頁碼、行號
- 直式標點轉橫式標點
圖檔掃描
- 掃描圖檔:
- 彩色圖:TIFF,全彩,300DPI
- 黑白圖:PNG,256灰階,300DPI
- 網頁:採用72DPI
- 檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images
- 命名:如:01.010.png、02.011.png……(01為冊數,010為頁碼)
檔頭
<teiHeader>
<fileDesc>
<titleStmt>
<title>華嚴學講義</title>
<author>賢度法師</author>
<funder>台北市華嚴蓮社</funder>
<principal>賢度法師</principal>
</titleStmt>
<editionStmt>
<edition>Version 1.0, TEI P5 <date when="2013"/></edition>
</editionStmt>
<publicationStmt>
<availability><p>本電子檔智慧財產權屬於台北市華嚴蓮社,不得散佈發行。</p></availability>
</publicationStmt>
<sourceDesc>
<bibl>
<title level="s">華嚴學海系列</title><biblScope>二</biblScope>
<title level="m">華嚴學講義</title>
<publisher>台北市華嚴蓮社</publisher>
<date when="2012-09-10">中華民國一〇一年九月十日</date><edition>八版三刷</edition>
</bibl>
</sourceDesc>
</fileDesc>
<revisionDesc>
<change when="2013-10"><name>周邦信</name> MS Word 轉為 TEI P5 標記</change>
</revisionDesc>
</teiHeader>
XML Elements
div
head
<div><head>…</head>…</div>
p
標記散文的段落。 例:《華嚴學講義》p. 9
<p>佛有三身:身即聚集之義。</p>
quote
quote包p
獨立一個段落的引文,例:《華嚴學講義》p. 329
<quote><p>若欲成就此功德門,應修十種廣大行願。何種為十?一者禮敬諸
佛,二者稱讚如來,三者廣修供養,四者懺悔業障,五者隨喜功德
,六者請轉法輪,七者請佛住世,八者常隨佛學,九者恆順眾生,
十者普皆迴向。</p></quote>
list
- list:(list) 包含以列表方式呈現的任何連續項目。
- item:包含列表中的一個項目。
例:《華嚴學講義》p. 248
<list>
<lb n="248.04"/><item>一、約證,於十地中,斷一切障惑。</item>
<lb n="248.05"/><item>二、約位,於十住上,已去斷一切惑障。</item>
<lb n="248.06"/><item>三、約行,於十信終心,斷一切障惑。</item>
<lb n="248.07"/><item>四、約實,一切惑障,本來清淨,故無可斷。</item>
</list>
pb
頁碼記錄於 pb 元素的 n 屬性,例如:
<pb n="1"/>
- 空白頁的頁碼暫時保留
lb
在 <lb> 的屬性 n 之前換行,n 屬性的格式為"頁碼.行號"
<pb n="1"/><lb
n="1.01"/><div><head>序</head><lb
n="1.02"/><p>當一個人面對現實世界的種種黑暗、罪惡、貧窮、愚痴等卑劣的環境,以<lb
n="1.03"/>及人性的貪、瞋、痴、慢、疑等煩惱時,應該是要厭棄它,而逃到一個,如西<lb
figure
圖內無文字
<figure><graphic url="01.010.png"/></figure>
圖檔標題
不出現於目錄的圖檔標題,例:《華嚴學講義》p. 133
<figure>
<head>賢首時儀教觀圖:</head>
<graphic url="01.133.png"/>
</figure>
圖檔名稱規則
table
- <cell rend="padding-left:3em;">
<lb>的位置
無框線
例:儲存格跨欄或跨列
框線不顯示
上框線不顯示: <cell rend="border-top:none">
下框線不顯示 :<cell rend="border-bottom:none">
左框線不顯示: <cell rend="border-left:none">
右框線不顯示 :<cell rend="border-right:none">
全集統一預設樣式
- <quote>:標楷體
統一首行內縮2格