「《賢度法師著作集》數位化專案標記手冊」:修訂間差異
imported>Sinyue |
imported>Sinyue (→list) |
||
行 144: | 行 144: | ||
</list> | </list> | ||
</syntaxhighlight> | </syntaxhighlight> | ||
*兩層 list | *兩層 list(list in list) | ||
例:《華嚴經十地品淺釋》(下冊),p1 | 例:《華嚴經十地品淺釋》(下冊),p1 | ||
<syntaxhighlight lang="XML"> | <syntaxhighlight lang="XML"> | ||
行 155: | 行 155: | ||
</list> | </list> | ||
</syntaxhighlight> | </syntaxhighlight> | ||
==lg== | ==lg== | ||
TEI 定義:<lg> (行組) 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。<br> | TEI 定義:<lg> (行組) 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。<br> |
於 2014年4月9日 (三) 10:49 的修訂
工作準備
Word轉XML步驟
1、開 DOC
2、全選→字型設為新細明體
3、列印→Adobe PDF→存成PDF,放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step1-pdf
4、將 PDF 內的文字複製出來存成 TXT(編碼用 UTF-8 有 BOM),放到Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step2-txt,內含頁碼, 保持原書斷行。
5、編輯 TXT,去掉頁首、頁尾的書名、章節名。
6、使用 python 程式 bin/t2x.py 將 TXT 轉為 XML,放在Y:\Projects\2013《賢度法師著作》數位化專案\05Work\step3-xml
(1)自動加上頁碼、行號
(2)直式標點轉橫式標點
圖檔掃描
- 掃描圖檔:
- 彩色圖:TIFF,全彩,300DPI
- 黑白圖:PNG,黑白,300DPI
- 網頁:採用72DPI
- 檔案:Y:\Projects\2013《賢度法師著作》數位化專案\05Work\images
- 命名:
- 如:01.010.png、02.011.png……(01為冊數,010為頁碼)
- 圖檔若是於兩頁之間,則命名為:01.頁碼a.png。
例如:《華嚴學講義》「賢首五教斷證之圖」於p272、p273之間,命名為01.272a.png
字元處理
空格
- 若兩個語詞之間有空格,皆改用全形空格,而非半形空格,例如:「第一章 華嚴經探源」改為「第一章 華嚴經探源」
- 一個語詞內若有無意義的空格,例如:「經 名」,皆將空格取消,採用「經名」。
表意數字零
若是國字(中日韓表意文字)的數字零採用〇(Unicode U+3007),如: 一二三四五六七八九「〇」、一九八「〇」
- 「一二三四...九」在 Unicode 定義是 CJK Ideograph(中日韓表意文字)
- 「〇(U+3007)」的 Unicode 定義是 Ideographic Number Zero(表意數字零)
teiHeader
<teiHeader>
<fileDesc>
<titleStmt>
<title>華嚴學講義</title>
<author>賢度法師</author>
<funder>台北市華嚴蓮社</funder>
<principal>賢度法師</principal>
</titleStmt>
<editionStmt>
<edition>Version 1.0, TEI P5 <date when="2013"/></edition>
</editionStmt>
<publicationStmt>
<availability><p>本電子檔智慧財產權屬於台北市華嚴蓮社,不得散佈發行。</p></availability>
</publicationStmt>
<sourceDesc>
<bibl>
<title level="s">華嚴學海系列</title><biblScope>二</biblScope>
<title level="m">華嚴學講義</title>
<publisher>台北市華嚴蓮社</publisher>
<date when="2012-09-10">中華民國一〇一年九月十日</date><edition>八版三刷</edition>
</bibl>
</sourceDesc>
</fileDesc>
<revisionDesc>
<change when="2013-10"><name>周邦信</name> MS Word 轉為 TEI P5 標記</change>
</revisionDesc>
</teiHeader>
XML Elements
div
章節皆以 div 元素標示。
head
TEI 定義:(標題)包含任何種類的標題,如章節、列表、詞彙表、寫本描述等的標題。
<div><head>…</head></div>
圖檔標題
不出現於目錄的圖檔標題,例:《華嚴學講義》p. 133
<figure>
<head>賢首時儀教觀圖:</head>
<graphic url="01.133.png"/>
</figure>
表格標題
不出現於目錄的表格標題,例:《華嚴學講義》p. 64
<table>
<head>六十華嚴經七處八會略表</head>
<lb n="64.02"/>
<row>
<cell>品數</cell><cell>會次會場</cell><cell>說法別舉</cell><cell>分次周次</cell>
</row>
...
</table>
opener
TEI 定義:<opener> 匯集日期地點、署名、稱呼語及其他在區段開端出現的類似措辭,尤指信件開頭。
著作全集中,章節標題前出現的書名,以 opener 元素標記。
例如:《華嚴經十地品淺釋》下冊,p1
<pb n="1"/><lb
n="1.01"/><div><opener>華嚴經十地品淺釋</opener><lb
n="1.02"/><head>前言</head><lb
p
標記散文的段落。 例:《華嚴學講義》p. 9
<p>佛有三身:身即聚集之義。</p>
quote
quote 包 p
獨立一個段落的引文,例:《華嚴學講義》p. 329
<quote><p>若欲成就此功德門,應修十種廣大行願。何種為十?一者禮敬諸
佛,二者稱讚如來,三者廣修供養,四者懺悔業障,五者隨喜功德
,六者請轉法輪,七者請佛住世,八者常隨佛學,九者恆順眾生,
十者普皆迴向。</p></quote>
list
- list:(list) 包含以列表方式呈現的任何連續項目。
- item:包含列表中的一個項目。
例:《華嚴學講義》p.248
<list>
<lb n="248.04"/><item>一、約證,於十地中,斷一切障惑。</item>
<lb n="248.05"/><item>二、約位,於十住上,已去斷一切惑障。</item>
<lb n="248.06"/><item>三、約行,於十信終心,斷一切障惑。</item>
<lb n="248.07"/><item>四、約實,一切惑障,本來清淨,故無可斷。</item>
</list>
- 若有換行與換頁,皆須標示出頁碼與行號
例:《華嚴學專題研究》p.261
<list>
<lb n="261.11"/><item rend="margin-left:1em;text-indent:-1em">㈠《寶通賢首傳燈錄續錄》二卷,每卷各分卷上、卷下,共四冊。<lb
n="261.12"/>一至二冊清景林心露、體寬通申等校集(西元一八〇五年撰);
<pb n="262"/><lb n="262.01"/>三至四冊,民國吉安圓徹等撰述(西元一九一三年撰)。</item>
<lb n="262.02"/><item rend="margin-left:1em;text-indent:-1em">㈡《伯亭大師傳記總帙》,《灌頂伯亭大師塔誌銘》,清徐自洙(<lb
n="262.03"/>西元一七二八年撰),《卍續》一五〇冊。</item>
...
</list>
- 兩層 list(list in list)
例:《華嚴經十地品淺釋》(下冊),p1
<list>
<lb n="1.09"/><item>⑴地行:六地主要修行可以於三個章節看到。<list>
<lb n="1.10"/><item>1.勝慢對治。</item>
<lb n="1.11"/><item>2.不住道行勝。</item>
<lb n="1.12"/><item>3.彼果勝。</item></list></item>
<pb n="2"/><lb n="2.01"/><item>⑵位果</item>
</list>
lg
TEI 定義:<lg> (行組) 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。
lg 是 line group,裡面包一個或多個<l> (line)。
例:《華嚴經講錄》(世主妙嚴品),p.269
n="269.12"/><lg><l>佛所莊嚴廣大剎 等於一切微塵數</l>
<pb n="270"/><lb
n="270.01"/><l>清淨佛子悉滿中 雨不思議最妙法</l><lb
n="270.02"/><l>如於此會見佛坐 一切塵中悉如是</l><lb
n="270.03"/><l>佛身無去亦無來 所有國土皆明現</l><lb
n="270.04"/><l>顯示菩薩所修行 無量趣地諸方便</l><lb
n="270.05"/><l>及說難思真實理 令諸佛子入法界</l><lb
n="270.06"/><l>出生化佛如塵數 普應群生心所欲</l><lb
n="270.07"/><l>入深法界方便門 廣大無邊悉開演</l><lb
n="270.08"/><l>如來名號等世間 十方國土悉充徧</l><lb
n="270.09"/><l>一切方便無空過 調伏眾生皆離垢</l><lb
n="270.10"/><l>佛於一切微塵中 示現無邊大神力</l><lb
n="270.11"/><l>悉坐道場能演說 如佛往昔菩提行</l><lb
n="270.12"/><l>三世所有廣大劫 佛念念中皆示現</l>
<pb n="271"/><lb
n="271.01"/><l>彼諸成壞一切事 不思議智無不了</l><lb
n="271.02"/><l>佛子眾會廣無限 欲共測量諸佛地</l><lb
n="271.03"/><l>諸佛法門無有邊 能悉了知甚為難</l><lb
n="271.04"/><l>佛如虛空無分別 等真法界無所依</l><lb
n="271.05"/><l>化現周行靡不至 悉坐道場成正覺</l><lb
n="271.06"/><l>佛以妙音廣宣暢 一切諸地皆明了</l><lb
n="271.07"/><l>普現一一眾生前 盡與如來平等法</l></lg>
pb
頁碼記錄於 pb 元素的 n 屬性,例如:
<pb n="1"/>
- 空白頁的頁碼亦標示出。
lb
在 <lb> 的屬性 n 之前換行,n 屬性的格式為"頁碼.行號"
<pb n="1"/><lb
n="1.01"/><div><head>序</head><lb
n="1.02"/><p>當一個人面對現實世界的種種黑暗、罪惡、貧窮、愚痴等卑劣的環境,以<lb
n="1.03"/>及人性的貪、瞋、痴、慢、疑等煩惱時,應該是要厭棄它,而逃到一個,如西<lb
figure
圖內無文字
<figure><graphic url="01.010.png"/></figure>
table
例:《華嚴學講義》p. 33
<table>
<head>附表:</head>
<lb n="31.02"/>
<row>
<cell>經名</cell><cell>內容</cell><cell>譯者</cell><cel>時間</cell><cell>地點</cell>
</row>
<lb n="31.03"/>
<row>
<cell>九卷梵本,攜入中<lb n="31.04"/>國,華嚴前分三萬<lb n="31.05"/>六千偈三十四品<lb n="31.06"/>《六十華嚴》。</cell><cell>三十八品略本
。<lb n="31.04"/>缺十定品,七處八會<lb n="31.05"/>未完整。舊譯教學價<lb n="31.06"/>值高,稱為晉經。</cell><cell>支法嶺佛馱跋陀羅
<lb n="31.04"/>尊者主譯,與沙門法<lb n="31.05"/>業、慧嚴等百餘人。</cell><cell>東晉義熙十四年<lb n="31.04"/>至元熙二年。
<lb n="31.05"/>西元四一八年至<lb n="31.06"/>四二○年。</cell><cell>遮拘槃國<lb n="31.04"/>道場寺<lb n="31.05"/>華嚴堂</cell>
</row>
...
</table>
<lb>的位置
- 表格的列與列之間換行的 <lb> 放在 <row> 與 <row> 之間。
無框線
例:《華嚴學講義》p. 185
<table rendition="no_border">
<lb n="185.02"/><row><cell>德相十玄:</cell><cell>業用十玄:</cell></row>
<lb n="185.03"/><row><cell>⑴同時具足相應德</cell><cell>⑴同時具足相應用</cell></row>
<lb n="185.04"/><row><cell>⑵相即德</cell><cell>⑵相即用</cell></row>
<lb n="185.05"/><row><cell>⑶相在德</cell><cell>⑶相在用</cell></row>
<lb n="185.06"/><row><cell>⑷隱顯德</cell><cell>⑷相入用</cell></row>
<lb n="185.07"/><row><cell>⑸伴德</cell><cel>⑸相作用</cell></row>
<lb n="185.08"/><row><cell>⑹同體成即德</cell><cell>⑹純雜用</cell></row>
<lb n="185.09"/><row><cell>⑺具足無盡德</cell><cell>⑺隱顯用</cell></row>
<lb n="185.10"/><row><cell>⑻純雜德</cell><cell>⑻主伴用</cell></row>
<lb n="185.11"/><row><cell>⑼微細德</cell><cell>⑼微細用</cell></row>
<lb n="185.12"/><row><cell>⑽如因陀羅網德</cell><cell>⑽如因陀羅網用</cell></row>
</table>
儲存格跨欄或跨列
- row 元素表示表格的一列
- cell 元素表示表格的一格
- cell 元素的 cols 屬性表示這一格跨了幾欄
- cell 元素的 rows 屬性表示這一格跨了幾列
- 跨三欄:<cell cols=”3”>
- 跨三列:<cell rows=”3”>
框線不顯示
- 上框線不顯示:<cell rend="border-top:none">
- 下框線不顯示:<cell rend="border-bottom:none">
- 左框線不顯示:<cell rend="border-left:none">
- 右框線不顯示:<cell rend="border-right:none">
儲存格欄寬
- 若欄寬為1字元,標記為:<cell rend="width:1em>
seg
在 TEI 的中英文解釋:
<seg> (arbitrary segment) represents any segmentation of text below the ‘chunk’ level.
<seg> (隨機分割) 包含文件中任何隨機字詞層次的單元 (包括其他分割元素)。
例:《華嚴學專題研究》p. 267
<seg rend="font-family:標楷體;font-weight:bold">西元一九九三年十月十六日</seg>
note
行中夾註:<note place="inline">
例如:《華嚴經講錄》(世主妙鹽品)P77
經文的一開始一共分出了幾個大段。從第一句「如是我聞」開始,它是「總顯己聞」,這是就《疏鈔》的分判。<note place="inline">(註:此即依澄觀大師之分判。
此處《疏鈔》係指華嚴蓮社編印之《新修華嚴經疏鈔》之略稱。本書是將八十卷本《華嚴經》及澄觀大師所撰《華嚴經疏》、《華嚴經隨疏演義鈔》三本之內容彙整,加上
新式標點、註解引文出處所成之會本,全套二十冊,是一套便利研修華嚴之專書。)</note>
- 行中夾註呈現上預設為灰色小字
全集統一預設樣式
- p:首行內縮兩格。
- quote:標楷體,整段內縮兩格。
- lg、list:整段內縮兩格。
- figure 與 table 下的<head>不於目錄裡呈現。
css
邊界
margin
- 左邊界1個字:margin-left:1em
padding(內距)
- padding-left:1em
例:《華嚴學講義》p. 182
<cell rend="padding-left:1em;">因陀羅網境界門</cell>
text(文字)
縮排
- 首行縮排2個字:text-indent:2em(負值變成凸排)
例:《華嚴學講義》p. 9
首行內縮2個字,第二行內縮3個字,要設左邊界3個字,首行縮排-1個字
<p rend="margin-left:3em;text-indent:-1em">㈠理法之聚集稱為法身,滅除一切煩惱等障,而具足一切之諸善法故。為<lb
n="9.08"/>證顯實相真如之理體,無二無別,常住湛然稱為法身,是如來藏的顯現<lb
n="9.09"/>狀態。</p>
- 水平置中:text-align:center
- 靠右對齊:text-align:right
垂直對齊
- 上標:vertical-align:super
例:《華嚴學專題演講》p371
3.6×10<seg rend="font-size:x-small;vertical-align:super;">60</seg>
- 置中:vertical-align:middle
字體
- 粗體:font-weight:bold
- 標楷體:font-family:標楷體
- 文字大小:font-size:x-small
換行
禁止文字自動換行:white-space:nowrap
例如:《華嚴學講義》p268
<cell rend="vertical-align:middle;white-space:nowrap">歡喜地</cell>
不管平板寬度,或web視窗大小,「歡喜地」會保持於同一行,不會被換行。
強迫換行:<lb type="always-newline"/>
由於電子書沒有依原書換行,若沒有加上強迫換行標記,需要換行的文句會前後連接在一起。
例:《華嚴學講義》p34
<row><cell>羅摩伽經<lb type="always-newline" n="34.05"/>(入法界品序文)<lb type="always-newline" n="34.06"/>一本三卷</cell><cell></cell>
<cell>曹魏安法賢<lb type="always-newline" n="34.05"/>北涼曇無讖譯一本一卷<lb n="34.06"/>成</cell><cell>西元二二〇年至二<lb n="34.05"/>六四年</cell></row>
inherit
lg 全集預設為標楷體,但此處 lg 字體不呈現標楷體,與本文字體一致,例如:《華嚴學講義》P316
<lg rend="font-family:inherit;color:inherit"><l>菩薩在家,當願眾生,知家性空,免其逼迫。</l>
<l>孝事父母,當願眾生,善事於佛,護養一切。</l>....</lg>