匿名
尚未登入
登入
DILA Wiki
搜尋
檢視 遵循 TEI 的佛學數位化 XML 標記 的原始碼
出自DILA Wiki
命名空間
頁面
討論
更多
更多
頁面操作
閱讀
檢視原始碼
歷史
←
遵循 TEI 的佛學數位化 XML 標記
由於下列原因,您沒有權限進行編輯此頁面的動作:
您請求的操作只有這個群組的使用者能使用:
使用者
您可以檢視並複製此頁面的原始碼。
這裡收集法鼓佛教學院(包括前身中華佛學研究所)所進行過的各種佛學數位專案,所曾使用過的各種 XML 標記。 =語言= 參考 TEI 的 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CH.html#CHSH Languages and Character Sets] 符合 ISO 標準的 xml:lang 屬性值的一些用例: * zh 中文 ** zh-Hant: 中文繁體 * en 英文 * fr 法文 * sa 梵文 ** sa-Latn: 以拉丁文轉寫的梵文 ** sa-Deva: 以天城體書寫的梵文 * pi 巴利文 * bo 藏文 ** bo-Latn: 以拉丁文轉寫的藏文 ** bo-Tibt: 以藏文字書寫的藏文 自訂的用例 * x-sa-pi: 既是梵文也是巴利文 =文本結構= 這些元素在 TEI Guidelines [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/DS.html#DSDIV 第4章 Default Text Structure] ==章節== 早期專案使用 div1, div2, div3 等元素,後來改用 div 元素。 某些文本是經論對照的形式,這時候會用到 <div type="經"> 以及 <div type="論">,例如《雜阿含經會編》。 ==所有章節的通用元素== ===head=== TEI 的 head 元素定義:(標題) 包含任何種類的標題,如章節、列表、詞彙表、寫本描述等的標題。 例如《禪門修證指要》p. 3 <syntaxhighlight lang="XML"> <div1><head>自序</head>...</div1> </syntaxhighlight> ===byline=== TEI 的 byline 元素定義:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處。 例如《寶積經講記》p. 2 <syntaxhighlight lang="XML"> <byline>──民國五十一年講於臺北慧日講堂──</byline> </syntaxhighlight> =所有 TEI 文件的通用元素= 這些元素在 TEI Guidelines [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COVE 第3章 Elements Available in All TEI Documents] ==graphic== TEI 的 graphic 元素定義:指出文字文件中內含的圖形、插圖、或圖表的位置。 例如《中觀今論》p. 125: <syntaxhighlight lang="XML"> 或螺旋形的<graphic url="y09.0125-3.png"/> </syntaxhighlight> ==index== TEI 的 index 元素定義:(索引項目) 標誌一個因某種目的而被索引的位置。 例如《初期大乘佛教之起源與開展》p. 367 的「一心見道」一詞被收在書末索引中,那麼在內文中標記如下: <syntaxhighlight lang="XML"> 部派佛教的異義極多,只就上舉的五項來說,「佛身無漏」,「一切無」,「心性本淨」,「<index>一心見道</index>」,「五識有離染」,在信仰上,理論上,修證的方法上,都看出與大乘佛法間的類同性。 </syntaxhighlight> ==label== TEI 的 label 元素定義:包含和列表中某項目相關聯的標號;在詞彙表中則用來標記被定義的字詞。 某些段落開頭會有粗體字表示本段落的標題,我們也以 label 元素標記,例如《雜阿含經論會編(中)》p. 1: <syntaxhighlight lang="XML"> <p><label>「立」</label>:略由三相,…</p> </syntaxhighlight> ==lg== TEI 的 lg 元素定義:(line group, 行組) 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。 例如《禪門修證指要》p. 172 <syntaxhighlight lang="XML"> <lg> <l>觀身非身,鏡像水月。觀心無相,光明皎潔。一念不生,虛靈寂照。</l> <!-- 中略 --> <l>二六時中,頭頭盡妙。觸處不迷,是名心要。</l> </lg> </syntaxhighlight> ==note== TEI 的 note 元素定義:包含附註或註釋。 行內的註解以 <note place="inline"> 標記。 註解如果放在章節末,在內文中會有標號連結,此標號以 ptr 元素標記,例如《成佛之道》(增注本)p. 429 <syntaxhighlight lang="XML"> 所以,向佛一舉手,一低頭;「一稱南無佛,皆已成佛道」<ptr type="note" target="#note5.134"/>。 <!-- 中略 --> <p><note xml:id="note5.134">《妙法蓮華經》卷一(大正九‧九上)。</note></p> </syntaxhighlight> 雙行夾註,例如《佛教史地考論》p.67 <syntaxhighlight lang="XML"> 絳州(<note place="inline2">潮陽<lb/>出家</note>) </syntaxhighlight> 原書中沒有,標記人員加的註解,以 resp 屬性標示,例如: <syntaxhighlight lang="XML"> <note resp="周邦信">...</note> </syntaxhighlight> ==num== TEI 的 num 元素定義:(數字) 包含一個以任何形式呈現的數字。 例如《雜阿含經論會編(上)》的經號: <syntaxhighlight lang="XML"> <num type="各相應之經號" n="1-1">一</num>;<num type="雜含會編經號" n="1">一</num><num type="大正藏雜含經號" n="1">(一)</num> </syntaxhighlight> ==Milestone Elements== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#CORS5 TEI 3.10.3 Milestone Elements] ===pb=== TEI 的 pb 元素定義:(page break, 分頁) 以標準參照系統來標記頁與頁之間的分界線。 頁碼記錄於 pb 元素的 n 屬性,例如: <syntaxhighlight lang="XML"> <pb n="1"/> </syntaxhighlight> ===lb=== TEI 的 lb 元素定義:(line break, 分行) 標記某版本文本裡 (在印刷上) 的新起行。 早期我們將 lb 元素放在每一行行首,例如《長阿含經》: <syntaxhighlight lang="XML"> <lb n="0001a05" ed="T"/><p>夫宗極絕於稱謂,賢聖以之沖默;玄旨非言 <lb n="0001a06" ed="T"/>不傳,釋迦所以致教。是以如來出世,大教 <lb n="0001a07" ed="T"/>有三:約身口,則防之以禁律;明善惡,則導之...</p> </syntaxhighlight> 這在每行行末有一個換行符號,如果轉檔處理程式未將換行符號去除,會在轉出的 HTML 格式中多出空白。 如果全部都是中文,那還有一致的規則可以遵循,但後來處理《法鼓文集》,其中包含英文著作如下: <syntaxhighlight lang="XML"> <lb n="000102"/><p>Some years ago I edited a book in Chinese entitled <lb n="000103"/>Ch'an Men Hsiu Cheng Chih Yao, or A Guide to the <lb n="000104"/>Experience and Practice of Ch'an, a collection of essays and...</p> </syntaxhighlight> 如果將行末的換行去除,就會將兩個英文詞連在一起,造成錯誤。 後來我們換一種方式,不管中英文文本都在 lb 元素的 n 屬性前換行: <syntaxhighlight lang="XML"> ...<lb n="000102"/><p>Some years ago I edited a book in Chinese entitled <lb n="000103"/>Ch'an Men Hsiu Cheng Chih Yao, or A Guide to the <lb n="000104"/>Experience and Practice of Ch'an</title>, a collection of essays and...</p> </syntaxhighlight> 這樣,對 XML 標記人員來說,或許不如前者容易閱讀,但是可以避免錯誤。 ==正規化== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COEDREG TEI 3.4.2 Regularization and Normalization]。 使用到下列三個元素: * reg (一般化) 標誌一般化或規格化處理過的文字。 * orig (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。 * choice 匯集文件中對於同一部分文字所有可供替換的不同標記。 例如 <syntaxhighlight lang="XML"> <choice> <orig>迹</orig> <reg>跡</reg> </choice> </syntaxhighlight> =表格、圖片= 這些元素在 TEI Guidelines [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/FT.html#FTGRA 第14章 Tables, Formulæ, Graphics and Notated Music] ==figure== TEI 的 figure 元素定義:所標記的區塊包含圖示、插圖、或圖表。 例如《般若經講記》p. 18 <syntaxhighlight lang="XML"> <figure><graphic url="y01.0018.png"/><figDesc>圖內文字</figDesc></figure> </syntaxhighlight>
返回到「
遵循 TEI 的佛學數位化 XML 標記
」。
導覽
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
wiki工具
wiki工具
特殊頁面
頁面工具
頁面工具
使用者頁面工具
更多
連結至此的頁面
相關變更
頁面資訊
頁面日誌