匿名
尚未登入
登入
DILA Wiki
搜尋
檢視 遵循 TEI 的佛學數位化 XML 標記 的原始碼
出自DILA Wiki
命名空間
頁面
討論
更多
更多
頁面操作
閱讀
檢視原始碼
歷史
←
遵循 TEI 的佛學數位化 XML 標記
由於下列原因,您沒有權限進行編輯此頁面的動作:
您請求的操作只有這個群組的使用者能使用:
使用者
您可以檢視並複製此頁面的原始碼。
這裡收集法鼓佛教學院(包括前身中華佛學研究所)所進行過的各種佛學數位專案,所曾使用過的各種 XML 標記。 =語言= 參考 TEI 的 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CH.html#CHSH Languages and Character Sets] 符合 ISO 標準的 xml:lang 屬性值的一些用例: * zh 中文 ** zh-Hant: 中文繁體 * en 英文 * fr 法文 * sa 梵文 ** sa-Latn: 以拉丁文轉寫的梵文 ** sa-Deva: 以天城體書寫的梵文 * pi 巴利文 * bo 藏文 ** bo-Latn: 以拉丁文轉寫的藏文 ** bo-Tibt: 以藏文字書寫的藏文 * hi 印度語(Hindi) ** hi-Latn: 以拉丁文轉寫的印度語 自訂的用例 * x-sa-pi: 既是梵文也是巴利文 =所有 TEI 文件的通用元素= 這些元素在 TEI Guidelines [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COVE 第3章 Elements Available in All TEI Documents] ==突顯、引文== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COHQ TEI 3.3 Highlighting and Quotation] ===q=== TEI 的 q 元素定義:(引用的言詞、思想、或文字) 包含標記為 (看似) 引用自他處的內容;在敘述文中,此元素用來標記直接或間接敘述;在字典中,用來標記實例或編者設計的範例;在寫本描述或其他上層資訊中,用來標記由來源文本中所摘錄的引文。 例如《般若經講記》p. 20 <syntaxhighlight lang="XML"> <q type="被解釋的經論"><p>如是我聞:一時,佛在舍衛國祇樹給孤獨園,與大比丘眾千二百五十人俱。</p></q> </syntaxhighlight> ===cit=== * <cit> (cited quotation) 從其他文件中引用的內容,並包含引用來源的書目參照資料。 * <quote> (引文) 包含敘述者或作者引用自文本以外來源的字 (句) 詞或段落。 聖嚴法師《禪門修證指要》p. 15 <syntaxhighlight lang="XML"> 宗密的<cit>《禪源諸詮集都序》卷上之二所稱: <quote>「達摩以壁觀教人安心,外止諸緣,內心無喘,心如牆壁,可以入道」</quote> (<bibl>《大正藏》四八.四○三頁下</bibl></cit>)者,即是指的本篇的二入及其所稱:「凝住壁觀」、「安心無為」。 </syntaxhighlight> ===emph=== emph:(強調) 為了語言上或修辭上的效果而加重語氣或特別強調的字句。 斜體字,例如 辛嶋靜志 的《妙法蓮華經詞典》 <syntaxhighlight lang="XML"> <p>The present work is a glossary of Kumārajīva’s translation of the Lotus Sutra, <emph rend="italic">Miàofǎliánhuājīng</emph> 妙法蓮華經 (<emph rend="italic">Taishō</emph>, vol. 9, No.262; translated in 406 C.E.).<!-- 後略 --></p> </syntaxhighlight> 粗體字:<emph rend="bold"> ===hi=== hi:(顯目標示) 標誌其字型外觀上和週遭文字有所區別的字詞,但不指出顯目原因 例如 * 底線 <hi rend='solid'> * 虛底線:<hi rend='dotted'> ==簡單編輯修訂== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COED TEI 3.4 Simple Editorial Changes] ===正規化=== 使用到下列三個元素: * reg (一般化) 標誌一般化或規格化處理過的文字。 * orig (原文格式) 標誌原文中呈現的文字,並且未經過任何修改或規格化處理。 * choice 匯集文件中對於同一部分文字所有可供替換的不同標記。 例如 <syntaxhighlight lang="XML"> <choice> <orig>迹</orig> <reg>跡</reg> </choice> </syntaxhighlight> ===gap=== <gap> 指出轉錄時被省略部分的位置,省略也許是出於 TEI 標頭裡描述的編輯上的理由、也許是因為抽樣轉錄而省略、或是因為資料不明難以辨認或聽懂。 例如《普陀山志》卷一, p. 27([http://buddhistinformatics.ddbc.edu.tw/fosizhi/jpegs/1Book009/1B009P046.jpg 原書圖檔]) <syntaxhighlight lang="XML"> 大明萬曆十四年三月<gap extent="1" reason="lost" unit="chars"/>日 </syntaxhighlight> ===del=== <del> (刪除) 標記在文本中,由作者、抄寫者、註解者、或更正者刪除、標上刪除記號、或者標明為多餘或偽造的字母或單字。 例如《徑山集》p. 1([http://buddhistinformatics.ddbc.edu.tw/fosizhi/jpegs/4Book078/4B078P005.jpg 原書圖檔]) <syntaxhighlight lang="XML"> 徑山在臨安縣天目山東北。 唐<del><gap extent="2" unit="chars" reason="cancelled"/></del>國一禪師法欽始開山 </syntaxhighlight> ===add=== <add> (插入) 包含由作者、抄寫者、註解者、或更正者在文本中插入的字母、單字或詞彙。 例《徑山集》p. 1 ([http://buddhistinformatics.ddbc.edu.tw/fosizhi/jpegs/4Book078/4B078P005.jpg 原書圖檔]) <syntaxhighlight lang="XML"> 萬曆丙子,僧方壹<add>有</add>序,<add>又</add>後識曰 </syntaxhighlight> ==名稱、數字、日期、縮寫、位址== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#CONA TEI 3.5 Names, Numbers, Dates, Abbreviations, and Addresses] ===num=== TEI 的 num 元素定義:(數字) 包含一個以任何形式呈現的數字。 例如《雜阿含經論會編(上)》的經號: <syntaxhighlight lang="XML"> <num type="各相應之經號" n="1-1">一</num>;<num type="雜含會編經號" n="1">一</num><num type="大正藏雜含經號" n="1">(一)</num> </syntaxhighlight> ===date=== <date> 包含任何格式的日期表示。 例《普陀山志‧卷前》 <syntaxhighlight lang="XML"> 自<date key="j20556632056017" notAfter-iso="0917-01-30" notBefore-iso="0916-02-11">五代梁貞明二年</date>(九一六)建「不肯去院」,而法址始開。 </syntaxhighlight> key 屬性值來自時間規範資料庫。 ==簡單連結以及交互參照== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COXR TEI 3.6 Simple Links and Cross-References] ===ptr=== TEI 的 ptr 元素定義:(pointer) 標明一個與其他位置相連結的指標。 例如註解如果放在章節末,在內文中會有標號連結,此標號以 ptr 元素標記,例如《成佛之道》(增注本)p. 429 <syntaxhighlight lang="XML"> 所以,向佛一舉手,一低頭;「一稱南無佛,皆已成佛道」<ptr type="note" target="#note5.134"/>。 <!-- 中略 --> <p><note xml:id="note5.134">《妙法蓮華經》卷一(大正九‧九上)。</note></p> </syntaxhighlight> ===ref=== TEI 的 ref 元素定義:(reference) 標明與其他位置互相參照的符號,或許包含附加的文字或註解。 參照大正藏,例如《成佛之道(增註本)》p. 439: <syntaxhighlight lang="XML"> 《妙法蓮華經》卷一(大正<ref type="taisho" target="vol:9;page:p9a">九‧九上</ref>)。 </syntaxhighlight> 參照人名規範資料庫,例《慧因寺志‧卷前》,key 屬性值來自規範資料庫: <syntaxhighlight lang="XML"> 宋代晉水大師主玆院,疏釋華嚴諸經義,凡數十種,流傳海內外, 時<ref key="A003573">高麗國王</ref>之子僧義天,航海問道於晉水,申弟子禮。 </syntaxhighlight> ==清單== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COLI TEI 3.7 Lists] ===list=== * list:(list) 包含以列表方式呈現的任何連續項目。 * item:包含列表中的一個項目。 例如《瑜伽師地論》卷100 (CBETA, T30, no. 1579, p. 881, c6) <syntaxhighlight lang="XML"> <list> <item>弘福寺沙門知仁筆受</item> <item>弘福寺沙門靈雋筆受</item> <!-- 中略 --> <item>銀青光祿大夫行太子左庶子高陽縣開國男臣許敬宗監閱</item> </list> </syntaxhighlight> ===label=== TEI 的 label 元素定義:包含和列表中某項目相關聯的標號;在詞彙表中則用來標記被定義的字詞。 某些段落開頭會有粗體字表示本段落的標題,我們也以 label 元素標記,例如《雜阿含經論會編(中)》p. 1: <syntaxhighlight lang="XML"> <p><label>「立」</label>:略由三相,…</p> </syntaxhighlight> ==註釋、索引== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#CONO TEI 3.8 Notes, Annotation, and Indexing] ===note=== TEI 的 note 元素定義:包含附註或註釋。 行內的註解以 <note place="inline"> 標記。 註解如果放在章節末,在內文中會有標號連結,此標號以 ptr 元素標記,例如《成佛之道》(增注本)p. 429 <syntaxhighlight lang="XML"> 所以,向佛一舉手,一低頭;「一稱南無佛,皆已成佛道」<ptr type="note" target="#note5.134"/>。 <!-- 中略 --> <p><note xml:id="note5.134">《妙法蓮華經》卷一(大正九‧九上)。</note></p> </syntaxhighlight> 雙行夾註,例如《佛教史地考論》p.67 <syntaxhighlight lang="XML"> 絳州(<note place="inline2">潮陽<lb/>出家</note>) </syntaxhighlight> 原書中沒有,標記人員加的註解,以 resp 屬性標示,例如: <syntaxhighlight lang="XML"> <note resp="周邦信">...</note> </syntaxhighlight> ===index=== TEI 的 index 元素定義:(索引項目) 標誌一個因某種目的而被索引的位置。 例如《初期大乘佛教之起源與開展》p. 367 的「一心見道」一詞被收在書末索引中,那麼在內文中標記如下: <syntaxhighlight lang="XML"> 部派佛教的異義極多,只就上舉的五項來說,「佛身無漏」,「一切無」,「心性本淨」, 「<index>一心見道</index>」,「五識有離染」,在信仰上,理論上,修證的方法上,都看出與大乘佛法間的類同性。 </syntaxhighlight> ==參照系統== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#CORS TEI 3.10 Reference Systems] ===pb=== TEI 的 pb 元素定義:(page break, 分頁) 以標準參照系統來標記頁與頁之間的分界線。 頁碼記錄於 pb 元素的 n 屬性,例如: <syntaxhighlight lang="XML"> <pb n="1"/> </syntaxhighlight> ===lb=== TEI 的 lb 元素定義:(line break, 分行) 標記某版本文本裡 (在印刷上) 的新起行。 早期我們將 lb 元素放在每一行行首,例如《長阿含經》: <syntaxhighlight lang="XML"> <lb n="0001a05" ed="T"/><p>夫宗極絕於稱謂,賢聖以之沖默;玄旨非言 <lb n="0001a06" ed="T"/>不傳,釋迦所以致教。是以如來出世,大教 <lb n="0001a07" ed="T"/>有三:約身口,則防之以禁律;明善惡,則導之...</p> </syntaxhighlight> 這在每行行末有一個換行符號,如果轉檔處理程式未將換行符號去除,會在轉出的 HTML 格式中多出空白。 如果全部都是中文,那還有一致的規則可以遵循,但後來處理《法鼓文集》,其中包含英文著作如下: <syntaxhighlight lang="XML"> <lb n="000102"/><p>Some years ago I edited a book in Chinese entitled <lb n="000103"/>Ch'an Men Hsiu Cheng Chih Yao, or A Guide to the <lb n="000104"/>Experience and Practice of Ch'an, a collection of essays and...</p> </syntaxhighlight> 如果將行末的換行去除,就會將兩個英文詞連在一起,造成錯誤。 後來我們換一種方式,不管中英文文本都在 lb 元素的 n 屬性前換行: <syntaxhighlight lang="XML"> ...<lb n="000102"/><p>Some years ago I edited a book in Chinese entitled <lb n="000103"/>Ch'an Men Hsiu Cheng Chih Yao, or A Guide to the <lb n="000104"/>Experience and Practice of Ch'an</title>, a collection of essays and...</p> </syntaxhighlight> 這樣,對 XML 標記人員來說,或許不如前者容易閱讀,但是可以避免錯誤。 ==圖片以及其他非文字元件== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COGR TEI 3.9 Graphics and other non-textual components] ===graphic=== TEI 的 graphic 元素定義:指出文字文件中內含的圖形、插圖、或圖表的位置。 例如《中觀今論》p. 125: <syntaxhighlight lang="XML"> 或螺旋形的<graphic url="y09.0125-3.png"/> </syntaxhighlight> ==書目引用及參照== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#COBI TEI 3.11 Bibliographic Citations and References] ===title=== TEI 的 title 元素定義:包含任何種類作品的完整題名。 title 元素可以有一個 level 屬性指出題名的書目層次,即該題名之所指可以是文章、書籍、期刊、叢書或未出版的項目。 level 屬性合法的值是: {| | a || (analytic) 分析層題名 (文章、詩、或其他隸屬於一個較大作品的項目) |- | m || (monographic) 專題層題名 (書、選集、或其他獨立出版的項目,包含多冊作品的其中一冊) |- | j || (journal) 期刊層題名 |- | s || (series) 叢書層題名 |- | u || (unpublished) 未出版的項目題名 (包括未經商業刊物發表的專題論文) |} 書名例: <syntaxhighlight lang="XML"> <title level="m">《大智度論》</title> </syntaxhighlight> ===bibl=== <bibl> (書目資料) 包含結構零散的書目資料,其中次要元件不一定會明確標記。 例如 印順法師《般若經講記》 <syntaxhighlight lang="XML"> 三、來臺灣以前的文稿,散失的已經散失了。 來臺以後而曾發表過的,大都編在<title level="s">《妙雲集》</title>內,但也有例外的: 1.<title level="a">〈藥師琉璃光〉</title> <bibl>(<title level="m">《潮音》</title><biblScope type="卷" n="35">三十五卷</biblScope>)</bibl>, 已編入<title level="m">《藥師經講記》</title>。 </syntaxhighlight> ==詩偈、韻文、戲劇== 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/CO.html#CODV TEI 3.12 Passages of Verse or Drama] ===lg=== TEI 的 lg 元素定義:(line group, 行組) 包含形式上視為一組的詩行,例如詩節、疊句、韻文段落等。 例如《禪門修證指要》p. 172 <syntaxhighlight lang="XML"> <lg> <l>觀身非身,鏡像水月。觀心無相,光明皎潔。一念不生,虛靈寂照。</l> <!-- 中略 --> <l>二六時中,頭頭盡妙。觸處不迷,是名心要。</l> </lg> </syntaxhighlight> =文本結構= 這些元素在 TEI Guidelines [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/DS.html#DSDIV 第4章 Default Text Structure] ==章節== 早期專案使用 div1, div2, div3 等元素,後來改用 div 元素。 某些文本是經論對照的形式,這時候會用到 <div type="經"> 以及 <div type="論">,例如《雜阿含經會編》。 ==head== TEI 的 head 元素定義:(標題) 包含任何種類的標題,如章節、列表、詞彙表、寫本描述等的標題。 例如《禪門修證指要》p. 3 <syntaxhighlight lang="XML"> <div1><head>自序</head>...</div1> </syntaxhighlight> ==byline== TEI 的 byline 元素定義:包含作品的主要責任陳述,出現在題名頁或作品開頭或結尾處。 例如《寶積經講記》p. 2 <syntaxhighlight lang="XML"> <byline>──民國五十一年講於臺北慧日講堂──</byline> </syntaxhighlight> ==closer== <closer> 匯集日期地點、署名、稱呼語、及其他在區段結尾出現的類似措辭,尤指信件結尾。 <syntaxhighlight lang="XML"> <div> <!-- 前略 --> <closer>大明萬曆三十五年四月二十一日,欽差督工‧內漢經廠‧焚修祝釐‧御用監太監張隨奉㫖謹立</closer> </div> </syntaxhighlight> =非標準字元及字形= 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/WD.html TEI 5 Representation of Non-standard Characters and Glyphs] ==glyph== <glyph> (文字的形體) 提供一種字體的描述性資訊。 例如佛寺志 encodingDesc.xml <syntaxhighlight lang="XML"> <charDecl> <glyph xml:id="btg086022201"> <glyphName>Non Unicode Character</glyphName> <charProp> <localName>pronunciation</localName> <value>kuang1?</value> </charProp> <mapping type="cbeta">[宀/廣]</mapping> <mapping type="cbetaNo">CB30005</mapping> <graphic url="btg086022201.gif"/> </glyph> </charDecl> </syntaxhighlight> =韻文= 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/VE.html TEI 6 Verse] ==caesura== <caesura> 標記韻律詩行可能被截斷的位置。 例如《普陀山志》卷一 p. 61 <syntaxhighlight lang="XML"> <lg> <l>茫茫萬有<caesura/>慾愛同纒</l> <l>業風振海<caesura/>識浪滔天</l> <!-- 後略 --> </lg> </syntaxhighlight> =原稿描述= 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/MS.html TEI 10 Manuscript Description] ==stamp== <stamp> 包含一個字詞,描述一個印記或是類似圖案。 例如《徑山志》卷之一, p. 140 <syntaxhighlight lang="XML"> <closer><stamp>「休寧汪/季青家/藏書籍」</stamp></closer> </syntaxhighlight> =底本呈現= 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/PH.html TEI 11 Representation of Primary Sources] ==unclear== <unclear> 在來源文本中難以辨認或聽懂而無法確實轉錄的單字、詞組、或段落。 例如《普陀山志》p. 107, [http://buddhistinformatics.ddbc.edu.tw/fosizhi/jpegs/1Book009/1B009P126.jpg 原書圖檔] <syntaxhighlight lang="XML"> 在潮音洞前,有<unclear cert="low">階</unclear>可登,亦人瞻禮之地。 </syntaxhighlight> cert(certainty) 屬性表示該更動或詮釋的相關正確度。 ==supplied== <supplied> 指出一段由轉錄者或編者添加的補充文字,添加的原因是該位置的文字無法被辨認,也許是因為來源文件的損壞或內容遺失、或是任何其他原因導致難以辨認。 例如《普陀山志‧卷前》p. 15([http://buddhistinformatics.ddbc.edu.tw/fosizhi/jpegs/1Book009/1B009P034.jpg 原書圖檔]),「庇」字底本文字脫落,此據王連勝《普陀洛迦山志》補入。 <syntaxhighlight lang="XML"> 迺廣孝治,奉兩宮慈㫖,念力南海大士,遣中使頒經披繡,祝延萬年而<supplied reason="lost">庇</supplied>之民。 </syntaxhighlight> =名稱、日期、人物、地點= 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/ND.html TEI 13 Names, Dates, People, and Places] ==persName== <persName> (個人名稱) 包含一個人名,可能是任何或全部屬於該人物的名字、姓氏、敬稱、或附加名等。 <syntaxhighlight lang="XML"> 唐以前,傳為<persName key="A006905">梅子真</persName>、<persName key="A006915">葛稚川</persName>之寄隱; </syntaxhighlight> ==roleName== <roleName> 包含一個身份名稱,代表個人在社會上所扮演的特殊角色或所處地位,例如官方頭銜或地位。 例如《普陀山志》卷一, p. 25 <syntaxhighlight lang="XML"> 茲者聖母慈聖宣文明肅<roleName>皇太后</roleName>命工刊印《續入藏經》四十一函 </syntaxhighlight> ==addName== <addName> (附加名稱) 附加的名稱,例如綽號、稱號、或別名,或是在人名中出現的其他描述性措辭。 例《慧因寺志‧卷之四》p. 49 <syntaxhighlight lang="XML"> 等施也,廣狹無論己。 或曰,買棺士人,卽<persName key="A003554"> <addName>無為</addName>楊傑次<roleName type="honorific">公</roleName> </persName>也。 </syntaxhighlight> ==placeName== <placeName> 包含一個確切位置或相對位置的名稱。 例《普陀山志‧卷前》 <syntaxhighlight lang="XML"> <placeName key="PL000000013847">普陀山</placeName>,原名「小白華」,梵稱「普陀洛迦」 </syntaxhighlight> key 屬性值對應到規範資料庫。 =表格、圖片= 這些元素在 TEI Guidelines [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/FT.html#FTGRA 第14章 Tables, Formulæ, Graphics and Notated Music] ==table== 使用下列元素: * table:以表格形式呈現、包含在直行橫列中的文字內容。 * row:包含表格中的一列。 * cell:包含表格中的一個儲存格。 例如 T49, n. 2035 《佛祖統紀》p. 158 <syntaxhighlight lang="XML"> <table cols="2"> <row> <cell>大品<note place="inline">晉羅什譯</note></cell> <cell rows="2">第一會鷲&CB00123;山說四百卷<note place="inline">七十七品單譯</note></cell> </row> <!-- 中略 --> <row> <cell></cell> <cell>十六會竹林園說慧八卷<note place="inline">單譯</note></cell> </row> </table> </syntaxhighlight> table 元素的 cols 屬性指出表格中每一列所包含的行數。 如果一個儲存格跨多列或多行,可以 cell 元素的 rows 或 cols 屬性表示。 ==figure== TEI 的 figure 元素定義:所標記的區塊包含圖示、插圖、或圖表。 例如《般若經講記》p. 18 <syntaxhighlight lang="XML"> <figure><graphic url="y01.0018.png"/><figDesc>圖內文字</figDesc></figure> </syntaxhighlight> =連結、分割、對齊= 參見 [http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/SA.html TEI 16 Linking, Segmentation, and Alignment] ==seg== TEI 的 seg 元素定義:(arbitrary segment, 隨機分割) 包含文件中任何隨機字詞層次的單元 (包括其他分割元素)。 對於文本中的一小段文字,不賦予有意義的內容標記,只標記它的樣式,例如: <syntaxhighlight lang="XML"> <seg rend="font-size:small">文本中的某段小字</seg> </syntaxhighlight>
返回到「
遵循 TEI 的佛學數位化 XML 標記
」。
導覽
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
wiki工具
wiki工具
特殊頁面
頁面工具
頁面工具
使用者頁面工具
更多
連結至此的頁面
相關變更
頁面資訊
頁面日誌