聖嚴法師專案人事時地標記作業

出自DILA Wiki
於 2013年6月13日 (四) 13:42 由 imported>Chengen.xie 所做的修訂 →‎圖檔標記位置

標記原則

  • 本專案使用《法鼓全集》XML 檔進行標記。
  • 標記位置於圖檔所對應的文字開頭處。
  • 若同一圖檔所含的文字段落距離太遠,則標記於 XML 中多處。

圖檔標記

與內文對應之圖檔

標記於該 XML 檔對應圖檔的文字之前:

<ref type="syms" target="SYA000001_001"/> 


與內文無法對應、但明顯為同一作品之圖檔

如大綱、目錄、封面提字等,明顯屬於該書相關資料,標記於該 XML 檔的 <front> 區段中:

< text>
  < front>
    < div1 type="ms-ref">
      < p>
        < ref type="syms" target="SYA001812_001"/>
        < ref type="syms" target="SYA002835_001"/>
      < /p>
    < /div1>
  < /front>
  
  < body>
   ...
  < /body>
< /text>

注意事項:

  • <front> 和 <body> 是平行的層次。
  • 使用 < div1>,而非 < div>。
  • 所有的 < ref> 外用一個 < p> 包起來。

同一圖檔出現於多個不同位置

若圖檔內容分屬於不同文字區域,則於每區前標記該圖檔。


同一位置出現多個圖檔

若同一位置同時有多個圖檔,則標記於同一位置。ref 的 target 屬性裡為多值,以半形空格隔開
例如:

<ref type="syms" target="​SYA001672 SYA001812"/>


人時地標記

  • 人名
<persName key="A023336">保羅甘迺迪(Paul Kennedy)</persName>
  • 時間
我們是 <date when-iso="1988-04-08" key="j24472602447260">四月八日</date> 下午七點
  • 地名
<placeName key="PL000000000000">地名</placeName>

事件標記

需標記於兩處:事件對應內文、事件連結。

事件對應內文

於事件對應內文處標記:

<anchor xml:id="a20.02"/>
  • 其中 a20.02 表示行號為 2002 (XML中 <lb n="002002"/> 該行)
  • 如果同一行有多個 anchor 就多加個序號,例如: <anchor xml:id="a20.14.1"/>, <anchor xml:id="a20.14.2"/>

事件連結

標記於XML檔中的< back>區段中:

< back>
  < div type="link">
    < span from="#a20.02" to="#a20.05">
      < link target="A023335 PL000000048152"/>
    < /span>
    < span from="#a20.05" to="#a20.06">
      < link target="A023335 A023336 A023337 PL000000056125"/>
    < /span>
  < /div>    
< /back>
  • < span> 中的 from, to 為 < anchor> 的id。
  • < link> target 的值為相關的人名、地名id。

標記檢查原則

圖檔標記檢查

是否有漏標

核對圖檔標記清單所列圖檔:
(1) 是否均已標記。
(2) 若為漏標者,請補上標記。
(3) 若為無法標記者,請於備註欄填寫原因 (請勿空白)。

圖檔標記位置

(1) 判斷圖檔標記位置是否合宜並修改,若有討論空間請與工作人員討論,取得共識。
(2) 標記檔 (XML) 進行任何變動均記錄於 google 文件。

範例:

xml編號 圖檔編號 原標記位置 更改後位置 修改原因 修改人 修改日期 備註 複檢人 確認日期
01-01.xml SYA000297_001 一九七五年春 自序 相對應圖檔文字初始文字 黃仁順 2013/6/4 鄭安邦 2013/6/5
01-01.xml SYA000318_002 圖檔所引內容未在打字檔中被申述,所以做不標記處理。 黃仁順 2013/6/4 鄭安邦 2013/6/5

註:「原標記位置」、「更改後位置」請說明在<front>中或於何文字之前,若為後者請至少打五個字。

件數核對

該XML檔檢查完成後,記錄所含圖檔數(非標記數),例如:

作品名稱 系統圖檔數 核對圖檔數 備註
01-01《明末佛教研究》 318 318    
01-03《戒律學綱要》 17 16 1個無法標記。