地名編碼原則

出自DILA Wiki
於 2008年9月25日 (四) 08:54 由 imported>Putitz 所做的修訂

地名Authority的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。

為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表

地理區代碼 涵蓋地區
001 全球
142 亞洲
143 中亞

哈薩克 吉爾吉斯 塔吉克 土庫曼 烏茲別克

030 東亞

中國 北韓 南韓 日本 臺灣 香港 澳門 蒙古

034 南亞

阿富汗 孟加拉 印度 巴基斯坦 不丹 伊朗 馬爾地夫 尼泊爾 斯里蘭卡

035 東南亞

汶萊 柬埔寨 印尼 新加坡 馬來西亞 越南 泰國 緬甸 菲律賓 寮國 東帝汶

145 西亞

亞美尼亞 亞塞拜然 敘利亞 以色列 黎巴嫩 伊拉克 巴林 沙烏地阿拉伯 塞浦路斯 喬治亞 約旦 科威特 巴勒斯坦(無國土) 阿曼 卡達 土耳其 阿拉伯聯合大公國 葉門

但因為ID第一碼不能為數字,故在聯合國編碼前冠"W"。如朝鮮半島:W030KP00。KP代表Korean Peninsula,後方補"00"表示"全域"。前方8碼代表"位置",如朝鮮半島、中國(CN000000)。後方再加5碼,代表"屬性"。

為了處理中國的跨省地理區的編碼,依據ISO的精神新增:華北(CN10)、東北(CN20)、華東(CN30)、中南(CN40)、西南(CN50)、西北(CN60)。詳細劃分請見:中華人民共和國行政區劃

依照以上原則,舉例如下:

陝西省 CN610000E00AA
關中平原 CN610000D01AA (第5、6、7、8碼為"0000"表示陜西省全域)
長江 CN000000R01AA (因長江橫跨九省,以中國全境境內跨行政區水系之"1號"表示)
南朝 建業 CN320106Z01AA (位於今南京市鼓樓區)

"屬性"編碼主要是用於區別同一"位置"之地名,同時也為解決中研院(Z碼)提供的龐大地名資料。由於歷代疆域變動不斷,跨時間的地名無法以樹狀結構表示;因此在以"行政中心"所在座標的位置之後,附上"屬性碼"(第9碼)與流水號碼(第10、11碼)。


至於第12、13碼則為表示點地名以下的附屬地名。如法鼓佛教學院 圖資館。一般其預設值為"AA",代表全域。"AB"以後之地名不再標示座標,而以"AA"之坐標代替。

可使用之屬性碼為:

代碼 用途
A、B、C 一般"點地名"。"A00"表全域,其下之點地名由"A01"~"C99"表示。如"紫禁城",位於北京市東城區(CN110101),東城區全域為"CN110101A00AA","紫禁城"可為"CN110101A01AA"。"太和殿"則視為"紫禁城"下的附屬地名,可為"CN110101A01AB"。
D 廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。"D00"表全域。
E 廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。"E00"表全域。
M 山峰、山脈。
R 河流、湖泊、海洋等水系。
T 寺廟、佛塔,佛教文化地點。
Z 中研院所提供之歷史地名。
其他 系統保留碼,暫不使用。

各國地名位置編碼標準:

台灣地區:「TW」+「郵遞區號3+2碼」+「0」+「5碼屬性」

印度地區:「IN」+「4位行政區碼」+「2碼流水號」+「1碼英文字母」+「5碼屬性」

越南地區 :「VN」+「4位HASC碼」+「2碼流水號」+「5碼屬性」(越南縣級以上行政區列表)

日本地區:「JP」+「6位行政區碼」+「5碼屬性」