地名編碼原則
地名Authority的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。
為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表
地理區代碼 | 涵蓋地區 |
---|---|
001 | 全球 |
142 | 亞洲 |
143 | 中亞
哈薩克 吉爾吉斯 塔吉克 土庫曼 烏茲別克 |
030 | 東亞
中國 北韓 南韓 日本 臺灣 香港 澳門 蒙古 |
034 | 南亞
阿富汗 孟加拉 印度 巴基斯坦 不丹 伊朗 馬爾地夫 尼泊爾 斯里蘭卡 |
035 | 東南亞
汶萊 柬埔寨 印尼 新加坡 馬來西亞 越南 泰國 緬甸 菲律賓 寮國 東帝汶 |
145 | 西亞
亞美尼亞 亞塞拜然 敘利亞 以色列 黎巴嫩 伊拉克 巴林 沙烏地阿拉伯 塞浦路斯 喬治亞 約旦 科威特 巴勒斯坦(無國土) 阿曼 卡達 土耳其 阿拉伯聯合大公國 葉門 |
但因為ID第一碼不能為數字,故在聯合國編碼前冠"W"。如朝鮮半島:W030KP00。KP代表Korean Peninsula,後方補"00"表示"全域"。前方8碼代表"位置",如朝鮮半島、中國(CN000000)。後方再加5碼,代表"屬性"。
為了處理中國的跨省地理區的編碼,依據ISO的精神新增:華北(CN10)、東北(CN20)、華東(CN30)、中南(CN40)、西南(CN50)、西北(CN60)。詳細劃分請見:中華人民共和國行政區劃
依照以上原則,舉例如下:
陝西省 | CN610000E00AA |
關中平原 | CN610000D01AA (第5、6、7、8碼為"0000"表示陜西省全域) |
長江 | CN000000R01AA (因長江橫跨九省,以中國全境境內跨行政區水系之"1號"表示) |
南朝 建業 | CN320106Z01AA (位於今南京市鼓樓區) |
"屬性"編碼主要是用於區別同一"位置"之地名,同時也為解決中研院(Z碼)提供的龐大地名資料。由於歷代疆域變動不斷,跨時間的地名無法以樹狀結構表示;因此在以"行政中心"所在座標的位置之後,附上"屬性碼"(第9碼)與流水號碼(第10、11碼)。
至於第12、13碼則為表示點地名以下的附屬地名。如法鼓佛教學院 圖資館。一般其預設值為"AA",代表全域。"AB"以後之地名不再標示座標,而以"AA"之坐標代替。
可使用之屬性碼為:
代碼 | 用途 |
---|---|
A、B、C | 一般"點地名"。"A00"表全域,其下之點地名由"A01"~"C99"表示。如"紫禁城",位於北京市東城區(CN110101),東城區全域為"CN110101A00AA","紫禁城"可為"CN110101A01AA"。"太和殿"則視為"紫禁城"下的附屬地名,可為"CN110101A01AB"。 |
D | 廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。"D00"表全域。 |
E | 廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。"E00"表全域。 |
M | 山峰、山脈。 |
R | 河流、湖泊、海洋等水系。 |
T | 寺廟、佛塔,佛教文化地點。 |
Z | 中研院所提供之歷史地名。 |
其他 | 系統保留碼,暫不使用。 |
各國地名位置編碼標準:
台灣地區:「TW」+「郵遞區號3+2碼」+「0」+「5碼屬性」
印度地區:「IN」+「4位行政區碼」+「2碼流水號」+「1碼英文字母」+「5碼屬性」
越南地區 :「VN」+「4位HASC碼」+「2碼流水號」+「5碼屬性」(越南縣級以上行政區列表)
日本地區:「JP」+「6位行政區碼」+「5碼屬性」