地名編碼原則
地名Authority的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。
為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表
聯合國地理區代碼
地理區代碼 | 涵蓋地區 |
---|---|
001 | 全球 |
142 | 亞洲 |
143 | 中亞
哈薩克 吉爾吉斯 塔吉克 土庫曼 烏茲別克 |
030 | 東亞
中國 北韓 南韓 日本 臺灣 香港 澳門 蒙古 |
034 | 南亞
阿富汗 孟加拉 印度 巴基斯坦 不丹 伊朗 馬爾地夫 尼泊爾 斯里蘭卡 |
035 | 東南亞
汶萊 柬埔寨 印尼 新加坡 馬來西亞 越南 泰國 緬甸 菲律賓 寮國 東帝汶 |
145 | 西亞
亞美尼亞 亞塞拜然 敘利亞 以色列 黎巴嫩 伊拉克 巴林 沙烏地阿拉伯 塞浦路斯 喬治亞 約旦 科威特 巴勒斯坦(無國土) 阿曼 卡達 土耳其 阿拉伯聯合大公國 葉門 |
但因為ID第一碼不能為數字,故在聯合國編碼前冠"WW"。如朝鮮半島:WW030KP00D01AA。KP代表Korean Peninsula,後方補"00"表示"全域"。前方9碼代表"位置",如朝鮮半島、中國(CN0000000)。後方再加5碼,代表"屬性"。
中國地理區編碼示例
陝西省 | CN0610000E00AA |
關中平原 | CN0610000D01AA (第5、6、7、8碼為"0000"表示陜西省全域) |
長江 | CN0000000R01AA (因長江橫跨九省,以中國全境境內跨行政區水系之"1號"表示) |
南朝 建業 | CN0320106Z01AA (位於今南京市鼓樓區) |
而為了處理中國的跨省地理區的編碼,依據ISO的精神又新增:華北(CN11)、東北(CN12)、華東(CN13)、中南(CN14)、西南(CN15)、西北(CN16)。詳細劃分請見:大行政區,此分類實際已廢,僅供標記使用。
"屬性"編碼主要是用於區別同一"位置"之地名,同時也為解決中研院(Z碼)提供的龐大地名資料。由於歷代疆域變動不斷,跨時間的地名無法以樹狀結構表示;因此在以"行政中心"所在座標的位置之後,附上"屬性碼"(第10碼)與流水號碼(第11、12碼)。
屬性碼說明:
代碼 | 用途 |
---|---|
A、B、C | 一般"點地名",由"A01"~"C99"表示。如"紫禁城",位於北京市東城區(CN0110101),"紫禁城"可為"CN0110101A01AA"。"太和殿"則視為"紫禁城"下的附屬地名,可為"CN0110101A01AB"。 |
D | 廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。至少需跨2個縣市,如:四川盆地。而台北盆地請使用點地名。 |
E | 廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。至少需跨2個縣市,如:關中。 |
G | 具有某種關聯性質、或共同性的幾個地名群組,用以說明不相連的數個地名。此時地名編碼必須能包含所有成員。如"五嶽",為"CN0000000G01AA"。 |
M | 山峰、山脈。 |
R | 河流、湖泊、海洋等水系。 |
T、U、V | 寺廟、佛塔,佛教文化地點。 |
Z | 中研院所提供之歷史地名。 |
其他 | 系統保留碼,暫不使用。 |
至於第13、14碼則為表示點地名以下的附屬地名。如法鼓佛教學院 圖資館。一般其預設值為"AA",代表全域。"AB"以後之地名不再標示座標,而以"AA"之坐標代替。
各國地名位置編碼標準舉例:
台灣地區:「TW」+「郵遞區號3+2碼」+「00」+「5碼屬性」(台灣地區只用ISO國碼,不用一級行政區碼)
印度地區:「IN」+「7位行政區碼」+「「5碼屬性」
越南地區 :「VN」+「1碼大區域碼」+「4位HASC碼」+「2碼流水號」+「5碼屬性」(越南縣級以上行政區列表)
日本地區:「JP」+「1碼大區域碼」+「6位行政區碼」+「5碼屬性」
南韓地區:「KR」+ISO與「3位郵遞區號」+「1碼流水號」+「5碼屬性」(南韓地區以ISO碼與郵遞區號混編成樹狀結構)
菲律賓地區:「PH」+「2碼大區域碼」+「3碼省碼」+「2碼縣市碼」+「5碼屬性」