地名編碼原則
地名Authority的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。
為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表
地理區代碼 | 涵蓋地區 |
---|---|
001 | 全球 |
142 | 亞洲 |
143 | 中亞
哈薩克 吉爾吉斯 塔吉克 土庫曼 烏茲別克 |
030 | 東亞
中國 北韓 南韓 日本 臺灣 香港 澳門 蒙古 |
034 | 南亞
阿富汗 孟加拉 印度 巴基斯坦 不丹 伊朗 馬爾地夫 尼泊爾 斯里蘭卡 |
035 | 東南亞
汶萊 柬埔寨 印尼 新加坡 馬來西亞 越南 泰國 緬甸 菲律賓 寮國 東帝汶 |
145 | 西亞
亞美尼亞 亞塞拜然 敘利亞 以色列 黎巴嫩 伊拉克 巴林 沙烏地阿拉伯 塞浦路斯 喬治亞 約旦 科威特 巴勒斯坦(無國土) 阿曼 卡達 土耳其 阿拉伯聯合大公國 葉門 |
但因為ID第一碼不能為數字,故在聯合國編碼前冠"W"。如朝鮮半島:W030KP00。KP代表Korean Peninsula,後方補"00"表示"全域"。前方8碼代表"位置",如朝鮮半島、中國(CN000000)。後方再加5碼,代表"屬性"。
為了處理中國的跨省地理區的編碼,依據ISO的精神新增:華北(CN10)、東北(CN20)、華東(CN30)、中南(CN40)、西南(CN50)、西北(CN60)。詳細劃分請見:中華人民共和國行政區劃
依照以上原則,舉例如下:
陝西省 | CN610000 |
關中平原 | CN610001 (第5、6碼為"00"表示陜西省全域,7、8碼為"01"表示陜西省境內跨行政區之區域"1號") |
長江 | CN000002 (因長江橫跨九省,以中國全境境內跨行政區之區域"2號"表示) |
南朝 建業 | CN320106 (位於今南京市鼓樓區) |
"屬性"編碼主要是用於區別同一"位置"之地名,同時也為解決中研院(Z碼)提供的龐大地名資料。由於歷代疆域變動不斷,跨時間的地名無法以樹狀結構表示;因此在以"行政中心"所在座標的位置之後,附上"朝代碼"(第9碼)與行政疆域碼(第10、11碼)。如下表:
代碼 | 朝代 | 一級行政區 | 二級行政區 | 國都 | 點地名 |
---|---|---|---|---|---|
F | 秦 | 01~09 | 21 | 22~ | |
G | 西漢 | 01~09 | 11~19 | 21 | 22~ |
H | 東漢 | 01~09 | 11~19 | 21 | 22~ |
J | 三國 | 01~09 | 11~19 | 21 | 22~ |
K | 西晉 | 01~09 | 11~19 | 21 | 22~ |
L | 東晉、前秦 | 01~09 | 11~19 | 21 | 22~ |
N | 北魏、南齊 | 01~09 | 11~19 | 21 | 22~ |
P | 隋 | 01~09 | 11~19 | 21 | 22~ |
Q | 唐 | 01~09 | 11~19 | 21 | 22~ |
S | 五代十國 | 01~09 | 11~19 | 21 | 22~ |
U | 北宋 | 01~09 | 11~19 | 21 | 22~ |
V | 南宋 | 01~09 | 11~19 | 21 | 22~ |
W | 元 | 01~09 | 11~19 | 21 | 22~ |
X | 明 | 01~09 | 11~19 | 21 | 22~ |
Y | 清 | 01~09 | 11~19 | 21 | 22~ |
至於第13碼則為表示點地名以下的附屬地名。如法鼓佛教學院 圖資館。一般其預設值為"AA",代表全域。
非Z碼之地名,可使用之屬性碼為:
代碼 | 用途 |
---|---|
A、B | 一般地名。"A00"表全域,其下之點地名由"A01"~"B99"表示。如"紫禁城",位於北京市東城區(CN110101),東城區全域為"CN110101A00","紫禁城"可為"CN110101A01"。"太和殿"則視為"紫禁城"下的附屬地名,可為"CN110101A01AB"。 |
D | 廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。"D00"表全域。 |
E | 廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。"E00"表全域。 |
M | 山峰、山脈 |