地名編碼原則

出自DILA Wiki

地名Authority的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。

為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表

聯合國地理區代碼

地理區代碼 涵蓋地區
001 全球
142 亞洲
143 中亞

哈薩克 吉爾吉斯 塔吉克 土庫曼 烏茲別克

030 東亞

中國 北韓 南韓 日本 臺灣 香港 澳門 蒙古

034 南亞

阿富汗 孟加拉 印度 巴基斯坦 不丹 伊朗 馬爾地夫 尼泊爾 斯里蘭卡

035 東南亞

汶萊 柬埔寨 印尼 新加坡 馬來西亞 越南 泰國 緬甸 菲律賓 寮國 東帝汶

145 西亞

亞美尼亞 亞塞拜然 敘利亞 以色列 黎巴嫩 伊拉克 巴林 沙烏地阿拉伯 塞浦路斯 喬治亞 約旦 科威特 巴勒斯坦(無國土) 阿曼 卡達 土耳其 阿拉伯聯合大公國 葉門

但因為ID第一碼不能為數字,故在聯合國編碼前冠"WW"。如朝鮮半島:WW030KP00D01AA。KP代表Korean Peninsula,後方補"00"表示"全域"。前方9碼代表"位置",如朝鮮半島、中國(CN0000000)。後方再加5碼,代表"屬性"。

中國地理區編碼示例

陝西省 CN0610000E00AA
關中平原 CN0610000D01AA (第5、6、7、8碼為"0000"表示陜西省全域)
長江 CN0000000R01AA (因長江橫跨九省,以中國全境境內跨行政區水系之"1號"表示)
南朝 建業 CN0320106Z01AA (位於今南京市鼓樓區)

而為了處理中國的跨省地理區的編碼,依據ISO的精神又新增:華北(CN11)、東北(CN12)、華東(CN13)、中南(CN14)、西南(CN15)、西北(CN16)。詳細劃分請見:大行政區,此分類實際已廢,僅供標記使用。

"屬性"編碼主要是用於區別同一"位置"之地名,同時也為解決中研院(Z碼)提供的龐大地名資料。由於歷代疆域變動不斷,跨時間的地名無法以樹狀結構表示;因此在以"行政中心"所在座標的位置之後,附上"屬性碼"(第10碼)與流水號碼(第11、12碼)。

屬性碼說明:

代碼 用途
A、B、C 一般"點地名",由"A01"~"C99"表示。如"紫禁城",位於北京市東城區(CN0110101),"紫禁城"可為"CN0110101A01AA"。"太和殿"則視為"紫禁城"下的附屬地名,可為"CN0110101A01AB"。
D 廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。至少需跨2個縣市,如:四川盆地。而台北盆地請使用點地名。
E 廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。至少需跨2個縣市,如:關中。
G 具有某種關聯性質、或共同性的幾個地名群組,用以說明不相連的數個地名。此時地名編碼必須能包含所有成員。如"五嶽",為"CN0000000G01AA"。
M 山峰、山脈。
R 河流、湖泊、海洋等水系。
T、U、V 寺廟、佛塔,佛教文化地點。
Z 中研院所提供之歷史地名。
其他 系統保留碼,暫不使用。

至於第13、14碼則為表示點地名以下的附屬地名。如法鼓佛教學院 圖資館。一般其預設值為"AA",代表全域。"AB"以後之地名不再標示座標,而以"AA"之坐標代替。

各國地名位置編碼標準舉例:

台灣地區:「TW」+「郵遞區號3+2碼」+「00」+「5碼屬性」(台灣地區只用ISO國碼,不用一級行政區碼)

印度地區:「IN」+「7位行政區碼」+「「5碼屬性」

越南地區 :「VN」+「1碼大區域碼」+「4位HASC碼」+「2碼流水號」+「5碼屬性」(越南縣級以上行政區列表)

日本地區:「JP」+「1碼大區域碼」+「6位行政區碼」+「5碼屬性」

南韓地區:「KR」+ISO與「3位郵遞區號」+「1碼流水號」+「5碼屬性」(南韓地區以ISO碼與郵遞區號混編成樹狀結構)

菲律賓地區:「PH」+「2碼大區域碼」+「3碼省碼」+「2碼縣市碼」+「5碼屬性」