「地名編碼原則」:修訂間差異
imported>Putitz 無編輯摘要 |
imported>Grace 小 (已解除保護"地名編碼原則") |
||
(未顯示由 2 位使用者於中間所作的 37 次修訂) | |||
行 1: | 行 1: | ||
地名Authority的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。 | [http://authority.ddbc.edu.tw/place/ 地名Authority] 的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。 | ||
為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表 | 為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表 | ||
= [http://unstats.un.org/unsd/methods/m49/m49regin.htm 聯合國地理區代碼] = | |||
{| border="1" | {| border="1" | ||
行 80: | 行 82: | ||
|} | |} | ||
但因為ID第一碼不能為數字,故在聯合國編碼前冠" | 但因為ID第一碼不能為數字,故在聯合國編碼前冠"WW"。如朝鮮半島 :WW030KP00D01AA 。KP代表Korean Peninsula,後方補"00"表示"全域"。前 方9 碼代表"位置",如朝鮮半島、中國(CN0000000)。後方再加5碼,代表"屬性"。 | ||
= 中國地理區編碼示 例 = | |||
{| border="1" | {| border="1" | ||
|陝西省 | |陝西省 | ||
| | |CN0610000E00AA | ||
|- | |- | ||
|關中平原 | |關中平原 | ||
| | |CN0610000D01AA (第5、6 、7、8 碼為"0000"表示陜西省全域) | ||
|- | |- | ||
|長江 | |長江 | ||
| | |CN0000000R01AA (因長江橫跨九省,以中國全境境內跨行政區 水系 之"1 號"表示) | ||
|- | |- | ||
|南朝 建業 | |南朝 建業 | ||
| | |CN0320106Z01AA (位於今南京市鼓樓區) | ||
|} | |} | ||
而 為 了處理中國的跨省 地 理區的編碼,依據ISO 的 精神又新增:華北(CN11)、東北(CN12)、華東(CN13)、中南(CN14)、西南(CN15)、西北(CN16) 。 詳細劃分請見:[http://zh.wikipedia.org/zh-tw/%E5%A4%A7%E8%A1%8C%E6%94%BF%E5%8C%BA 大行政區],此分類實際已廢,僅供標記使用 。 | |||
"屬性"編碼主要是用於區別同 一" 位置" 之地名 , 同時也為解決中研院(Z碼)提供的龐大地名資料。由於歷 代 疆 域 變動不斷,跨時間的 地名 無法以樹狀結構表 示 ;因此在以"行政中心"所在 座標 的位置之後 , 附上" 屬性碼"(第10碼)與流水號碼(第11、12碼) 。 | |||
= 屬性碼 說明 := | |||
{| border="1" | {| border="1" | ||
!代碼 | !代碼 | ||
行 110: | 行 110: | ||
|- | |- | ||
|A、B、C | |A、B、C | ||
|一般"點地名" | |一般"點地名",由"A01"~"C99"表示。如"紫禁城",位於北京市東城區(CN0110101),"紫禁城"可為"CN0110101A01AA"。"太和殿"則視為"紫禁城"下的附屬地名,可為"CN0110101A01AB"。 | ||
|- | |- | ||
|D | |D | ||
|廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。 | |廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。 至少需跨2個縣市,如:四川盆地。而台北盆地請使用點地名 。 | ||
|- | |- | ||
|E | |E | ||
|廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。" | |廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。 至少需跨2個縣市,如:關中。 | ||
|- | |||
|G | |||
|具有某種關聯性質、或共同性的幾個地名群組,用以說明不相連的數個地名。此時地名編碼必須能包含所有成員。如" 五嶽",為"CN0000000G01AA"。 | |||
|- | |- | ||
|M | |M | ||
行 124: | 行 127: | ||
|河流、湖泊、海洋等水系。 | |河流、湖泊、海洋等水系。 | ||
|- | |- | ||
|T | |T 、U、V | ||
|寺廟、佛塔,佛教文化地點。 | |寺廟、佛塔,佛教文化地點。 | ||
|- | |- | ||
行 134: | 行 137: | ||
|} | |} | ||
'''各國地名位置編碼標準:''' | 至於第13、14碼則為表示點地名以下的附屬地名。如法鼓佛教學院 圖資館。一般其預設值為"AA",代表全域。"AB"以後之地名不再標示座標,而以"AA"之坐標代替。 | ||
'''各國地名位置編碼標準 舉例 :''' | |||
台灣地區:「TW」+「[http://www.post.gov.tw/post/internet/f_searchzone/index.jsp?ID=190102 郵遞區號3+2碼]」+ | 台灣地區:「TW」+「[http://www.post.gov.tw/post/internet/f_searchzone/index.jsp?ID=190102 郵遞區號3+2碼]」+ 「00 」+ 「5 碼 屬性 」(台灣地區只用ISO國碼,不用一級行政區 碼) | ||
印度地區:「IN」+「[http://en.wikipedia.org/wiki/List_of_districts_of_India | 印度地區:「IN」+「[http://en.wikipedia.org/wiki/List_of_districts_of_India 7 位行政區 碼]」+「「5碼屬性」 | ||
越南地區 :「VN」+「1碼大區域碼」+「[http://en.wikipedia.org/wiki/ISO_3166-2:VN 4位HASC 碼]」+「2碼流水號 」+「5碼屬性」([http://zh.wikipedia.org/w/index.php?title=%E8%B6%8A%E5%8D%97%E7%B8%A3%E7%B4%9A%E8%A1%8C%E6%94%BF%E5%8D%80%E5%88%97%E8%A1%A8&variant=zh-tw 越南縣級以上行政區列表]) | |||
日本地區:「JP」+「1碼大區域碼」+「[http://www.lasdec.nippon-net.ne.jp/cms/1,0,14.html 6位行政區碼]」+「5碼屬性」 | |||
南韓地區:「KR」+ISO與「[http://www.etpost.co.kr/service/zipcode/zip_eng.php?e_wa=01&e_city=02&range=2&mod=e 3位郵遞區號] 」+「1碼 流水號 」+ 「5 碼 屬性 」(南韓地區以ISO碼與郵遞區號混編成樹狀結構) | |||
菲律賓 地區: 「PH 」+ 「2碼大 區 域 碼」+ 「3碼省 碼」+ 「2碼縣市 碼」+「5碼屬性」 |
於 2011年11月1日 (二) 14:55 的最新修訂
地名Authority的編碼為了在使用時賦予意義,以便於使用者能解讀編碼地區,所以並未採用流水號(如中研院的Z碼)。而是以今地名為基礎的樹狀結構編碼。
為加速編碼的進行,我們依國際化與標準化的原則,採用ISO-3166為基礎的編碼方式。由於ISO組織每年都會根據該編碼進行更新,所以在未註明的情形下,編碼以2007年12月底的碼來進行。至於跨國的區域,則採用聯合國的編碼。如下表
聯合國地理區代碼
地理區代碼 | 涵蓋地區 |
---|---|
001 | 全球 |
142 | 亞洲 |
143 | 中亞
哈薩克 吉爾吉斯 塔吉克 土庫曼 烏茲別克 |
030 | 東亞
中國 北韓 南韓 日本 臺灣 香港 澳門 蒙古 |
034 | 南亞
阿富汗 孟加拉 印度 巴基斯坦 不丹 伊朗 馬爾地夫 尼泊爾 斯里蘭卡 |
035 | 東南亞
汶萊 柬埔寨 印尼 新加坡 馬來西亞 越南 泰國 緬甸 菲律賓 寮國 東帝汶 |
145 | 西亞
亞美尼亞 亞塞拜然 敘利亞 以色列 黎巴嫩 伊拉克 巴林 沙烏地阿拉伯 塞浦路斯 喬治亞 約旦 科威特 巴勒斯坦(無國土) 阿曼 卡達 土耳其 阿拉伯聯合大公國 葉門 |
但因為ID第一碼不能為數字,故在聯合國編碼前冠"WW"。如朝鮮半島:WW030KP00D01AA。KP代表Korean Peninsula,後方補"00"表示"全域"。前方9碼代表"位置",如朝鮮半島、中國(CN0000000)。後方再加5碼,代表"屬性"。
中國地理區編碼示例
陝西省 | CN0610000E00AA |
關中平原 | CN0610000D01AA (第5、6、7、8碼為"0000"表示陜西省全域) |
長江 | CN0000000R01AA (因長江橫跨九省,以中國全境境內跨行政區水系之"1號"表示) |
南朝 建業 | CN0320106Z01AA (位於今南京市鼓樓區) |
而為了處理中國的跨省地理區的編碼,依據ISO的精神又新增:華北(CN11)、東北(CN12)、華東(CN13)、中南(CN14)、西南(CN15)、西北(CN16)。詳細劃分請見:大行政區,此分類實際已廢,僅供標記使用。
"屬性"編碼主要是用於區別同一"位置"之地名,同時也為解決中研院(Z碼)提供的龐大地名資料。由於歷代疆域變動不斷,跨時間的地名無法以樹狀結構表示;因此在以"行政中心"所在座標的位置之後,附上"屬性碼"(第10碼)與流水號碼(第11、12碼)。
屬性碼說明:
代碼 | 用途 |
---|---|
A、B、C | 一般"點地名",由"A01"~"C99"表示。如"紫禁城",位於北京市東城區(CN0110101),"紫禁城"可為"CN0110101A01AA"。"太和殿"則視為"紫禁城"下的附屬地名,可為"CN0110101A01AB"。 |
D | 廣大之陸上自然地理區域(面地名)。如沙漠、高原、平原。至少需跨2個縣市,如:四川盆地。而台北盆地請使用點地名。 |
E | 廣大之陸上人文地理區域(面地名)。如關中、中原、烏仗那國、中國。至少需跨2個縣市,如:關中。 |
G | 具有某種關聯性質、或共同性的幾個地名群組,用以說明不相連的數個地名。此時地名編碼必須能包含所有成員。如"五嶽",為"CN0000000G01AA"。 |
M | 山峰、山脈。 |
R | 河流、湖泊、海洋等水系。 |
T、U、V | 寺廟、佛塔,佛教文化地點。 |
Z | 中研院所提供之歷史地名。 |
其他 | 系統保留碼,暫不使用。 |
至於第13、14碼則為表示點地名以下的附屬地名。如法鼓佛教學院 圖資館。一般其預設值為"AA",代表全域。"AB"以後之地名不再標示座標,而以"AA"之坐標代替。
各國地名位置編碼標準舉例:
台灣地區:「TW」+「郵遞區號3+2碼」+「00」+「5碼屬性」(台灣地區只用ISO國碼,不用一級行政區碼)
印度地區:「IN」+「7位行政區碼」+「「5碼屬性」
越南地區 :「VN」+「1碼大區域碼」+「4位HASC碼」+「2碼流水號」+「5碼屬性」(越南縣級以上行政區列表)
日本地區:「JP」+「1碼大區域碼」+「6位行政區碼」+「5碼屬性」
南韓地區:「KR」+ISO與「3位郵遞區號」+「1碼流水號」+「5碼屬性」(南韓地區以ISO碼與郵遞區號混編成樹狀結構)
菲律賓地區:「PH」+「2碼大區域碼」+「3碼省碼」+「2碼縣市碼」+「5碼屬性」