[In the later half of this, there is the article written in English.] ===================================== ===================================== ◎hayami.exe用地図データ ○内容物 cities.txt:都市情報(星表データの相当) nation.txt:国名一覧(星座名一覧に相当) nation-e.txt:国名一覧英語版 nation-d.txt:国名一覧独語版 nation-f.txt:国名一覧仏語版 nation-i.txt:国名一覧伊語版 nation-n.txt:国名一覧蘭語版 coast_bd.net:海岸線+国境線データ(星座線データに相当) coast.net:海岸線データ(星座線データに相当) ===================================== ○技術的事項 1)国名一覧や都市番号につかっている3文字の略称は、 ISO3166-1の 3-letter code です。 2a)各国の都市番号は、作業のしやすさで決めたものです。 統一した基準は何もありません。 2b)採用した都市・地点は i)大都市 ii)州都など地域の中心都市 iii)人口閑散地における主要集落 iv)島(孤立島は無条件で採用、諸島は十分な大きさがある主要島) v)無人地帯におけるオアシスや人工物等 vi)無人地帯での適当な自然目標物(山や岬など) 3)地名は、ラテン文字表記を、1行255文字以内で出来るだけ採用。 多過ぎる場合は、現地周辺以外の方言表記や、 文法規則から容易に推測可能な場合(ラトビア語リトアニア語等)を省略。 「ダイアクリティカルマーク」類は省略(独語はae等に規則置き換え)。 i)ラテン文字諸語においては、現地公用語名(特に公式名)を先頭に採用。 現地方言名を確認出来ればその次。 その後に英独仏等の主要言語、さらに他の言語や方言。 最後に明らかな古名やラテン語名。 ii)中国地名においては、ピンイン、ウェード・ジャイル、郵政式等の中国語転写が先頭。 現地方言からの転写が確認出来ればその次。 周辺諸言語(ウイグル、モンゴル等)からのラテン文字転写、 その他ラテン文字諸語における転写や慣用名。 最後にベトナム語読み・日本語読みからのラテン文字転写。 iii)その他の非ラテン文字諸語は英語転写を先頭に採用。 周辺諸言語の英語転写が確認出来ればその次。 その後にラテン文字主要他言語への転写。 ラテン語名が特にあれば最後。 4)「市町村」など広がりのある土地名の経緯度は、 原則として中心市街地(the city proper)を採用。 したがって幾何的中心とは限りません。 特に海に面している市町村は沿岸部集落に偏ります。 ただし、ほぼ同等の大きさの集落をひとつの自治体にまとめた場合など 「中心市街地」を決めかねる場合には、微妙な場所を選んでいる事があります。 また、連続する市街地が複数の自治体に分けられているケースでは、 ある程度分離させるために、中心から多少離してある事があります。 島に関しては、明確な集落があればそこを採用、なければ島の中心を採用。 5)人口情報は参考値です。あまり当てにしてはいけません。 まず人口情報の調査年・推計年にばらつきがあります。 推計の基になるデータが古い国も少なくありません。 また、国によって「市」「町」「村」「集落」の概念が異なり、 単純に比較しかねる場合も多数あります。 いくつかの都市(特に大都市)では「中心市街地人口」「行政区域人口」 「(複数行政区域に及ぶ)都市圏人口」「大都市圏人口」と 複数の概念があり、どれを採用しているか判然としない場合もあります。 中国など人口の多い国では行政区域の階層が多層に及び、 どの階層をもって「市」とみなすか判断に苦しむ場合もあります。 6)括弧内は州・地域・県などです。しかし多くの国は何重構造にもなっています。 日本では「地方(関東・九州など)−都道府県−県内を数個に分割−市郡支庁−町村(市は郡に所属しない)」。 どのレベルの名称を採用するかは、主に個数で決めています。 都道府県レベルで30を越えるとやる気が失せますし、 このレベルでは代表都市名と地域名が重なるので余計やる気が失せるのですが、 もう一段上(10以下に分割された地方)だと「北地域」「東南地域」と 言われなくても分かる名前も多く、こっちもやる気が失せてしまいます。 小さな国では「都道府県」が日本の郡(市が所属している事も多い)に近くなります。 という事でかなりいい加減です。 7)海岸線+国境線データと海岸線データを比較すると、データ量は分かりきってますが、 海岸線+国境線データの方が「載っていれば」形はいいようです。 しかし海岸線データの方がより小さな島まで載っているようです。 例えば九州周辺だと、 前者は対馬(1島)、(壱岐は無し)、五島(1島) 後者は対馬(2島)、壱岐、五島(2島) という感じです。 ========================================= ○Reference 都市情報:Wikipedia(主に英語版),www.citypopulation.de 海岸線+国境線:World Boundary Data bank - PC ARC/INFO 'EXPORT" Version from UNEP/GRID-Geneva http://www.grid.unep.ch/data/download/gnv019.zip 海岸線:World Coastlines and Lakes. Crude. World Wide Coverage by "Coastline Extractor" http://www.ngdc.noaa.gov/mgg/shorelines/shorelines.html ========================================= Jun-11th,2008 Feb-10th,2010:このREADMEの書き直し ftcenter@mth.biglobe.ne.jp http://www2s.biglobe.ne.jp ======================================== ======================================== Earth map data for hayami.exe [A]Contents in Archives cities.txt:data of cities(corresponding to starcatalogue) nation.txt:a list of nation's name in Japanese(corresponding to list of constellation's name) nation-e.txt:a list of nation's name in English nation-d.txt:a list of nation's name in German nation-f.txt:a list of nation's name in French nation-i.txt:a list of nation's name in Italian nation-n.txt:a list of nation's name in Dutch coast_bd.net:data of coast line and boundary line(corresponding to data of constellation's line) coast.net:data of coast line(corresponding to data of constellation's line) ======================================= [B]technical matters 1)The 3letter abbreviation for nations is the 3-letter code of ISO3166-1. 2a)Numbering cities is meaningless. 2b)Introduced cities and point are i)Large Cities ii)Important cities like as Capitals of Regions iii)Central settlements in areas with low population density iv)Ilands(independent ilands are introduced absolutely. Or large Islands in Archipelagos.) v)Oases or Artificialities in No-man's lands vi)Natural land mark, like as mountains or Capes 3)Names of Cities or points in the Latin Alphabet are introduced, as many as possible, within 255 character per line. If too many, dialectal names in far areas from the point are omitted. If we can guess easily the name by rules of the language (like as Lithuanian or Latvian languages), the name is omitted. Diacritical marks are omitted and only 7bit-ASCII characters are used. (But ae, oe, ue for umlauted a, o, u in German are used.) i)In Areas using Languages with the Latin alphabet: First, (Official) Names in On-Site official languages. Second, On-Site dialectal names, if I could confirm. Third, Names in main languages like as English, German, French. Next, names in other languages or dialect. Last, very old names or Latin names. ii)In Areas using Chinese: First, Names in Pinyin, Wade-Giles or Postal Map Romanization. Second, Romanizations from On-Site dialectal names, if I could confirm. Third, Romanizations from names in languages adjacent to China (like as Uyghur or Mongolian languages). Next, Other Romanizations or trivial names to/in European languages. Last, Romanizations from Pronunciation in Vietnamese or Japanese. iii)In Areas using other launguages (with non-Latin Alphabets): First, Romanizations from On-site Official languages to English. Second, Romanizations from dialect or adjacent languages to English, if I could confirm. Next, Romanizations to Other languages with the Latin alphabet. Last, very old names or Latin names. 4)For a place name with some spread like as city, the Longitude and Latitude point to "the city proper", but not geometric center. Especially, for cities facing the sea, the point is near to the sea. But for example, a Municipality merged with many settlements with same size, it is difficult to decide "the city proper". Then the point is inexact. Or in case that a continuous urban area is divided to a few municipalities, I need to spread these point, so these point are slightly faraway from the center. For a Island, if there is a large settlement, the settlement is introduced. Else the center of the island is introduced. 5)Data of population is low accuracy, because of data dipersing on year. In addition, meaning of "City","Town" or "Village" are different between nations, so we can not compare these simply. For some big cities, there are many concepts for population like as "Population of the city proper", "Population of the Manicipality", "Population of the Metropolitan Area" and "Population of the Great Metropolitan Area", and I can not confirm the number which population the number means. Some big countries (like as China) have many layers for local governings, and I can not confirm which layer corresponds "city". 6)State, region or prefecture are written in (). But many nations have multiple structures of dividing regions. I take it by my feeling:-) 7)"coast_bd.txt" have "good shape" data. But "coast.txt" contains smaller islands. ========================================= [C]Reference Data of cities:Wikipedia(mainly English version),www.citypopulation.de Coast line+Boundary line:World Boundary Data bank - PC ARC/INFO 'EXPORT" Version from UNEP/GRID-Geneva http://www.grid.unep.ch/data/download/gnv019.zip Coast line:World Coastlines and Lakes. Crude. World Wide Coverage by "Coastline Extractor" http://www.ngdc.noaa.gov/mgg/shorelines/shorelines.html ========================================= Jun-11th,2008 Feb-10th,2010:rewiting this README. ftcenter@mth.biglobe.ne.jp http://www2s.biglobe.ne.jp