2015年5月28日木曜日

墨書土器特定文字の全国分布図作成方法

公開されている全国墨書土器・刻書土器データベース(csvファイル)(明治大学日本古代研究所)から特定文字の簡易全国分布図作成方法をメモしておきます。

1 全国墨書土器・刻書土器データベース(csvファイル)のダウンロード
サイト明治大学日本古代研究所からcsvファイルをダウンロードします。

2 csvファイルから特定文字を含むデータだけのcsvファイルを作成する
csvファイルをExcelに読み込んで、Excelの検索機能により特定文字を含むデータを検索することはすぐできます。

しかし、検索結果をファイル出力する機能はExcelに標準装備されていません。

マクロを組めば可能だと思います。

私はFile Makerにcsvファイル読み込み、そこで検索し、その検索結果をExcel出力して、そのExcelからcsvファイルを作りました。

現在のところ、私のFile Makerは1ヶ月限定の試供版ですが、大変便利なソフトであることを実感しました。

例 「村」を含む文字データの数
●データベース全体のデータ数 約117000件
●「村」を含むデータ数 148件
●「村」1語だけのデータ数 40件

参考 検索にエディターは不向き
エディタにより「村」を検索すると631件の行がヒットします。
これは、釈文の項目以外の項目(遺跡名、住所等)を含めて「村」を検索しているからです。
ですから、631件からさらに釈文の項目に「村」が含まれているデータだけを抽出する必要があります。
このような手間がかかるので、このデータベースの検索ではエディタは不向きです。

3 特定文字データファイル(csvファイル)にアドレスマッチングにより経度・緯度情報を付加する
WEB「東京大学csvアドレスマッチングサービス」の機能を利用して特定文字データファイルに位置情報を付加します。

東京大学csvアドレスマッチングサービスの機能画面

4 特定文字データファイル(位置情報付加csvファイル)をGISに取り込む
特定文字データファイル(位置情報付加csvファイル)をGISに取り込み、地図を作成します。

例 「村」を含むデータプロット

例 「村」1語のみのデータプロット

(「村」を含むデータの大半は○○村が多く、地名が多いと考えます。ですから全国的に分布が拡がります。「村」1語は新規開発地それも農業集落ではなく掘立柱建物群を指すと考えられ、蝦夷戦争に関わりの深い地域に分布します。)

メモ
全国墨書土器・刻書土器データベース(csvファイル)(明治大学日本古代研究所)では県別に細部の書式や記述精度が異なります。
またアドレスマッチングに使う住所表示も不統一です。
このため、検索結果である特定文字データファイルについて書式上の調整等が必要となります。

0 件のコメント:

コメントを投稿