✅ このスクリプトは初回実行時にデータを自動取得します(DoBoX からの直接ダウンロード)。
| ID | データセット名 |
|---|---|
| #65 | 地図情報_3次元点群データ_オープン |
| #123 | dataset #123 |
| #125 | dataset #125 |
| #222 | dataset #222 |
| #999 | dataset #999 |
| #1434 | 地図情報_3次元点群データ_オープン_2023 |
| #1527 | 地図情報_3次元点群データ_オープン_2024 |
実行コマンド:
cd "2026 DoBoX 教材"
python -X utf8 lessons/L42_map_information.py
DoBoX のオープンデータは申請不要・商用/非商用とも利用可。
data/extras/ は .gitignore 対象(約 57 GB のキャッシュ)。
スクリプト実行で自動再生成されます。
DoBoX のシリーズ 「地図情報_3次元点群データ_オープン」 3 件:
これら 3 dataset は同じシリーズ名 (= 地図情報_3次元点群データ) を持つが、 vintage (年度) で分割された 3 つの公開単位である。 本記事は「3 dataset を時系列で並べると、広島県の航空レーザ測量の整備史と将来像はどう描けるか」を、 1200 resource のメタ情報 + 23 メタデータ XML + 代表サンプルファイル 3 種類 (DXF/TXT/LAS) を実データで読み解く形で量的に検証する。
| 用語 | 定義 (本記事独自) |
|---|---|
| 地図情報 | DoBoX 上の総称ラベル。実体は砂防基礎調査に伴う航空レーザ測量成果。「地図一般」ではなく、土砂災害防止法第 4 条に基づく基礎調査用の地形データを指す。 |
| vintage | 計測年度。本記事では 3 dataset を「3 vintage」(2014-2018, 2018-2022, 2023) として整理する。同じ航空レーザ測量を異なる年に実施した独立成果。 |
| 業務 | 1 つのメタデータ XML が記述する計測契約単位。広島県土木建築局が発注した「砂防基礎調査に伴う航空レーザ測量及び撮影業務」の通し番号。3 dataset 合計で 23 業務 (= XML 23 件)。 |
| 図郭 | 国土基本図の 1 地図シート。本データは地図情報レベル 2500 (1/2500) に基づき, 1 図郭 = 750m × 1.125km。図郭 ID 例: 03nf2444。先頭 4 桁 (03nf) は地区記号, 後続 4 桁が格子位置。 |
| 地図情報レベル | 国土地理院の用語。地図情報レベル 1000 = 1m 解像度, 500 = 50cm 解像度, 2500 = 2.5m 解像度。古い vintage は 1000, 新しい vintage は 500。 |
| プロダクト | 1 つの計測から派生する成果データ種類。本データは 6 種類: メタデータ XML / 等高線 DXF / オルソ画像 TIFF / DEM グリッド TXT / 水部ポリゴン DXF / 点群 LAS。 |
| 地理基盤 | 本記事独自呼称。L36-L40 が「LiDAR ファミリ 派生層」(樹高/標高/傾斜/CS立体) なら、本記事 3 dataset は「LiDAR ファミリ 原料層」(DEM/等高線/点群そのもの) である。 |
| 仮説 | 主張 | 背景 |
|---|---|---|
| H1 | 3 dataset の図郭 ID 集合は disjoint (重複 < 全体の 10%) | DoBoX は時系列で別 dataset として整理しているはず |
| H2 | 解像度進化: ds65 = レベル 1000 (1m) → ds1434 = 移行期 → ds1527 = レベル 500 (50cm) | 2018 年以降の計測技術の細密化 (高密度パルス・低空ヘリ計測) |
| H3 | ds1527 にのみLAS 点群が存在 (= 新 vintage で点群そのものも公開する方向に進化) | 従来は派生プロダクトのみ公開, 現在は raw 点群も提供 |
| H4 | vintage 進化: ds65 = 広島県全域 → ds1434 = 市町別業務 → ds1527 = 三次・庄原集中 | 初期は概覆, 中期は政令市, 後期は中山間地の更新計測 |
| H5 | 1 業務あたり 10-20 図郭 (= 200-400 km²)。23 業務 × 200-400 km² ≈ 広島県 8479 km² と整合 | 計測契約の標準的サイズ |
| H6 | 図郭 prefix (03nf, 03od, ...) は国土基本図 1/25000 地区記号 |
国土地理院の標準命名規則 |
本記事では DoBoX の「地図情報_3次元点群データ_オープン」シリーズ 3 件 (dataset_id = 65, 1434, 1527; 合計 1200 resource) を統合する。 すべて広島県土木建築局が砂防基礎調査の航空レーザ測量成果として公開した 公共測量 2 次著作物。CRS はEPSG:6671 (JGD2011 / 平面直角座標系 III 系)。 ライセンスはクリエイティブ・コモンズ表示 (CC-BY)。
| 論題 | データセット | 公開期 | 計測 vintage | 業務数 | resource 数 | プロダクト種類 | 図郭数 | 地図情報レベル |
|---|---|---|---|---|---|---|---|---|
| DS65 (オリジナル) | DoBoX #65 | 2016-2019 | 2014-2018 計測 | 10 | 400 | 5 | 111 | 1000 |
| DS1434 (2023 公開) | DoBoX #1434 | 2019, 2023 | 2018, 2022 計測 | 8 | 400 | 5 | 121 | 500, 1000 |
| DS1527 (2024 公開) | DoBoX #1527 | 2024 | 2023 計測 | 5 | 400 | 6 | 188 | 500 |
「地図情報」というタイトルは抽象的だが、内部メタデータ (JMP 2.0 規格) の title 要素を
読むと、実体は「砂防基礎調査に伴う航空レーザ測量及び撮影業務」の成果である。
広島県土木建築局が「土砂災害警戒区域等における土砂災害防止対策の推進に関する法律」第 4 条に基づき、
広島県全域 (8479 km²) を順次計測したもの。
本記事の 3 dataset は L36-L40 のラスタ系 5 dataset の原料に相当する:
| 本データ (原料層) | → | L36-L40 (派生層) |
|---|---|---|
| DEM グリッド TXT (50cm-1m 標高) | → | L40 標高図 |
| DEM グリッド TXT + DSM | → | L36 樹高図 (DCHM = DSM-DTM) |
| DEM グリッド TXT | → | L38 CS 立体図 / L39 傾斜図 |
| LAS 点群 (パルス本数) | → | L37 点群密度図 |
| 樹高 + 平面位置 | → | L41 単木ポイント (1520) |
つまり LiDAR ファミリは「点群 (本記事 LAS) → DEM (本記事 TXT) → 派生ラスタ (L36-L40) → 林業ベクタ (L41)」 の 4 段派生階層。本記事は最上流 (= 原料層) を扱う。
各業務には JMP (Japan Metadata Profile) 2.0 形式の XML メタデータが付属。
含まれる要素: title / date / abstract / pointOfContact / language / topicCategory /
extent (geographic + temporal) / referenceSystemIdentifier。
本記事はこの XML 23 件を全件パースし、業務単位の構造化情報を作成した。
本記事の再現に必要なデータ・中間データ・図はすべて以下から直 DL 可能。
data.hiroshima-dobox.jp/... 直リンク)注意: DoBoX のリソース個別ページの「ダウンロード」ボタンは内部リンク
(/resource_download/{rid}) ではなく, ページ内に直接記された
data.hiroshima-dobox.jp/aerial_survey/{vintage}/{kind}/...
形式の S3/CloudFront 直 URL を踏む。本記事の取得スクリプトはこの直 URL を抽出して取得する。
L42_map_information.py をダウンロードし、
データキャッシュ (data/extras/L42_map_information/samples_meta_full.json など) があれば即座に再現可能。
無ければ DoBoX から resource 一覧 + メタデータ XML を取得 (約 1 分)。
cd "2026 DoBoX 教材"
py -X utf8 lessons\L42_map_information.py
3 dataset = 3 vintage を時系列で並べ、広島県の航空レーザ測量整備の進化を量的に把握する。 本記事の主命題「3 dataset は時系列で別 dataset として整理されている」(H1) を量的に検証する。
3 段階の処理:
xml.etree.ElementTree でパース。pandas.DataFrame で resource × kind × ds × year の多次元クロスを作成。↑ L42_map_information.py 行 1418–1479
なぜこの図か: 3 dataset を 1 軸時系列で並べると、計測期間 (バー長) と公開日 (▼) の関係が一目で分かる。 y 軸 3 段に分けて 3 dataset の運用ペースを比較する。

読み取り (重要発見):
| dataset_id | 短称 | 公開期 | 計測 vintage | 業務件数 | resource 件数 | プロダクト種類数 | 図郭異種数 | 地図情報レベル | DoBoX URL |
|---|---|---|---|---|---|---|---|---|---|
| 65 | DS65 (オリジナル) | 2016-2019 | 2014-2018 計測 | 10 | 400 | 5 | 111 | 1000 | https://hiroshima-dobox.jp/datasets/65 |
| 1434 | DS1434 (2023 公開) | 2019, 2023 | 2018, 2022 計測 | 8 | 400 | 5 | 121 | 500、1000 | https://hiroshima-dobox.jp/datasets/1434 |
| 1527 | DS1527 (2024 公開) | 2024 | 2023 計測 | 5 | 400 | 6 | 188 | 500 | https://hiroshima-dobox.jp/datasets/1527 |
読み取り: 3 dataset はresource 件数 (~400) はほぼ均等だが、業務数 (10/8/5)・図郭数・地図情報レベルが異なる。 ds1527 はプロダクト種類数 (5) が最多 (LAS 点群が追加されたため) 。
1200 resource をプロダクト種別 (kind) で分類し、3 dataset 間でどのプロダクトが増減しているかを量化する。 H3 (ds1527 にのみ LAS 点群) を検証。
resource タイトル文字列のパターンマッチで分類:
| 分類 | 判定キーワード | 物理形式 |
|---|---|---|
| メタデータ | 「メタデータ」 | XML (JMP 2.0) |
| 等高線 (DXF) | 「等高線」 | AutoCAD DXF (テキスト, polyline) |
| オルソ画像 (TIFF) | 「オルソ画像」「写真地図」 | GeoTIFF + TFW (世界座標) |
| DEM グリッド (TXT) | 「グリッドデータ」「3次元点群」 | CSV (id, x, y, z, ground) |
| 水部ポリゴン (DXF) | 「水部」 | AutoCAD DXF (polygon) |
| 点群LAS | 「LAS」 | LAS 1.2 (バイナリ) |
↑ L42_map_information.py 行 1497–1524
なぜこの図か: 3 dataset 間でどのプロダクトが追加・削減されたかを積み上げ棒で見る。 色がプロダクト種別、棒の高さが resource 件数。

読み取り (重要発見):
| kind | DEM グリッド (TXT) | オルソ画像 (TIFF) | メタデータ | 水部ポリゴン (DXF) | 点群LAS | 等高線 (DXF) |
|---|---|---|---|---|---|---|
| ds | ||||||
| 65 | 113 | 112 | 10 | 52 | 0 | 113 |
| 1434 | 121 | 120 | 8 | 30 | 0 | 121 |
| 1527 | 65 | 187 | 5 | 15 | 64 | 64 |
読み取り: 縦読み (ds 別) は構成比、横読み (kind 別) はプロダクトごとの発展傾向を示す。 ds1527 のオルソ激増 (187 件) は、1 図郭につき複数年分のオルソを並列公開している可能性が高い。
23 メタデータ XML (JMP 2.0 形式) を全件パースし、業務単位の構造化情報を作成する。 業務名・対象圏域・計測期間・公開日・地図情報レベル を読み解き、H4 (vintage 進化のカバレッジ) を検証。
JMP 2.0 (Japan Metadata Profile 2.0) は、国土地理院が定める空間情報メタデータの XML 形式 (ISO 19115 を日本向けに簡略化)。
本データの XML は http://zgate.gsi.go.jp/ch/jmp/ 名前空間下に以下の主要要素を持つ:
citation/title: 業務名 (例: 「砂防基礎調査に伴う航空レーザ測量及び撮影業務その3」)citation/date: 公開日 (例: 2016-10-31)abstract: 概要 (例: 「地図情報レベル1000」「地図情報レベル500」)extent/temporalElement/beginEnd: 計測期間 (例: 2015-11-21 → 2016-02-18)extent/geographicIdentifier/code または description: 対象圏域 (例: 「太田川圏域」「庄原市北部」)referenceSystemIdentifier/code: CRS (全件 「JGD2011 / 3(X,Y)」 = EPSG:6671)↑ L42_map_information.py 行 1557–1602
なぜこの図か: 23 業務を縦に並べ、横軸時間で計測期間バー + 公開日 ▼ + 圏域名 を 1 枚に。 ds 色分けで時系列パターンを把握する。

読み取り (重要発見):
| region | その他 | 三次・庄原 | 太田川圏域 | 江の川圏域 | 沿岸/島嶼 | 県全域 | 芦田川圏域 |
|---|---|---|---|---|---|---|---|
| ds | |||||||
| 65 | 0 | 1 | 3 | 2 | 1 | 2 | 1 |
| 1434 | 5 | 0 | 0 | 0 | 2 | 0 | 1 |
| 1527 | 0 | 5 | 0 | 0 | 0 | 0 | 0 |
読み取り: 圏域分類の変化:

読み取り: 縦バーで業務件数を圏域別に積み上げ。ds65 → ds1434 → ds1527 で「県全域 → 沿岸/市町 → 三次・庄原」と変化。これは H4 を支持する直接証拠。

読み取り:
図郭 ID (例: 03nf2444) の構造を解読し、3 dataset の地理カバレッジを量化する。
H1 (3 dataset の sheet 集合 disjoint) と H6 (図郭 prefix = 国土基本図地区記号) を検証。
図郭 ID 「03nf2444」の構造:
03nf): 国土基本図 1/25000 の地区記号。
「03」は中国地方、「nf」は地区アルファベット (国土地理院命名)。2444): 1/25000 図郭内の細分位置 (子図郭の格子座標)。
1/25000 = 地図情報レベル 25000 を 100 分割した位置。すなわち 1 業務は 多数の地図情報レベル 1000-2500 図郭を担当し、各図郭が 1 つの「resource」として DoBoX に登録される。1 図郭 = ~ 750m × 1.125km (地図情報レベル 2500 を 4 分割した子図郭)。
なぜこの図か: 図郭 prefix (国土基本図地区記号) が 3 dataset でどう分布しているかを 1 枚で見る。 prefix が disjoint なら H1 を支持。

読み取り (重要発見):
03nf, 03ng, 03of, 03og, 03nh 等多数の地区に分散 = 県全域概覆。03nf) に集中 = 三次・庄原は 03nf 系列のみ。| 組合せ | 共通図郭数 |
|---|---|
| ds65 ∩ ds1434 | 0 |
| ds65 ∩ ds1527 | 0 |
| ds1434 ∩ ds1527 | 0 |
| 3 dataset 全部 | 0 |
読み取り (H1 検証): ds65 ∩ ds1434 = 0, ds65 ∩ ds1527 = 0, ds1434 ∩ ds1527 = 0。 3 dataset 全部に同じ図郭が現れたのは 0 件のみ。 合計 420 異種図郭中、重複は0.0%。 H1 (図郭集合 disjoint) は支持。3 dataset は時系列の分割整理であり、同じ図郭を重複して公開しているのではない。
| prefix | n_resources |
|---|---|
| 03nf | 785 |
| 03oe | 283 |
| 03od | 109 |
読み取り: prefix のトップは 03nf (785 件)。
これは国土地理院の 1/25000 地形図索引で三次・庄原を中心とする中国山地中央部に対応する地区記号。
広島県の航空レーザ測量は山間部 (中山間地, 急傾斜地) の高密度整備に重点があることが、prefix 分布から逆引きできる。
各プロダクト (DXF / TXT / LAS) を実ファイル 1 件ずつ解析し、 データ構造・属性・要素数・値域を Before/After 形式で具体化する。 これは Q (multi-angle 活用) と K (Before/After 例) の要件への対応。
狙い: ds65 オリジナルの等高線 (DXF) を読込み、polyline と標高値の構造を可視化する。 DXF は AutoCAD のテキスト形式で、グループコード (整数) と値が交互に並ぶ独特の形式。
DXF テキストの主要グループコード:
LWPOLYLINE)本記事は単純なテキスト解析: 行 i が「38」なら次行を float でパースして標高 list に追加。
↑ L42_map_information.py 行 1711–1763

読み取り:
03nf653_05_contour.dxf (16 MB) は 657 polylines, 463,847 頂点。1 図郭でこれだけ細かい等高線が含まれる。狙い: ds1434 の DEM グリッド (CSV テキスト) を pandas で読込み、 点群分類 (ground / non-ground) と標高分布を量化する。
DEM TXT は単純な CSV: id, x, y, z, classification の 5 列。
classification = 1 が ground (地面), 0 が non-ground (建物・植生)。
航空レーザのベアアース DTM (= 樹木・建物を除いた地面標高) を作るためのフィルタリング情報。
↑ L42_map_information.py 行 1758–1768
1758 1759 1760 1761 |

読み取り:
狙い: ds1527 で新規追加された LAS 点群のヘッダを読み、生成ソフト・点数・XYZ 範囲を確認する。 LAS はバイナリ形式なので、struct でヘッダの固定オフセットから取り出す。
LAS 1.2 ファイルの先頭 227 バイトはヘッダで、固定オフセット位置に各情報がある:
↑ L42_map_information.py 行 1794–1818

読み取り:
| プロダクト | サンプル | 形式 | 要素 | 属性数 | 値域 | ファイルサイズ |
|---|---|---|---|---|---|---|
| 等高線 (DXF) | 03nf653_05_contour.dxf | AutoCAD DXF (テキスト) | 657 polylines / 463,847 頂点 | 標高 182 レベル | 721–902 m | 16.5 MB |
| DEM グリッド (TXT) | 03od7914_14_05mcsv.txt | CSV (id, x, y, z, ground) | 88,741 点 (50cm 格子) | 5 列 (id/x/y/z/ground 分類) | Z 844–898 m | 3.0 MB |
| 点群 (LAS) | 03nf2634_23_05mcsv-las.las | LAS 1.2 (バイナリ) | 13,767 点 | X/Y/Z + intensity + classification | Z 996–1010 m | 269 KB |
読み取り (Before/After): 1 図郭分の生データは合計 70+ MB (DXF 17MB + TXT 3MB + TIFF 56MB + LAS 0.3MB)。 1200 resource × 平均 50MB ≈ 60GB 相当のデータ量。 これが広島県の地形マッピング基盤の物理サイズ。
| 仮説 | 主張 | 結果 | 判定 |
|---|---|---|---|
| H1 | 3 dataset の sheet_id はほぼ disjoint | 重複 ds65∩ds1434=0, ds65∩ds1527=0, ds1434∩ds1527=0 | 支持 |
| H2 | 解像度進化 1000 → 500 | ds65=[1000], ds1434=[500, 1000], ds1527=[500] | 支持 |
| H3 | ds1527 にのみ LAS 点群が存在 | LAS 件数: ds65=0, ds1434=0, ds1527=64 | 支持 |
| H4 | vintage 進化 (古→新で範囲縮小) | ds65=広島県全域系, ds1434=市町別業務, ds1527=三次・庄原集中 | 支持 |
| H5 | 1 業務あたり 10-20 図郭 | 23 業務 / 420 異種図郭 = 18.3 図郭/業務 | 支持 |
| H6 | 図郭 prefix は国土基本図 1/25000 地区記号 | prefix 3 種類 (['03nf', '03od', '03oe']) | 支持 (prefix 命名規則を確認) |
DoBoX で「地図情報」を検索すると 3 dataset がヒットするが、タイトルだけ見れば「地図一般」に思える。 しかし JMP 2.0 メタデータを開くと「砂防基礎調査に伴う航空レーザ測量及び撮影業務」と書かれており、 実体は土砂災害防止法第 4 条に基づく基盤整備の航空レーザ測量成果である。 これは行政データオープン化において「公開タイトル ≠ 内部メタタイトル」のギャップが起こりうることを示す好例。 研究者・教育者は必ずメタデータ XML を読む習慣をつけるべき。
業務単位の解読から、広島県の航空レーザ測量整備戦略は以下のように変化したと読める:
本記事の量的結果から、LiDAR ファミリの派生階層は以下のように整理できる:
| 段階 | データ層 | 形式 | 本データ・記事 |
|---|---|---|---|
| 1 (原料) | raw 点群 (LiDAR 反射点) | LAS バイナリ | 本記事 ds1527 (新規公開) |
| 2 (1 次成果) | DEM (50cm-1m グリッド標高) | TXT CSV | 本記事 全 dataset |
| 2 (1 次成果) | 等高線 (1m 等高線) | DXF polyline | 本記事 全 dataset |
| 2 (1 次成果) | オルソ画像 (空中写真) | TIFF + TFW | 本記事 全 dataset |
| 3 (派生ラスタ) | 標高ラスタ (補間平滑化済) | GeoTIFF | L40 標高図 |
| 3 (派生ラスタ) | 樹高ラスタ (DCHM = DSM-DTM) | GeoTIFF | L36 樹高図 |
| 3 (派生ラスタ) | 傾斜ラスタ (DEM の偏微分) | GeoTIFF | L39 傾斜図 |
| 3 (派生ラスタ) | CS立体図 (谷尾根強調) | GeoTIFF | L38 CS 立体図 |
| 3 (派生ラスタ) | 点群密度ラスタ | GeoTIFF | L37 点群密度図 |
| 4 (応用ベクタ) | 樹種ポリゴン / 単木 / 林分メッシュ | GeoPackage | L41 森林資源 |
本記事は段階 1 (原料層) と段階 2 (1 次成果)。L36-L40 は段階 3 (派生ラスタ)。L41 は段階 4 (応用ベクタ)。 4 段の派生階層を 1 つの LiDAR 計測から生成する点で、広島県の砂防 GIS 整備は整然とした垂直統合を達成している。
ds1527 で初登場した LAS 点群 (64 件) は、3 dataset 全体で5%の分量にすぎない。 しかしこれは「派生プロダクトだけ公開 → raw 点群も公開」という哲学転換の小さな第一歩である。 理由:
この方針が ds1527 以降の vintage で全面化すれば、広島県は全国でも先進的な LiDAR オープンデータ拠点になる。
本記事は「カタログメタデータだけで研究できる」例を示している。 1200 resource を実 DL せず, タイトル文字列と 23 件の小さな XML だけで、 広島県の航空レーザ測量整備史を量的に再構成した。 この手法は他の DoBoX シリーズ (例: 都市計画区域情報, 観測情報, 河川浸水想定) にも応用可能。 「データを読む前にメタデータを読め」。
新仮説 Y: 今後 ds1527 以降の vintage では、ds65/1434 の旧 vintage に対しても LAS 点群が遡及公開される。なぜなら、現状の ds65/1434 の DEM TXT はtxt2las で LAS 化可能 (= ds1527 のサンプル LAS が「txt2las (version 210418)」生成と書かれているのが証拠) なので、 広島県は技術的に簡単に LAS 化できるはず。
課題 Z: 1 年後の DoBoX 再スキャンで、ds65/1434 の resource 数が
大きく増えていないか確認 (新 LAS が追加されているか)。本記事の fetch_dataset_resources()
を再実行して 1200 → 1500+ になっているかチェック。
03nf, 03od, 03oe, 03ng 等の 3 種類新仮説 Y: 各 prefix は国土地理院 1/25000 地形図索引の 1 地区に対応する。 広島県全域 (8479 km²) は ~30 地区でカバーされる。本データの prefix 数 (3) は 広島県の主要部分を覆っているが、瀬戸内海島嶼や西部の一部 prefix は欠けている可能性。
課題 Z: 国土地理院の地形図索引 (1/25000 索引図) と本記事の prefix 一覧を突き合わせ、 広島県内の欠損 prefix (= 未測量地区) を特定する。 具体的には L15 (行政区域 Shapefile) と本データの prefix から推定される bounding box を重ね、空白地帯を地図化する。
新仮説 Y: ds1434 で 2018 年計測が遅れて公開されたのは、 「2018 年豪雨災害 (西日本豪雨)」の被災区域 (芦田川圏域) の計測データを優先的に再点検 していた可能性がある。 5 年遅れの公開は通常異例。
課題 Z: ds1434 業務 #1 (rid=93809, 芦田川圏域) のメタデータ XML 全文を読み、
processing や quality 要素に災害再点検の痕跡があるか確認。
また DoBoX の関連シリーズ「水害リスクマップ」「多段階の浸水想定図」(L08 等) との
公開タイミングを照合する。
新仮説 Y: 1 業務 ~ 18 図郭 × 0.85 km² = ~ 16 km² の範囲を担当。 広島県 8479 km² ÷ 23 業務 = 369 km²/業務。これは仮説計算と ~3 倍ずれがある。 原因: (a) 業務間の重複, (b) 図郭サイズが地区により異なる, (c) 業務に未公開図郭 (シェアード) が含まれる。
課題 Z: メタデータ XML の geographicBoundingBox 要素から各業務の bbox を抽出し、
緯度経度面積を計算して業務別カバレッジ km²を確定。さらに L15 行政区域と空間結合して
業務 × 市町クロスを作る。これにより「どの市町に何 vintage の計測があるか」が市町別に明らかになる。
新仮説 Y: 計測戦略の変化は「災害対応 (流域単位) → 都市計画連携 (市町単位)」の 行政方針シフトを反映する。具体的には 2018 年豪雨後に「市町別 BCP・流域治水計画」が法定化され、 これに合わせて計測単位も市町別に変わったのではないか。
課題 Z: 国交省「流域治水プロジェクト」(2020-) の市町別整備計画文書と、 本データ ds1434/1527 の業務名 (市町記載) を突き合わせ、 計画単位の符合を確認する。さらに L13 (都市計画基礎調査) との時系列同期をチェック。
新仮説 Y: 1 業務 = メタ XML 1 + 各図郭 4-5 プロダクト × 10-15 図郭 ≈ 50 resource。 すなわち1 業務 = 「1 メタデータ + 図郭一式」のパッケージ単位。これを Python の dict で 明示的にモデル化すれば、業務単位の「データパッケージ」として再構成可能。
課題 Z: itertools.groupby またはnetworkx で
「業務 → 図郭 → プロダクト」の 2 段階ツリーを構築し、
資料一式を業務単位の zip ファイルに自動再パッケージするスクリプトを書く。
これにより「業務 #5 のフルセットを 1 操作でDL」が可能になる。