オープンデータの探し方&使い方ガイド

攻略法

オープンデータの探し方&使い方ガイド

DDASH Hacksの運営協力をしているCraftStadiumの山本です。
本記事では、DDASH Hacksに臨むにあたって役立つ情報を共有します。
なお、本内容は教員や審査員による公式な見解、または監修を受けたものではありません。

この記事の3行まとめ

  • 日本には無料で使えるオープンデータが数万件以上あり、ハッカソンの材料は実はすぐ手に入ります
  • 京都市だけで672データセット、さらに3D都市モデル(PLATEAU)やリアルタイム天気APIなど強力なデータソースが揃っています
  • テーマ別に「このデータ+このデータ」の組み合わせパターンを紹介するので、Day1のアイデア出しですぐ使えます

この記事のゴール

Before: 「オープンデータって何?どこにあるの?」「e-Statって聞いたことあるけど、実際にどうやって使うの?」

After: 使いたいデータの入手先が分かっていて、CSV/JSONでダウンロードor APIで取得する準備ができている状態

具体的には、以下を読了後に達成できます:

ステップできるようになること所要時間
1. オープンデータとはデータ活用の全体像を理解する5分
2. 国のデータポータルe-Stat、e-Govなどから統計データを見つける15分
3. 京都・関西のデータ同志社大学周辺で使えるローカルデータを把握する10分
4. APIでリアルタイムデータ天気、地図、交通などの動的データを取得する15分
5. テーマ別おすすめ組み合わせアイデア出しに直結するデータの掛け合わせを知る10分
6. 事前にやっておくこと当日すぐ使えるように準備する5分
合計約1時間

📌 この記事は「読むだけ」でOKです。 コードを書く必要はありません。Pythonでデータを読み込む方法は「Google Colab + pandasデータ分析入門 (外部リンク)」で詳しく解説しています。

1. オープンデータとは(5分で理解)

一言でいうと

「誰でも無料で自由に使える、公開されたデータ」 のことです。

国や自治体、公共機関が「社会のために使ってほしい」と考えて公開しているデータで、DDASH Hacksではこれらのデータを活用してサービスを作ります。

オープンデータの具体例

  • 人口統計: 都道府県・市区町村ごとの人口、年齢構成、世帯数
  • 経済データ: 産業別売上、雇用統計、地価
  • 施設情報: 病院、学校、AED、避難所、保育園の位置データ
  • 交通データ: バス路線、鉄道時刻表、交通量
  • 気象データ: 天気予報、気温、降水量
  • 地理データ: 地図、標高、土地利用、3D都市モデル

データの形式

ハッカソンでよく使うデータ形式は主に3つです:

形式特徴開き方
CSV表形式のデータ。最もよく使うExcel、Googleスプレッドシート、pandas
JSONAPIから返ってくるデータに多いPython、JavaScript
GeoJSON地図上の位置情報付きデータ地図ライブラリ(Leaflet、Plotly等)

💡 ポイント: 「どの形式がいいか」は気にしなくてOKです。ほとんどのオープンデータはCSVでダウンロードできるので、ExcelやGoogleスプレッドシートで開いて中身を確認できます。

2. 国のデータポータル4選+練習用データ(15分)

日本政府が運営する主要なオープンデータポータルを紹介します。すべて**無料・登録不要(一部APIは登録あり)**で使えます。

① e-Stat(イースタット)— 政府統計のポータルサイト

🔗 https://www.e-stat.go.jp/

一言でいうと: 国の統計データが700以上の調査から検索・ダウンロードできる「統計の巨大倉庫」

特徴:

  • 国勢調査、経済センサス、家計調査など700以上の政府統計を横断検索できる
  • CSVダウンロードに加え、**API(ver 3.0)**でプログラムからデータ取得が可能
  • 地域別・年次別にデータを絞り込める「データベース」機能が便利

ハッカソンでの使いどころ:

  • 「京都府の年齢別人口推移」「全国の産業別従業者数」など、マクロなデータを入手したいとき
  • 他のデータ(施設情報、気象データなど)と組み合わせて分析の「土台」にする

使い方:

  1. トップページの検索窓にキーワードを入力(例:「京都府 人口」)
  2. 結果から欲しいデータを選ぶ
  3. 「CSV」「Excel」などの形式でダウンロード

💡 Tips: e-StatのAPIを使うには「アプリケーションID」の取得(無料登録)が必要です。ハッカソン前に取得しておくとスムーズです。APIを使えば、1回のリクエストで最大100,000レコードを取得できます。

② e-Govデータポータル(旧DATA.GO.JP)— 行政データの総合カタログ

🔗 https://data.e-gov.go.jp/

一言でいうと: 各省庁が公開しているオープンデータを約2万件(2025年2月時点で19,420件)まとめて検索できるカタログサイト

特徴:

  • 「防災」「教育」「環境」など13カテゴリで整理されている
  • PDFの全文検索にも対応(政策文書の中からもデータを見つけられる)
  • CKANベースで国際標準のオープンデータ基盤

ハッカソンでの使いどころ:

  • 特定テーマに関する行政データをまとめて探したいとき
  • 「こういうデータないかな?」と幅広く検索したいとき

③ 国土数値情報ダウンロードサービス — 地理空間データの宝庫

🔗 https://nlftp.mlit.go.jp/ksj/

一言でいうと: 日本全国の地理データ(施設位置、行政区域、災害リスクなど)がダウンロードできる

特徴:

  • GIS形式(Shapefile、GML、GeoJSON)で地図上に表示できるデータが豊富
  • 登録不要でダウンロード可能
  • 2025年には都市計画決定情報、浸水想定区域データなどが新規追加

ハッカソンでの使いどころ:

  • 避難所の位置情報、学校・病院の分布、土地利用など地図に載せるデータが欲しいとき
  • 防災テーマで浸水想定区域や土砂災害危険箇所のデータを使いたいとき

④ RESAS(リーサス)— 地域経済分析システム

🔗 https://resas.go.jp/

一言でいうと: 人口動態、産業構造、観光客の動きなどをビジュアルで分析できる地域経済のダッシュボード

⚠️ 重要な変更(2025年3月): RESASは2025年3月にリニューアルされ、Web上でのデータ可視化はこれまで通り使えますが、APIの提供は終了しました。プログラムからデータを自動取得したい場合は、e-Stat APIや国土交通データプラットフォーム(GraphQL API)を代替として利用してください。

ハッカソンでの使いどころ:

  • Web画面上でグラフやマップを見て、地域課題を発見するリサーチツールとして活用
  • スクリーンショットで傾向を把握し、詳細データはe-Statから取得する二段構え

⑤ SSDSE(教育用標準データセット)— 練習・プロトタイプに最適

🔗 https://www.nstac.go.jp/use/literacy/ssdse/

一言でいうと: 統計データの教育用に整備された「すぐ使えるCSVデータ集」。データのクリーニングが不要なので、分析の練習やプロトタイプの素材として最適です。

主なデータセット:

  • SSDSE-A(都道府県別データ): 人口、経済、教育、医療など100項目以上 × 47都道府県
  • SSDSE-B(市区町村別データ): より細かい地域単位のデータ
  • SSDSE-E(地域別データ): 都道府県×項目のコンパクト版

ハッカソンでの使いどころ:

国データポータルの選び方まとめ

こんなとき使うポータル
人口、経済、産業の統計データが欲しいe-Stat
行政データをカテゴリで広く探したいe-Govデータポータル
地図上に表示できるGISデータが欲しい国土数値情報
地域の経済・人口動態をビジュアルで見たいRESAS(Web画面のみ)
練習用のクリーン済みデータが欲しいSSDSE

3. 京都・関西のローカルデータ(10分)

DDASH HacksはDoshisha(同志社)大学のハッカソンです。京都に関連したデータを使うと、課題設定がリアルになり審査員にも伝わりやすくなります。

① 京都市オープンデータポータル — 672データセットの宝庫

🔗 https://data.city.kyoto.lg.jp/

データ数: 672データセット(2025年2月時点)

カテゴリ別の内訳:

カテゴリデータ数具体例
観光123神社仏閣リスト、観光客数統計、文化財情報
文化12石碑データ、伝統産業情報
防災7避難所一覧、ハザードマップ
子育て26保育施設一覧、子育て支援施設
環境51大気質、ゴミ収集情報
行政453予算、施設情報、統計データ

人気ダウンロードデータ:

  • 固定資産税路線価(GIS付き)— 地図上に地価を表示できる
  • 地下鉄の運賃・距離データ — 交通系サービスに活用
  • AED設置場所一覧 — 防災・ヘルスケア系に必須
  • 民泊施設一覧 — 観光・まちづくりテーマに

💡 ポイント: 京都市のデータはCSV形式が多く、そのままpandasで読み込めます。ライセンスはCC BY(出典を明記すれば自由に使える)なので、ハッカソンでの利用もOKです。

② PLATEAU(プラトー)京都市 — 3D都市モデル

🔗 https://www.geospatial.jp/ckan/dataset/plateau-26100-kyoto-shi-2024

一言でいうと: 京都市全域の建物・道路を3Dモデル化したデータ。国土交通省主導のプロジェクトです。

京都市のPLATEAUデータ(2024年度版)の特徴:

  • 建物: LOD0〜LOD3.3(建物の外形から窓・屋根の形状まで)
  • 道路: LOD3.4(車道・歩道・中央分離帯まで区別)
  • 災害リスク: 洪水浸水想定区域、土砂災害警戒区域のレイヤーが統合

📌 同志社大学周辺(上京区・今出川エリア)もLOD2〜3.3で完全にカバーされています!

ハッカソンでの使いどころ:

  • 防災テーマ:建物の浸水リスク可視化
  • 観光テーマ:3Dマップ上での寺社巡りルート提案
  • まちづくりテーマ:建物の高さ・密度分析

ライセンス: CC BY 4.0(商用利用可)

💡 Tips: PLATEAUは2025年度末までに全国約300都市をカバー予定で、他の都市のデータも同じ形式で入手できます。CityGML形式が基本ですが、3D Tiles形式やFBX形式も提供されており、WebブラウザやUnityでの表示にも対応しています。

③ 京都市統計ポータル

🔗 https://www2.city.kyoto.lg.jp/sogo/toukei/

  • 区別・学区別の月次人口推計
  • 町丁目別の世帯数・人口

地域ごとの細かい人口データが必要なときに使います。京都市オープンデータと組み合わせると、「この地域は高齢化が進んでいるのに医療施設が少ない」のような分析ができます。

④ 大阪・関西エリアのデータ

京都以外の関西データも組み合わせると、比較分析ができて面白くなります。

大阪市ODPO(大阪府域オープンデータポータル)

  • 大阪府内41市町村のオープンデータを横断検索できる
  • 万博2025関連のデータも順次公開されています(来場者統計など)

神戸市オープンデータ

  • 134データセット、SPARQLエンドポイント対応
  • 阪神・淡路大震災デジタルアーカイブ(防災テーマに強力)
  • 「神戸データラボ」Tableauベースの可視化プラットフォーム(2022年大臣賞受賞)

4. APIでリアルタイムデータを取得する(15分)

CSVのダウンロードだけでなく、APIを使うとリアルタイムのデータを取得できます。APIはプログラムからデータを自動で取りに行く仕組みです。

① 気象庁JSON API — 天気予報が登録なしで取得できる

DDASH Hacksイチオシ! 登録もAPIキーも不要で、今すぐ使えます。

エンドポイント例(京都府の天気予報):

https://www.jma.go.jp/bosai/forecast/data/forecast/260000.json

ブラウザでこのURLを開くと、京都府の天気予報がJSON形式で表示されます。

取得できるデータ:

  • 今日〜週間の天気予報
  • 気温(最高・最低)
  • 降水確率
  • 注意報・警報

主な府県コード(関西):

地域コード
京都府260000
大阪府270000
兵庫県280000
滋賀県250000
奈良県290000

⚠️ 注意点: これは気象庁の非公式API(仕様の保証なし)です。高頻度のアクセスは避け、@st.cache_data(ttl=3600) などでキャッシュして使いましょう。「Streamlit 3時間デプロイガイド (外部リンク)」でも具体的な実装例を紹介しています。

② 不動産情報ライブラリAPI — 防災データの新定番(2025年11月〜)

🔗 https://www.reinfolib.mlit.go.jp/

2025年11月に5つの災害関連APIが新規追加されました:

APIの種類内容
洪水浸水想定区域河川の氾濫による浸水範囲と深さ
土砂災害警戒区域土砂災害のリスク区域
津波浸水想定津波による浸水範囲
高潮浸水想定区域高潮による浸水範囲
指定緊急避難場所災害時の避難所情報

出力形式: JSON / GeoJSON / ベクトルタイル

ハッカソンでの使いどころ:

  • 防災×不動産の「リスク可視化マップ」
  • 避難所×人口データの「避難計画シミュレーション」

利用方法: 無料ですがAPIキーの取得(ユーザー登録)が必要です。月間約400万リクエストの実績があり、安定したサービスです。

③ xROAD(クロスロード)— リアルタイム交通データ(2025年5月〜)

🔗 https://www.jartic-open-traffic.org/

2025年5月に公開された、道路交通のリアルタイムデータプラットフォームです。

取得できるデータ:

  • リアルタイム交通量: 全国2,600箇所の交通量(30分遅延)
  • ETC2.0旅行速度: 全国約20万kmの区間平均速度(月次更新)

ハッカソンでの使いどころ:

  • 渋滞予測サービス
  • 交通×天気のマッシュアップ分析
  • 通学路の安全性分析

④ Google Maps Platform — 地図APIの定番

⚠️ 2025年3月の重要な料金改定:

以前は月200ドル(約3万円)の無料クレジットがありましたが、2025年3月に料金体系が刷新されました。

新料金体系(2025年3月〜):

SKUランク月間無料コール数
Essentials10,000回/月
Pro5,000回/月
Enterprise1,000回/月

ハッカソンでの注意点:

  • クレジットカードの登録が必要(課金が発生する可能性あり)
  • ハッカソンの規模であればEssentials枠(10,000回/月)で十分収まることが多い
  • 代替案: Leaflet + OpenStreetMap(完全無料)を使えば、地図表示はカード登録なしで実現できます

💡 おすすめ: ハッカソンではまず**Leaflet + OpenStreetMap(無料)**で地図を作り、Google Mapsの機能がどうしても必要な場合のみGoogle Maps Platformを検討しましょう。

⑤ ODPT(公共交通オープンデータセンター)— 電車・バスのデータ

🔗 https://www.odpt.org/

329データセット、152組織のデータが利用可能です。

関西で使えるデータ:

  • 京都市営バスのGTFSデータ(路線・時刻表・停留所位置)

⚠️ 注意: 阪急、阪神、JR西日本の列車位置情報はODPTでは直接提供されていません。関西の鉄道データは限定的なので、時刻表系のデータはNavitime APIやGoogle Directions APIなどの民間サービスを検討してください。

API一覧:ハッカソンで使えるかチェック表

API名無料登録関西対応おすすめ度
気象庁JSON API✅ 完全無料不要⭐⭐⭐
e-Stat API 3.0✅ 完全無料要(ID取得)⭐⭐⭐
不動産情報ライブラリAPI✅ 完全無料要(キー取得)⭐⭐⭐
xROAD交通API✅ 完全無料確認中⭐⭐
ODPT公共交通✅ 完全無料要(キー取得)△ 限定的
Google Maps Platform△ 10,000回/月無料要(カード必要)⭐⭐
X(Twitter)API❌ 読取は有料

⚠️ X(Twitter)APIについて: 無料プランは書き込みのみで、ツイートの読み取り(検索)にはBasicプラン(月額200ドル)が必要です。ハッカソンでのSNS分析には向いていないので、他のデータソースを使いましょう。

5. テーマ別おすすめデータ組み合わせ(10分)

ハッカソンで高評価を得るコツは**「複数のデータを組み合わせること」**です。1つのデータだけでなく、2〜3のデータを掛け合わせると、独自性のある分析ができます。

🔥 防災テーマ

組み合わせ例: ハザードマップ × 避難所 × AED × 天気

データ入手先
洪水浸水想定区域不動産情報ライブラリAPI / 国土数値情報
避難所一覧京都市オープンデータ / 不動産情報ライブラリAPI
AED設置場所京都市オープンデータ
リアルタイム天気気象庁JSON API
人口分布e-Stat(国勢調査)

サービスのアイデア例:

  • 「自宅からの最適避難ルート提案アプリ」
  • 「大雨時のリアルタイム浸水リスクダッシュボード」

💡 受賞事例: PLATEAU × 防災のプロジェクトは直近のハッカソンで多数受賞しています。2024年の東京都知事杯では「リアルタイム高解像度熱中症リスクダッシュボード」が最優秀賞、2025年にはゲーミフィケーション×防災の「リアル被災シミュレーションゲーム」がサービスデザイン賞を受賞しました。

🏯 観光テーマ

組み合わせ例: 文化財 × 交通 × 宿泊 × 地図

データ入手先
神社仏閣・文化財リスト京都市オープンデータ
バス路線・時刻表ODPT(京都市営バスGTFS)
民泊施設一覧京都市オープンデータ
地図表示Leaflet + OpenStreetMap(無料)

サービスのアイデア例:

  • 「混雑を避けた穴場観光ルート提案」
  • 「外国人観光客向け 文化財×交通ナビ」

💡 京都ならではの事例: 京都市の石碑データ(1,400件以上)を使った「いしぶみアプリ」は、歴史的な石碑の検索・ルート案内を実現しています。ユニークなデータの活用は審査員の目を引きます。

🚗 交通テーマ

組み合わせ例: 交通量 × 天気 × 人口

データ入手先
リアルタイム交通量xROAD
天気予報気象庁JSON API
道路ネットワーク国土数値情報
人口分布e-Stat

サービスのアイデア例:

  • 「通学路の安全性スコアリングシステム」
  • 「天候×交通量の相関分析ダッシュボード」

👶 子育てテーマ

組み合わせ例: 保育施設 × 地図 × 人口

データ入手先
保育施設一覧京都市オープンデータ
子育て支援施設京都市オープンデータ
年齢別人口(0-5歳)e-Stat / 京都市統計ポータル
地図表示Leaflet + OpenStreetMap

サービスのアイデア例:

  • 「保育施設の空き状況×自宅からの距離マッチングアプリ」
  • 「子育てしやすい地域スコアリング」

🤖 AI・自然言語処理テーマ

日本語のデータセットやモデルを使いたい場合:

Hugging Face (外部リンク) には1,860以上の日本語データセットと10,749以上の日本語モデルが公開されています。

# Hugging Faceからデータセットを1行で取得
from datasets import load_dataset
dataset = load_dataset("llm-jp/oasst2-chat-and-instructions-ja")

💡 Tips: 大規模なAIモデルのファインチューニングはハッカソンの時間内では難しいですが、既存のモデルをAPIとして使うのは十分可能です。テキスト分析(感情分析、要約、分類)にはHugging FaceのInference APIが無料で使えます。

データ組み合わせのコツ

「緯度・経度」を共通キーにするのが最強のパターンです。

例えば:

  • 施設データ(位置情報付き) + 人口データ(地区別) + 地価データ(地点別)

これらを「緯度・経度」で結合すると、1つの地図上に「施設分布 × 人口密度 × 地価」を重ねて表示できます。Plotlyのscatter_mapboxやLeafletのヒートマップで可視化すると、審査員に強いインパクトを与えられます。

6. 事前にやっておくこと(チェックリスト)

ハッカソン当日にデータ探しで時間を使わないために、以下を事前に済ませておきましょう。

必須(全員)

  • [ ] 京都市オープンデータポータルを開いて、どんなデータがあるか一覧を見ておく
  • [ ] e-Statでキーワード検索を1回試してみる(例:「京都府 人口」)
  • [ ] 気象庁JSON APIのURL(https://www.jma.go.jp/bosai/forecast/data/forecast/260000.json)をブラウザで開いて、JSONデータが返ってくることを確認する
  • [ ] チームで「どのテーマでいくか」を仮決めし、セクション5の組み合わせ表を参考にする

やっておくとベター(Python使う人)

  • [ ] e-Stat APIのアプリケーションIDを取得しておく(https://www.e-stat.go.jp/api/)
  • [ ] 不動産情報ライブラリのAPIキーを取得しておく
  • [ ] CSVをpandasで読み込むテストをしておく(「Google Colab + pandasデータ分析入門 (外部リンク)」参照)
  • [ ] 使いたいデータのCSVを1つダウンロードして、カラム名を確認しておく

やっておくとベター(ノーコード派の人)

📌 重要: DDASH Hacksの審査基準では**「技術的な高度さ」よりも「課題発見力」「解決策の独自性」「実用性」**が重視されます。ノーコードでも、データの組み合わせ方や課題設定が優れていれば十分に高評価を得られます。

まとめ:この記事で学んだこと

セクション学んだこと所要時間
1. オープンデータとはデータの種類と形式5分
2. 国のデータポータルe-Stat、e-Gov、国土数値情報、RESAS、SSDSE15分
3. 京都・関西のデータ京都市672データセット、PLATEAU 3D、統計ポータル10分
4. APIでリアルタイムデータ気象庁、不動産ライブラリ、xROAD、Google Maps15分
5. テーマ別組み合わせ防災・観光・交通・子育て・AIの具体パターン10分
6. 事前チェックリスト当日までにやっておくこと5分
合計約1時間

主要データソース早見表

データソースURL形式登録イチオシ用途
e-State-stat.go.jpCSV/API要(APIのみ)統計データ全般
e-Govデータポータルdata.e-gov.go.jp各種不要行政データの検索
国土数値情報nlftp.mlit.go.jp/ksj/GeoJSON等不要地図用GISデータ
RESASresas.go.jpWeb画面のみ不要地域分析のリサーチ
SSDSEnstac.go.jp/use/literacy/ssdse/CSV不要練習・プロトタイプ
京都市オープンデータdata.city.kyoto.lg.jpCSV不要京都のローカルデータ
PLATEAU京都geospatial.jpCityGML等不要3D都市モデル
気象庁JSON APIjma.go.jp/bosai/JSON不要天気予報
不動産情報ライブラリreinfolib.mlit.go.jpJSON/GeoJSON防災×不動産
xROADjartic-open-traffic.orgAPI確認中リアルタイム交通
Hugging Facehuggingface.co各種アカウントAI/NLPデータ

次に読む記事

既存記事(今すぐ読める)

Shin Yamamoto

関連する記事 - 攻略法