見出し画像

[SQL環境] DuckDB と Google Colab を使った爆速SQL練習ガイド

なぜ Google Colab を使うのか

  • 無料で使える: Google Colab は無料で利用可能です。

  • どこでも使える: インターネット接続さえあれば、どこでもアクセスできます。

  • 分析環境が整っている: Python 環境であり、Jupyter や SageMaker のような分析環境としても使用できます。

  • DuckDB がすぐ使える: DuckDB を簡単に導入して使用できます。

Google Colab は他のサービスに比べて便利で、コピペもしやすく、迅速に操作できます。ここでは、これまでの演習データを使用してどのように SQL の練習を行うかを紹介します。

DuckDB ファイルを Google Colab で使用する方法

  1. Google Colab を開く: Google Colab のページを開きます。

  2. 以下のコードをコピペして実行する: 以下のコードを新しいコードセルに貼り付けて実行してください。

import duckdb
import requests

# GitHub リポジトリから DuckDB ファイルをダウンロード
url = 'https://raw.githubusercontent.com/otwn/SQL-Practice/main/tech_interviews.duckdb'
local_path = '/content/interviews.duckdb'

response = requests.get(url)

if response.status_code == 200:
    with open(local_path, 'wb') as file:
        file.write(response.content)
    print(f'File downloaded successfully and saved as {local_path}')
else:
    print(f'Failed to download the file. Status code: {response.status_code}')

# DuckDB ファイルに接続してテーブルを表示
con = duckdb.connect("/content/interviews.duckdb")
con.sql("SHOW TABLES;")

結果の確認

SHOW TABLES; という SQL コマンドを実行すると、以下のようなテーブルのリストが表示されるはずです。

┌─────────────────────────────────┐
│              name               │
│             varchar             │
├─────────────────────────────────┤
│ L_emp_projects                  │
│ L_employees                     │
│ L_projects                      │
│ a_customers                     │
│ a_guests                        │
│ a_hosts                         │
│ a_orders                        │
│ a_reviews                       │
│ a_search_details                │
│ a_transactions                  │
│   ·                             │
│   ·                             │
│   ·                             │
│ orders                          │
│ postmates_markets               │
│ postmates_orders                │
│ s_employee                      │
│ sf_restaurant_health_violations │
│ winemag_p1                      │
│ winemag_p2                      │
│ y_business                      │
│ y_reviews                       │
│ z_transactions                  │
├─────────────────────────────────┤
│       50 rows (20 shown)        │
└─────────────────────────────────┘

SQL 文の実行

これで con.sql() の括弧内に SQL 文を記述することで、SQL の実行とテストが可能になります。

# 例: テーブル 'y_business' からデータを取得
con.sql("SELECT * FROM y_business;")

このようにして、Google Colab 上で SQL の練習を行い、テストを実施することができます。


これで、Google Colab を使ってどこでも簡単に DuckDB を使った SQL の練習ができるようになります。

ここから先は

0字
1度限りなのでマガジンで購入される方が断然お得です

Google BigQueryなどSQLを使う場はこれまでもそしてこれからも存在します。このマガジンでは、アメリカのデータエンジニアやデー…

この記事が気に入ったらサポートをしてみませんか?