見出し画像

【第10話】Databricks_ノートブック内での多言語使用法

Databricks Certified Data Engineer Associate試験に向けて、今回はノートブック内での多言語使用法に焦点を当て、架空のキャラクターたちがリラックスした雰囲気の中でこのトピックを語り合います。さあ、楽しみながら学んでいきましょう!

のびデータ:「えっと、ノートブックって何言語も使えるって聞いたことあるけど、それってどういうことなんだろう?」

ジョブアン:「そうだね、DatabricksのノートブックではPythonやScala、SQLなど、いくつかの言語を同じノートブック内で使うことができるんだぜ。」

スキーマオ:「ぼくなんかさ、これめっちゃ便利だと思うなぁ。だって、データの前処理はPythonでやって、集計はSQLでやって、最終的なデータの分析はScalaでやるとか、そんな風に一つのノートブックで全部完結できるんだから。」

のびデータ:「それはすごいな!でも、どうやって言語を切り替えるの?」

ジョブアン:「あ、それは簡単だぜ。ノートブックのセルの最初に「%」をつけて、その後に使いたい言語の名前を書くんだ。例えば「%python」って書けば、そのセルではPythonを使うことができるようになる。」

スキーマオ:「うちのパパ、えらいんだぞ。でもこれ、知らないと思うぞ。」

のびデータ:「ほうほう、それならいろんな言語を使い分けられそうだね!」

ジョブアン:「そうそう、データの加工とか分析の効率がめちゃくちゃ上がるんだぜ。」

スキーマオ:「悪いなのびデータ、このクエリ3人までしか実行できないんだよ。」

のびデータ:「またスキーマオにバカにされた~!でも、これは本当に役立ちそうだな。」

イメージをつきやすくすることを優先し、一部正確ではない表現があることをご了承ください。試験に役立つことを願っています。

<補足> Databricks ノートブックは、多言語使用をサポートしており、ユーザーは同じノートブック内で異なるプログラミング言語を使用することができます。言語を切り替えるには、セルの最初に「%」記号と言語の名前を指定します。例えば、Python を使用するには「%python」、SQL を使用するには「%sql」と書きます。これにより、データの前処理、分析、可視化などを柔軟に行うことが可能です。ただし、異なる言語間で変数を共有するためには、適切な方法で変数を定義し、参照する必要がありますので注意が必要です。公式のDatabricksドキュメントでは、この多言語使用に関する詳細なガイドと例が提供されており、試験対策としても役立つでしょう。

いいなと思ったら応援しよう!