![見出し画像](https://assets.st-note.com/production/uploads/images/87102872/rectangle_large_type_2_ceb25b990c366d9a09851092301454ce.jpeg?width=1200)
PySpark 気象分析
Apache Spark は、ビッグ データの処理と分析のための一般的な分散コンピューティング フレームワークです。このチュートリアルでは、Spark の Python 固有のインターフェイスである PySpark を実際に使用します。前のチュートリアルで得た概念的な知識に基づいて構築しました: Apache Spark を使用したビッグデータ分析の紹介。このチュートリアルでは、Apache Spark とその分散アーキテクチャの背後にある基本的な概念について学びました。
PySpark ライブラリは、機械学習用の Apache Spark API や、SQL、DataFrame、ストリーミング、Spark Core、MLlib などのその他のクールな機能へのアクセスを提供します。これらの機能のいくつかは、チューリッヒの測候所によって収集された履歴データセットを準備および分析するのに役立ちます。ローカル コンピューティング環境でデータを変換およびクエリするための重要な PySpark 関数の概要を理解できます。
ここから先は
813字
/
2画像
¥ 10,000
この記事が気に入ったらサポートをしてみませんか?