リアルタイムでライセンスフリーなRedshift? Apache Doris
ますますリアルタイムなデータ処理が求められるビジネス要件に、Apache Dorisで立ち向かいましょう。
Apache Dorisとは?
大規模並列処理(MPP)アーキテクチャを採用したOSSのデータウェアハウスです。
分かる人向けにいうと、Amazon RedshiftのOSS版といった立ち位置ですね。
メリットは?
リアルタイムとバッチ処理の両方を一手に担える
データの増大に応じた拡張性が高い
SQLが使えるのでユーザーに優しい
OSSなのでライセンス料がいらない
利用例は?
リアルタイムに意思決定を行うためのダッシュボード
リアルタイムのシステムログ監視・異常検知
リアルタイムでユーザーの行動を把握してカスタマーインサイト強化
リアルタイムで金融取引の不正を検知
IoTからのセンサー情報を素早く処理して品質監視 など
他製品と何が違う?
Apache Spark
Sparkは単なる処理エンジンであり、データベース機能はHDFSなど別途用意する必要があります。
またSparkは真の意味でリアルタイム処理はできません。
Amazon Redshift
Apache Dorisと最も近いのがAmazon Redshiftでしょう。
Dorisの方がややリアルタイムに近い処理を行えることや、OSSなどでライセンス料がかからないという違いがあります。
ただしRedshiftはフルマネージドサービスで管理がいらないのが最大のメリットです。
各自の要件だったり既にAWSを利用しているなどの事情を考慮して選ぶとよいでしょう。
参考
よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!