見出し画像

リアルタイムでライセンスフリーなRedshift? Apache Doris

ますますリアルタイムなデータ処理が求められるビジネス要件に、Apache Dorisで立ち向かいましょう。


Apache Dorisとは?

大規模並列処理(MPP)アーキテクチャを採用したOSSのデータウェアハウスです。
分かる人向けにいうと、Amazon RedshiftのOSS版といった立ち位置ですね。

メリットは?

  • リアルタイムとバッチ処理の両方を一手に担える

  • データの増大に応じた拡張性が高い

  • SQLが使えるのでユーザーに優しい

  • OSSなのでライセンス料がいらない

利用例は?

  • リアルタイムに意思決定を行うためのダッシュボード

  • リアルタイムのシステムログ監視・異常検知

  • リアルタイムでユーザーの行動を把握してカスタマーインサイト強化

  • リアルタイムで金融取引の不正を検知

  • IoTからのセンサー情報を素早く処理して品質監視 など

他製品と何が違う?

Apache Spark

Sparkは単なる処理エンジンであり、データベース機能はHDFSなど別途用意する必要があります。
またSparkは真の意味でリアルタイム処理はできません。

Amazon Redshift

Apache Dorisと最も近いのがAmazon Redshiftでしょう。
Dorisの方がややリアルタイムに近い処理を行えることや、OSSなどでライセンス料がかからないという違いがあります。
ただしRedshiftはフルマネージドサービスで管理がいらないのが最大のメリットです。
各自の要件だったり既にAWSを利用しているなどの事情を考慮して選ぶとよいでしょう。

参考

https://medium.com/@siladityaghosh/apache-doris-unlocking-real-time-analytics-for-the-data-driven-enterprise-4da306cd0775

この記事が参加している募集

仕事のコツ

with 日本経済新聞

よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!