2022年のデータとアナリティクスのトレンドトップ6
The surprising health care security vulnerabilities that need shoring up (venturebeat.com)
2021年12月22日 午後1時20分
今年2022年1月12日に開催される「Future of Work Summit」では、CIOやCTOなどのCレベルや上級幹部から、データやAIの戦略について話を聞くことができます。詳細はこちら
この記事は、KompriseのCEOであり、共同設立者であるKumar Goswamiが寄稿しました。
何十年もの間、データを管理するということは、基本的にデータを収集し、保存し、時にはアクセスすることを意味していました。しかし近年では、企業のデータセンター、クラウド、エッジなど様々な場所で生成、アクセス、保存されている膨大な量のデータから、重要な情報を引き出すことが求められています。そのため、人工知能(AI)や機械学習などの最新技術を駆使したデータ分析は必須の能力となっており、2022年にはその重要性がさらに高まると考えられています。企業は、その多くが非構造化データであるデータを迅速に解析して、ビジネス上の意思決定に必要な情報を見つけ出す必要があります。また、それを実現するために、最新のデータ環境を構築する必要があります。
1.00
コーディング手法の革新がAIの導入を加速する方法 技術的意思決定者が知っておくべき5つのこと。
広告
広告をスキップする
以下は、2022年に前面に出てくるデータ管理のトレンドです。
データレイクはより整理されるが、非構造化データのギャップは依然として存在する
エンタープライズ・データ・アナリティクスには2つのアプローチがあります。1つ目は、CRMやERPなどのビジネスアプリケーションからデータを取り出し、データウェアハウスにインポートしてBIツールに供給する方法です。現在、これらのデータウェアハウスは、Snowflakeのようなテクノロジーによってクラウド化されています。このアプローチは、データが一貫したスキーマを持っているため、よく理解されています。
広告
2つ目のアプローチは、どんな生データでも、前処理を必要とせずにデータレイクに直接インポートする方法です。これは、どんな種類のデータでもデータ・レイクに取り込むことができるため魅力的であり、Amazon S3が巨大なデータ・レイクとなっている理由でもあります。困ったことに、一部のデータは他のデータよりも処理しやすい。例えば、ログファイル、ゲノミクスデータ、オーディオ、ビデオ、画像ファイルなどは、一貫した構造を持たないため、データウェアハウスにはうまく収まらず、データ間の検索が困難になります。そのため、データレイクはデータの沼地と化してしまい、必要なものを検索、抽出、分析することが困難になってしまいます。
現在の大きなトレンドであり、2022年に向けての継続的なデータトレンドは、DataBricksで人気を博したデータレイクハウスの出現であり、意味的な一貫性を持つ半構造化データでデータレイクを作成することです。例えば、Excelファイルはデータベースではないにもかかわらず、データベースのようなもので、データレイクハウスは半構造化データの一貫したスキーマを活用します。これは、.csvファイルやParquetファイルなどの半構造化データには有効ですが、非構造化データの問題にはまだ対処できません。非構造化データをデータ分析用に最適化するためには、非構造化データの共通構造をインデックス化して推論する方法が必要です。現在、世界のデータの少なくとも80%は非構造化データであるため、この非構造化データの分析への最適化は、大きなイノベーションの分野です。
シチズンサイエンスは、2022年のトレンドとして影響力を持つと思われます。
データサイエンスの民主化に向けて、クラウドプロバイダーは、機械学習アプリケーションや、ドメインに特化した機械学習ワークフローなどのビルディングブロックツールをより多く開発し、リリースしていくでしょう。これは重要なトレンドです。なぜなら、時間の経過とともに、個人がコーディングする必要のあるレベルが下がっていくからです。これらの市民科学者の中には、中央IT部門に所属する者もいれば、ビジネスラインに所属する者もいるでしょう。Amazon Sagemaker Canvasは、2022年に普及するであろうローコード/ノーコードツールの一例です。シチズンサイエンスはまだ始まったばかりですが、市場の方向性を示すものであり、2022年のデータトレンドになることは間違いありません。データプラットフォームやデータ管理ソリューションは、ユーザーがデータを検索、抽出、使用するための消費者のようなシンプルさを提供し、注目を集めるでしょう。
正しいデータ」分析がビッグデータ分析を凌駕し、2022年の重要なトレンドとなる
ビッグデータは大きすぎて、活用が難しいデータの沼地を作り出しています。どこで作られたかにかかわらず、適切なデータを正確に見つけ出し、データ分析のために取り込むことは、時間と手作業を大幅に削減しながら、より適切な分析を行うことができるため、画期的なことです。つまり、ビッグデータの代わりに、いわゆる「正しいデータ」の分析を開発することが新たなトレンドになるのです。
適切なデータアナリティクスが主流に
クラウドデータレイクは、さまざまな研究活動のためにデータを収集して処理する究極の場所になるだろうと予測する人もいます。クラウドデータレイクが普及することは間違いないが、データはエッジ、クラウド、オンプレミスのストレージなど、あらゆる場所に蓄積されている。そのため、場合によっては、データを中央に移動させるよりも、その場で処理して分析することが必要になります。エッジでデータを検索するだけでなく、クラウドに送信する前にローカルで多くのデータを処理するにはどうすればよいでしょうか。大規模で複雑なプロジェクトでは、クラウドベースの分析ツールを使うこともあるでしょう。また、データをクラウドに送るのではなく、データセンターのエッジで処理を行う「エッジクラウド」も増えてくるでしょう。
ストレージに依存しないデータ管理は、最新のデータファブリックの重要な構成要素となる。
データファブリックとは、データを可視化し、ハイブリッドストレージやクラウドリソース上でデータの移動、複製、アクセスを可能にするアーキテクチャのことです。データファブリックでは、ほぼリアルタイムの分析により、データ所有者がクラウドやストレージ上のデータの所在を管理できるようになり、データを適切な場所に適切なタイミングで配置できるようになります。ITおよびストレージ管理者は、ストレージからデータを解放し、ストレージ中心ではなくデータ中心の管理を可能にするために、データファブリックアーキテクチャを選択するでしょう。例えば、すべての医療画像を同じNASに保存するのではなく、アナリティクスやユーザーからのフィードバックを利用して、医療画像をコピーして臨床研究での機械学習に利用したり、重要なデータを不変的なクラウドストレージに移動してランサムウェアから保護したりするなど、ファイルをセグメント化することができるようになります。
異なるデータ戦略に合わせて進化するマルチクラウド
現在、多くの企業はハイブリッドクラウド環境を構築しており、データの大部分は複数のベンダーシステムのプライベートデータセンターに保存・バックアップされています。非構造化(ファイル)データが急激に増加しているため、クラウドは二次または三次のストレージ層として使用されています。このような状況では、コスト管理、パフォーマンスの確保、リスク管理を行うために、サイロを横断的に把握することが困難になります。その結果、IT担当者は、クラウドとオンプレミスの両方の環境でデータから価値を引き出すことは、非常に困難な課題であると認識しています。マルチクラウド戦略は、組織がユースケースやデータセットに応じて異なるクラウドを使用する場合に最適です。しかし、これには別の問題があります。データを移動させると、後になってデータをクラウドから別のクラウドに移動させる必要が生じた場合、非常に高いコストがかかります。新しいコンセプトは、1つの場所に存在するデータにコンピューティングを集中させることです。その中心となる場所は、クラウド・プロバイダーに直接リンクしているコロケーション・センターかもしれません。マルチクラウドは、計算機がデータに向かってくる場合もあれば、データが複数のクラウドに存在する場合もあり、異なる戦略で進化していきます。
広告
企業は、重要なビジネス上の意思決定を行うために、データの津波から有用な情報を引き出すことを可能にするデータ管理戦略を採用するよう、引き続き強い圧力を受けています。分析はこの取り組みの中心となり、また、分析と行動のためにすべてのデータを管理できるよう、オープンで標準ベースのデータファブリックを作成することも重要です。
Kumar Goswamiは、KompriseのCEO兼共同設立者です。
データディシジョンメーカーズ
VentureBeatコミュニティへようこそ。
DataDecisionMakersは、データ業務を行う技術者を含む専門家が、データに関連する洞察力やイノベーションを共有する場です。
最先端のアイデアや最新の情報、ベストプラクティス、そしてデータやデータ技術の未来について読みたい方は、DataDecisionMakersにご参加ください。
ご自身の記事を寄稿することも検討してみてはいかがでしょうか?
DataDecisionMakersの記事を読む
VentureBeatキャリアで理想の仕事を見つけよう
オラクル
アムステルダム
求人情報を見る
ノースロップ・グラマン
フォールズチャーチ
3362件の求人を見る
Airbnb
ロンドン
329件の求人を見る
グラントソントン
アムステルダム
740件の求人を見る
最大10万ドルのAWS Activateクレジットで構築と拡張を実現
AWS Activateは、スタートアップ企業向けに無料のツールやトレーニングなどを提供し、迅速な構築と拡張を支援します。さらに、最大10万ドルのActivateクレジットを受け取ることができます。
応募はこちらから
広告掲載
広告掲載
スポンサードリンク
補強が必要なヘルスケア・セキュリティの意外な脆弱性
VBスタッフ
2021年11月30日 午前4時10分
画像クレジット:ゲッティイメージズ
プレゼンター:Armis
この5年間で、医療機関はデジタルトランスフォーメーションを行ってきました。情報を共有するための手動の内部プロセスから、電子カルテと統合されたワークフローへと移行し、医療機器や情報がオンライン化され、ヘルスITエコシステムに組み込まれたのです。これらのアプリケーションは、コミュニケーションからケアの質、そして臨床チーム間のコラボレーションまで、あらゆる面で改善をもたらしました。
「一方で、デジタルトランスフォーメーションの進展により、これらのソリューションがもたらす新たな脆弱性や、セキュリティ侵害が組織にもたらす上流/下流の影響について、これらの組織のIT部門は強く認識するようになりました」と、資産の可視化とセキュリティの統合を行うArmis社の戦略的製品マーケティングディレクターであるSumit Sehgal氏は述べています。
新しいエコシステムの脆弱性
血糖値モニターから医療用画像処理装置、ペースメーカーまで、世界にはすでに4億3,000万台の接続された医療機器があり、部門やユースケースを超えて広がっています。また、同じような機器でも、接続方法はさまざまです。例えば、ある病院では、患者の心臓のリズムを一定に保つために4種類のペースメーカーを導入しているかもしれませんが、機器の年代や構成によって、通信方法やITインフラとの関わり方は全く異なるものになります。同じことが、CTスキャナ、MRI装置、薬局のシステムなどにも言えます。
「コネクテッド・デバイスといっても、そのデバイスが何であるかを理解するだけではありません。「接続されたデバイスについて話すとき、デバイスが何であるかを理解するだけでなく、そのデバイスがケアを提供する医療システムの中でどのように機能しているかを理解することが重要です。
これらのデバイスは、パッチレベル、セキュリティ設定、アップデート、医療システム間の通信方法、他の重要なネットワークとの接続方法など、IT部門が扱うべき複雑な要素を新たに追加しています。
「医療機関が対処しなければならない最大の脆弱性は、おそらくこれです」とセガールは言います。「医療機関は、他のすべてのITインフラに加えて、このような脆弱性にも対処しなければなりません。
例えば、インフラのエコシステムの脆弱性は、建物の管理システムや飲料水の供給、圧力制御センサー、エレベーターの制御機構など、医療に不可欠な環境制御にまで及びます。
「脆弱性評価プロセスの第2段階では、医療機器以外にも対処すべきものがあることに気付きます」とセーガルは言います。「医療機関にとっては大きな課題であり、その対処法に関する専門知識も限られています」。
医療機関のエコシステムの脆弱性がもたらす影響
"これらの脆弱性が悪用された場合の影響だけではありません。医療システムの回復力や、結果を左右するこのような状況をいかに効果的に乗り切るかということにも結びつきます」とSehgal氏は言います。
ITリスクマネジメントの観点から見ると、医療のデジタル化がもたらす最も明白な影響は、データ漏洩のリスクです。これらのデバイスに情報がどのように出入りするか、またそれらが病院のネットワークにどのように統合されているかによって、機密保護された医療情報の漏洩から不正アクセスまで、さまざまなリスクが生じます。Ponemon Instituteの調査によると、医療機関の54%が過去2年以内に少なくとも1件の患者データ漏洩を経験し、41%が6件以上の漏洩を経験しています。これらのデータ漏洩は、1件あたり10,000件の患者記録を流出させ、平均275万ドルの損害をもたらします。
一般的にはあまり考えられないのが、デジタル技術の故障による影響です。臨床医は、治療方針を決定するために、ますますこれらのシステムに依存するようになっており、故障は治療を提供する能力に直接影響を与えます。また、これらの障害は業務の継続を妨げ、治療や投薬のプロセスを遅らせ、代替のワークフローがほとんど効率的ではないため、しばしば経済的なオーバーヘッドをもたらします。セーガルは、患者の安全性への影響はよく話題になりますが、ワークフローの層に守られているため、実際に影響が出ることは稀です。本当の痛みは、ワークフローの再構築が必要になったり、コストの問題やケアの遅れにあると指摘しています。
ケア提供の確保
医療機器のセキュリティに関する議論を行うすべての組織は、最初から、これはITだけの仕事でも、臨床だけの仕事でもないことを理解する必要がある、とセーガル氏は言います。セキュリティを確保するためには、臨床チームと生物医学、IT、情報セキュリティを結びつけるガバナンスプロセスが必要であり、自社の医療システムにとってどのような成功が必要かを話し合う必要があります。
次に、セキュリティチームのトレーニングを見直し、セキュリティ対応やセキュリティ戦略を支援するパートナーが適切な能力を持っていることを確認する必要があります。
そして何よりも重要なのは、医療機器だけでなく、それ以外のものにも目を向けることです。
「医療機器はその始まりですが、それが患者に触れるすべてのものではありません」とセガールは説明します。「入院から退院まで、患者の情報は約30のアプリケーションを経由し、数百人が触れることになります」。
Sehgal氏は、資産管理を含む脆弱性管理や、臨床領域や患者の流れに関連した脆弱性と影響の可能性に基づいてリスクを計算する脅威モデルなどのセキュリティアプローチを検討するよう企業に促しています。
「今日の組織が抱えるお金、時間、優先順位の問題を考えると、組織ができることは、すでにあるプロセスを利用して、よりリアルタイムなアプローチで脆弱性の管理とモデル化を行うことです」とSehgalは説明します。「Sehgal氏は、「建物の管理システムやCTスキャナーなどを扱っていても、すべては患者にどのようにケアを提供するかという結果に結びついています。
また、理論的なシナリオを想定して対応策を練る、卓上訓練にも力を入れることができます。卓上訓練では、対応プロセスの中で障害となる可能性のある箇所や単一障害点を示すことができるため、重要です。しかし、卓上訓練では、リアルタイムでシナリオに対応するために必要な筋肉の記憶を得ることはできません。
例えば、卓上訓練では、侵害された資産を4分で交換することが提案されるかもしれませんが、現実の世界では、ITスタッフを探すのに10分かかり、そのスタッフが侵害された資産にたどり着くまでにさらに10分かかることは考慮されていません。1台のデバイスに20分、被害を受けたデバイス400台分の時間が加わることになり、計算できない大規模な問題が発生します。
セキュリティ対策を適切に行っている医療機関では、セキュリティオペレーションチームと協力して、セキュリティ対応とオペレーションの継続性を両立させた緊急管理機能を開発しています。
「Armis社が提供するようなソリューションを活用することで、医療機関は自分たちの弱点がどこにあるのかを迅速に特定することができ、その情報をケアの提供方法に反映させることができます」とSehgal氏は説明します。
リスク管理の優先順位を決める
セーガルは、セキュリティソリューションは、自分たちが何を持っていて、何が問題なのかを知らせるのは得意ですが、何が重要なのかを自動的に知ることはできないと指摘します。医療機関にとって、収益の観点からどの専門分野が重要なのか?どのERのワークフローがより重要なのか?
「すべての医療機関には、ケアを提供する上で何を我慢し、何を我慢しないで済むかというリスク許容度があります。「これはITソリューションの問題ではありません。これはITソリューションの問題ではなく、解決すべきプロセスの問題です」とSehgalは言います。
優先順位を管理するために、組織は管理可能な範囲を特定し、特定のエリア、特定の専門分野、または特定のプロジェクトを分離して集中的に取り組むことができます。そうすることで、IT資産だけでなく、プロセスや人材育成の観点からもセキュリティを確保するという新たな現実に適応することができます。そこから、病院内の適切な臨床チームや企業のリスク管理チームの中で、セガールが「内省的で正直な会話」と呼ぶ、インシデントに対処する上での組織の能力についての会話をすることができます。
「ダウンタイムやデータ損失について、組織としてどのくらいの期間対応できるかを確認する必要があります」とセガールは言います。「さらに、事態が悪化したときに必要な支援を得るために、どのようなパートナーと協力できるのかを尋ねなければなりません」。
この記事が気に入ったらサポートをしてみませんか?