運用データ プラットフォーム (データ プラットフォーム運用の必読書、DataOps の 3 つの原則)

運用データ プラットフォーム (データ プラットフォーム運用の必読書、DataOps の 3 つの原則)

データプラットフォーム運用に必読の DataOps の 3 つの原則

ロネン・シュワルツ

インフォマティカ社 グローバルテクノロジーおよびエコシステム戦略担当エグゼクティブバイスプレジデント


データ駆動型の企業が戦略的優位性を獲得するためにデータの維持と管理に努めていることがますます明らかになっています。利用可能なデータは豊富にあるにもかかわらず、レガシー データに対してコスト効率の高いデータ品質診断を提供することはできません。優れたマルチチャネル顧客体験を提供できず、データが適切に管理され安全であることを保証できず、世界のさまざまな業界標準やデータプライバシー規制に準拠できない企業が多すぎます。


なぜこれらの企業はデータ駆動型開発に関してもっと画期的な対策を講じないのでしょうか?その理由の 1 つは、企業内でデータ プラットフォームを運用する方法をまったく理解していないことです。



私は、データの品質を向上させ、それを活用してより優れた洞察をより早く提供したいと考えている多くのデータリーダーと話をしています。彼らは、速度や品質を犠牲にすることなく、データ プロジェクトの範囲を拡大する必要があることを認識していました。


しかし、具体的にはどのようにすればよいのでしょうか?その答えは、DataOps(データ操作、データ向けのDevOpsとも言える)と呼ばれる新しい運用方法にあります。 DataOps は、DevOps の概念をデータの世界に拡張することで、データ プラットフォームを運用する方法を提供します。 DataOps は、データに関する体系的な思考の柱の 1 つでもあります。詳細については、当社 CEOアミット・ワリアの記事「データに関する体系的な思考がなぜ重要なのか」をご覧ください。


DevOps は、継続的インテグレーション、継続的デリバリー、継続的デプロイメントという 3 つの主要原則に基づいて構築されています。これらのアプリケーション ソフトウェアの原則をデータ パイプラインやデータ駆動型アプリケーションにどのように拡張するのでしょうか?次に、それぞれの原則を詳しく見ていきましょう。



このプロセスには、データ エンジニアが新しいデータ ソースとデータ パイプラインを持続可能かつ自動化された方法で統合、準備、クレンジング、管理、公開する方法が含まれます。データ サイエンティスト、データ アナリスト、データ キュレーターが連携して AI/ML 駆動型データ カタログとデータ準備ツールを使用することで、データの検出と整理を自動化し、検索を容易にし、データ変換を推奨し、データとデータ パイプラインの仕様を自動的に設定し、データ エンジニアはすぐに作業を開始できます。ストリーミングと変更データ キャプチャ (CDC) 技術を使用すると、データ エンジニアはデータ パイプラインをリアルタイム ストリームに変換し、リアルタイムの顧客とのやり取りに使用されるような予測分析アルゴリズムで使用できます。


データ エンジニアは、メタデータ駆動型の開発ツールを使用して、レガシー データ パイプラインを新しい高速処理フレームワークとして将来に対応できるようにし、特にクラウドでは、それらを新興テクノロジーであるかのように使用します。さらに、スマート構造検出や動的テンプレートなどの AI 駆動型機能により、データ ソースが変更されてもデータ パイプラインが保護されます。つまり、オンプレミスでもクラウドでも、取得したパイプラインをどこでも実行できるということです。



このフェーズでは、企業全体にデータ ガバナンスを実装して、すべてのデータ消費アプリケーションが高品質のデータを使用できるようにする必要があります。データ ガバナンスは、データを解放して民主化し、企業全体に配信されるデータが信頼され、安全で保護され、コンプライアンス要件を満たすことを保証します。データ オーケストレーションは、このフェーズでは継続的なプロセスです。データは、すべての関係者 (データ エンジニア、データ サイエンティスト、アナリスト、データ管理スペシャリスト、データ ガバナンス スペシャリスト、InfoSec アナリストなど) 間で共同作業によって配信されます。


たとえば、データ サイエンティストが信頼できると思われるデータを簡単に見つけることができれば、対応する予測分析モデルを設計および検証することで、迅速に反復処理を行うことができます。 AI モデルの開発、テスト、トレーニング中は、データ ガバナンス戦略に従ってデータ品質ルールとデータ マスキング機能が適用されていることを確認することが重要です。そうすることでのみ、分析アルゴリズムと機械学習モデルはプラスのビジネス成果をもたらすことができます。データが企業内を移動する際には、すべてのデータが信頼され保護されるように、データ ガバナンス、データ カタログ、データ品質、およびデータ機密性を、統合されたインテリジェント データ プラットフォームを通じて統合する必要があります


AI/ML テクノロジーは、人間の認知能力とコラボレーション能力を強化し、企業全体でのデータ ガバナンスの実装に役立ちます。管理されたデータの場合、AI/機械学習テクノロジーは、ビジネス用語を実際のデータ セットと特定のポリシーに自動的にマッピングできます。近い将来、AI / 機械学習テクノロジーは、関連する規制を使用してデータを分析し、データガバナンス戦略を自動的に生成して、コンプライアンスリスクをさらに軽減できるようになります。



この段階では、ビジネス ユニットのセルフサービスを有効にし、信頼できるデータを企業内のすべてのタイプのユーザーが利用できるようにすることができます。この方法により、データ パイプライン開発プロセスのすべての段階でのすべての変更が、アナリストやビジネス ユーザーが使用するさまざまなデータ消費アプリケーションに配布されます。データ駆動型アプリケーションは、顧客サービス、マーケティング、電子商取引、不正検出、サプライ チェーン管理など、多くのビジネス機能にとって重要になっています。つまり、ビジネス エキスパートは最新のデータに迅速にアクセスできるということです。これを行う最善の方法は、水平スケーリングとマイクロサービスベースのアーキテクチャを採用することです。このアーキテクチャは、俊敏性と柔軟性のためにクラウドに導入されることが多いです。データ パイプラインの監視と管理における人工知能と機械学習テクノロジの役割のおかげで、データ パイプラインは継続的に動作し、そのパフォーマンスと容量使用率を継続的に最適化できます。



先ほど述べたように、 DataOps はデータ システム思考の柱の 1 つです。今日、データはデジタル変革の強力な推進力となっています。データ駆動型の組織は、システム思考アプローチを通じて、次のような方法で直面する課題に対処します。


1. 統合ハイブリッドインテリジェントデータプラットフォーム

2. DataOpsコンセプトによるプラットフォーム運用の実行

3. AIを使ってタスクを自動化し、人間の知識を増強する

4. メタデータを使用してデータの発見と理解の能力を獲得する

5. データガバナンスを使用して機密データの適切な使用とセキュリティを確保する


組織が直面しているデータの課題に対処する方法について、2 つの提案があります。

▶ 技術面では、人工知能を活用した統合インテリジェントデータプラットフォームを採用します。

▶ データプラットフォームの運用においては、システム思考法とDataOpsの3原則に従います。


これは一夜にして達成できる仕事ではなく、戦略的な旅です。しかし、データの力を解き放つことができれば、その見返りは莫大なものとなるでしょう。

<<:  運用データ表示(Douyinの運用データの表示と分析方法)

>>:  運用データの照会(病院の今日の運用データを照会するにはここをクリックしてください!)

推薦する

仮想ホストがサーバーリソースを過剰に消費する一般的な理由

現在、多くのウェブマスターは、仮想ホストをレンタルしてウェブサイトを構築することを好んでいます。たと...

EC運営コンテンツ(EC運営とは?)

電子商取引の運営とは?電子商取引の運営とは?多くの新規加盟店はこの点についてあまり理解していないよう...

ビールブランドのプロモーション(新しいファンマーケティングモデルを模索し、燕京ビールは業界にとって良い例を示しています)

新たなファンマーケティングモデルを模索する燕京ビールは、業界にとって良い例を示していますファンマーケ...

高級ブランドの世界販売台数(データ参照|ボルボ・カーズの5月の世界販売台数は前年比13%増、中国市場では前年比若干減少)

データリーディング:ボルボ・カーズの5月の世界販売台数は13%増加、中国市場では前年比で若干減少テキ...

ネットイースとテンセントが提携を解消

出典: フォトンプラネット2024年2月29日、NetEaseは2023年度の財務報告書を発表しまし...

操作とは何ですか?操作は何を行いますか?

オペレーションとは何ですか?オペレーションは何を行いますか?インターネット環境においては、どのような...

情報フロー広告入札方式(快手情報フロー配信(紹介)プロモーション詳細)

快手情報フロー配信(紹介)プロモーション詳細Kuaishou は記録と共有のためのプラットフォームで...

スーパーマーケットの豚肉販売促進計画(豚肉価格の高騰に対応するため、500店以上が肉の備蓄配送拠点を設置。北京のスーパーマーケットはこれを実行している)

豚肉価格の高騰に対処するため、500店以上が肉の予備配送拠点を設置した。北京のスーパーマーケットはこ...

Six Walnutsは、この神聖な歌のリリースにより、春節中の贈り物の贈呈の手順を明確にしました。

もうすぐ新年がやって来ます。進捗状況によると、何人かが Six Walnuts の箱を自宅に運び始め...

Namecheap チュートリアル: ドメイン名解決用のホスト レコードを設定するにはどうすればよいでしょうか?

優れた外国ドメイン名レジストラである Nmechep は、さまざまなドメイン名サフィックスを提供し、...

情報フロー広告アウトソーシング(情報フロービデオをアウトソーシングするには?天心工房が簡単にお手伝いします!)

情報フロービデオをアウトソーシングするには? Tianxin Factory なら簡単に実現できます...

WordPress の記事はどのフォルダにありますか? WordPress記事の保存場所

WodPess は、ブログやオンライン ストアなどの作成に広く使用されているオープン ソースのコンテ...

サーバー共有帯域幅と専用帯域幅の概念と違い

米国のサーバーをレンタルする場合、帯域幅は重要な基準要素の 1 つです。帯域幅は共有または排他的にす...

WeChat運営データレポート(テンセント:第3四半期のWeChatとWeChatの月間アクティブユーザー数は前年同期比2%増の13.36億人)

テンセント:WeChatとWeChatの月間アクティブユーザー数は第3四半期に13億3600万人に達...

ブランド マーケティング戦略のケース (これら 3 つのケースでは、最も人気のあるブランド マーケティングと成長戦略を習得する方法を学びます)

これらの3つのケースでは、最も人気のあるブランドマーケティングと成長戦略を習得する方法を学びます過去...