データ操作について知っておくべきことは何ですか? (データ分析はどのように始めればよいのでしょうか?上級データアナリストの意見を聞いてみましょう)

データ操作について知っておくべきことは何ですか? (データ分析はどのように始めればよいのでしょうか?上級データアナリストの意見を聞いてみましょう)

データ分析を始めるにはどうすればいいですか?上級データアナリストの意見を見てみましょう

リーン成長を始める


弊社のデータ分析マネージャーが、データ分析を始めるための 7 つのヒント (学習書籍 4 冊を含む) + 始めるための必須知識 (分析 5 種類 + 分析手法 2 種類を含む) をまとめ、ジュニア データ アナリストにすぐになれるようお手伝いします。

1

最初のポイント

データ分析を始めるための7つのヒント


人生において、新しい知識を学ぶときは、まず学ぶ目的と自分の現状を明確にしなければなりません。データアナリストの「新人」段階にいる場合は、まずしっかりとした理論的基礎を築き、それを実践的な演習と組み合わせて、常に問題を発見し、その過程で継続的に改善する必要があります。データ分析初心者向けの提案をいくつか紹介します。

知識体系を明確にする

どの職種でも備えるべき能力は単一のものではなく、多次元的な学習が必要です。データ アナリストは、データに敏感であるだけでなく、データの観点からチームが職場で問題を監視、特定、分析、解決できるように支援することも学ぶ必要があります。これを踏まえて、業界知識に精通し、データ分析フレームワークを構築し、データ分析手法の使い方を習得し、データ分析関連ツールを習得し、チャートを使用してアイデアを効果的に表現することも必要なスキルです。データ アナリストが学習する必要のあるさまざまなモジュールを特定したら、それらを 1 つずつ分解し、対応する統合機能を形成して、最終的な効果を最大化できます。

仕事の内容を明確にする

問題を解決できる人こそが最も価値がある。職場では、データ アナリストは通常​​、次のようないくつかの種類の問題を解決します。

1) 一時的なデータニーズを解決する

2) 開発エンジニアと協議し、ビジネス状況に基づいた関連レポートを作成する

3) ビジネスに基づいたさまざまなマイニングモデルを確立し、同僚とデータ分析とマイニングを実施し、効果的な提案や意見を提出する

4) データの製品化を通じて構造化されたビジネスやその他の問題を解決する

基礎となるツールをマスターする

以上の理解を通じて、まずはポジションの総合的な理解が得られることになります。次に、誰もが簡単なものから複雑なものまで段階的に能力を向上させることができます。データ アナリストとして、Excel の操作、特に Excel でよく使用される重要な関数 (sum、count、sumif、countif、find、if、left/right) に精通している必要があります。また、SQL データベースの基本的な操作にも精通している必要があります。 「SQL Must Know」の学習を推奨


ほとんどのインターネット企業は MySQL であり、where、group by、order by、having、like、count、sum、min、max、distinct、if、join、left join、limit、and and or、time conversion 関数などのロジックを理解する必要があります。これらの基礎ツールの使用方法を習得し、基本的なデータ抽出、分析、およびプレゼンテーションを実行できるようになれば、基本的な能力の向上は完了です。

論理的思考力を鍛える

今は画像を読み取る時代であり、よりよい結論を導き出すためには、膨大な量のデータを構造化された形式で提示することしかできません。通常、ロジック図を使用して自分のアイデアを分析および明確にし、PPT を使用してアイデアを提示して、プロジェクトの進行をよりスムーズに進める方法を学びます。

正しい考え方が、あなたが行うことの質を決定します。論理的思考力を鍛えるには、ピラミッド原理が第一の選択肢です。


帰納的推論、演繹的推論、ピラミッド原理における相互独立性と徹底的消尽の原則は、すべて論理を訓練する効果的な方法です。さらに、SMART、5W2H、SWOT、4Pなどの理論を理解し、これらの手法を使って意図的にデータ分析を実践することができます。何らかの行動を起こす前に、マインドマップを描くのが最適です。マインドマップは、散在するポイントを結び付け、次のステップに進むための体系的な方法論を形成するのに役立ちます。

統計とデータベースに関する知識を深める

統計的な観点からデータを見ると、違った視点が得られます。データの平均、中央値、標準偏差、分散、確率、および有意性を分析する方法を学びます。中心傾向、変動性、正規化、正規分布、標本分布、推定、仮説検定など、統計における知識ポイントを習得します。変数や標本が複数ある場合は、さまざまな検定も学ぶ必要があります。さらに、学習を深めることができる主流の統計分析ツールがいくつかあります。メニューベースの操作ソフトウェアである SPSS は、プログラミングソフトウェアよりも使い始めるのが簡単で、使いやすいことが主な利点です。 R は統計計算とデータの視覚化のために設計されたソフトウェアであり、非常に豊富な機能を備えています。近年、企業は主にその強力な解釈可能性と機能のために、Python の使用を好んでいます。この点では、Wes McKinney の著書「Data Analysis Using Python」は非常に実用的です。


データベースに関しては、企業のデータはMySQL、Oracle、Postgres、MonogoDB、Cassandraなどのデータベースに保存されることが多いため、これらについても理解する必要があります。

データ管理と視覚化を学ぶ

膨大な量のデータを扱う場合、データ管理の習得は必須のスキルとなります。データ管理には、DataWrangler などのデータのクリーニングと処理 (ETL) が含まれており、これによりデータをより明確に表示できます。データ視覚化とは、Tableau や Spotfire などのフロントエンドでデータをより鮮明に表示できるようにすることです。

現在、多くの企業は FineBI やiResearch Arkなどのデータ視覚化ツールの使用を選択する傾向があります。

写真は「Analysys データ分析製品 - Analysys Ark」より抜粋

ビジネス実践を強化し、同業者から学ぶ

諺にもあるように、「練習すれば完璧になる」のです。理論やコースを学ぶだけでなく、実際に実践することも必要です。継続的な練習を通じてのみ、より早くスキルを習得することができます。仕事では、より直接的な経験を積めるよう、積極的に同僚にアドバイスを求めましょう。本当に一生懸命勉強し、熱心に練習することができれば、自然と有能なデータアナリストになれると信じています。 「Lean Data Analysis」を読むことをお勧めします。この本には多くの事例が掲載されており、幅広いビジネスをカバーしており、データ駆動型の思考モードを構築するのに役立ちます。


デジタル時代においては、データ分析の思考力とデータ洞察力が、業務における中核的な競争優位性の 1 つになります。上記の内容を習得した後、ここではデータ分析に必要な知識を提供します。


2

2番目のポイント

5種類のデータ分析


データの分析を始める前に、5 種類のデータ分析を理解する必要があります。ここでは 5 種類のデータ分析についてまとめます。記述的分析から規範的分析へと移行するにつれ、データ分析の複雑さと作業負荷はそれに応じて増加し、機械への依存がますます重要になります。

記述的分析 – 何が起こったか

記述的分析は、あらゆるデータ分析プロセスの出発点です。何が起こったのかという疑問に答えることを目的としています。これは、さまざまなソースからの生データを整理し、それをビジネスにとって貴重な洞察に変換することによって行われます。

iResearch Ark ビジュアル ダッシュボードを使用すると、収集したデータの視覚化を折れ線グラフ、棒グラフ、バブル チャートなどにカスタマイズできるため、何が起こっているかを非常に直感的に確認できます。

Analysys Arkデータダッシュボードの例

探索的分析 - データ間の関係性を探索する

名前が示すように、探索的分析の主な目的は探索であり、その最も典型的な応用分野はデータマイニングです。探索的分析は、もともと無関係であったデータ変数間のつながりを発見するのに役立ちます。

データマイニングの分野には典型的な事例があります。ウォルマートはデータマイニングを通じて、おむつとビールの販売データに相関関係があることを発見しました。そのため、スーパーマーケットの棚の配置が調整され、おむつとビールが同じような位置に置かれました。予想外にも、これによりこれら 2 つのまったく異なるカテゴリーの売上が増加しました。

診断分析 - なぜそれが起こったのか

診断分析は最も一般的なタイプのデータ分析です。診断分析を通じて、データ アナリストは、何かが発生した理由、その発生のきっかけとなった先行イベントは何であったか、発生後にどのような後続イベントがトリガーされるかを調査できます。

たとえば、ある日突然、顧客からの電話による苦情が減ったとします。なぜこのようなことが起こるのでしょうか?データ分析により、これは新しいカスタマー サービス担当者が雇用されたか、製品の特定のインターフェイスに苦情処理機能が追加されたことが原因である可能性があることがわかりました。

何かが起こる理由と仕組みがわかれば、問題や課題に対する具体的かつ実行可能な解決策をすぐに特定できます。

予測分析 – 期待できること

予測分析は、既知のデータを分析して将来についての仮説を立てることで、将来何が起こるかという質問に答えます。予測分析では、上記 3 種類のデータ分析だけでなく、機械学習 (ML) や人工知能 (AI) などの最先端のデータ サイエンス技術も必要です。

たとえば、小売店の過去 5 年間の売上データに基づいて、翌月、翌四半期の店舗の総売上や単一商品の販売量を予測できます。

予測分析を通じて、開発の傾向、パターン、何かが起こる理由を理解できるだけでなく、特定の分野における現在の開発状況に基づいて賢明な予測を行うこともできます。 iResearch Ark には、ユーザー離脱警告や製品売上予測などの予測モデルが組み込まれており、運用競争力が大幅に向上します。

処方的分析 – 取るべき行動

処方的分析は、上記のデータ分析をすべて使用し、それをデータ モデルと組み合わせて、どのようなアクションを実行するかという質問に答える、最も高度なタイプのデータ分析です。処方的分析では、複数のシナリオを分析し、各シナリオの結果を予測し、その結果に基づいて最善の行動方針を決定します。

人工知能 (AI) は、データ分析の最前線にある規範的分析の一例です。人工知能(AI)はビッグデータに基づいて構築されます。大量のデータを取り込んで分析することで、データ情報をどのように活用し、賢明な意思決定を行うかを学習します。

データ分析を行う際には、主に記述分析、探索的分析、診断分析を行います。予測分析と規範分析は、主に機械が学習して解決することになります。


3

第三のポイント

データ分析の2つの方法:3つの軸+二刀流


データ分析の実際の応用に戻ると、製品の反復最適化分析であれ、運用アクティビティ分析であれ、常に多くのデータ分析方法が関わっているようです。

しかし、物事がどのように変化しても、本質は変わりません。結局のところ、すべてはこれら 5 つの方法、またはそれらの組み合わせに行き着きます。下の図に示すように、iResearch ではこれをデータ分析の 3 つの軸と諸刃の剣としてまとめています。

3.1 データ分析の3つの主要な方法


トレンド分析


トレンド分析は、最も基本的かつ最も一般的に使用されるデータ分析手法と言えます。基準期間に対する各期間の関連指標の変化傾向を分析することで、指標の傾向変化を分析し、問題点を直感的に発見し、より正確でリアルタイムな運用上の意思決定が可能になります。

たとえば、ブランド小売業界にとって、GMV は最も重要な指標です。日、週、月などの時間軸に基づいて GMV のトレンド チャートを描くことができるため、さまざまな時間軸に応じた GMV の変化を直感的に確認できます。


セグメント分析


トレンド分析がマクロ的すぎる場合、より洗練された運用にはセグメンテーション分析が不可欠です。さまざまな次元に従ってデータを段階的に分割することで、問題の原因に近づき、より洗練されたデータの洞察を得ることができます。

例えば、あるブランドの小売企業のGMVが特定の日に大幅に減少した場合、全国の省級行政区の規模に基づいて、湖南省、広東省、北京省、雲南省などを含む34の省級行政区を細分化し、どの省級行政区のGMVが減少したかを確認できます。特定の州行政区域を特定した後、それを市や地区のレベルにさらに細分化することができます。


比較分析


比較分析とは、2 つ以上のデータを比較し、その違いを分析して、データによって表される事物の発展、変化、法則を明らかにすることです。その特徴は、物事の特定の側面における変化やギャップを非常に直感的に示し、そのような変化やギャップの程度を正確かつ定量的に表現できることであり、主に孤立したデータの参照システムを提供します。

たとえば、ブランド小売会社の GMV を例にとると、異なる年の GMV の変化傾向を比較することで、この会社の年間成長を直感的に把握し、投資する価値があるかどうかを判断することができます。


3.2 データ分析の諸刃の剣


ソース分析


問題の原因まで遡って分析することは、無駄な分析をやりすぎる操作を回避する方法です。

たとえば、あるグループのユーザーが当社の製品にアクセスした場合、購入コンバージョン率は比較的低くなります。通常、私たちの分析は、製品の流暢性、運用の強度、製品の魅力などの問題に焦点を当てます。しかし、ソース分析から、これらのユーザーはターゲット ユーザーではなく、偽のトラフィックである可能性が非常に高いです。


帰属分析


アトリビューション分析は、1 つまたは複数のルールを通じて、コンバージョン パス内の各タッチ ポイントに販売クレジットまたはコンバージョン クレジットを割り当てるプロセスです。

本質的に、アトリビューション分析は、全体的なコンバージョン目標の達成に対するユーザー タッチポイントの貢献度を測定および評価することであり、評価の中核となる指標はコンバージョン貢献度です。しかし、それを具体的に測定し評価するためには、アトリビューション分析モデルを使用する必要があります。

一般的なアトリビューション モデルには、ファースト タッチ アトリビューション モデル、ラスト タッチ アトリビューション モデル、線形アトリビューション モデル、位置アトリビューション モデル、時間減衰アトリビューション モデルの 5 つがあります。アトリビューション分析に関する詳しい記事は、 オペレーターはまだアトリビューション分析を理解していないのですか?成長が停滞するのも当然です。」をご覧ください。



分析

アナリシスについて

Analysys International は、中国におけるプロフェッショナルなワンストップ、フルシナリオのプライベート ドメイン ユーザー操作ソリューション サービス プロバイダーです。同社は、Analysys Ark Intelligent Analysis、Analysys Ark Intelligent Operation、Analysys Ark Intelligent Portraitという3つの主要な製品コンポーネントと、それをサポートするコンサルティングサービスを所有しており、企業がデジタルユーザー資産を蓄積し、データ駆動型の運用クローズドループを構築し、プライベートドメインユーザーと密接な関係を築き、リーン成長を実現できるよう支援しています。

<<:  データ運用に必要なスキルとは(データ運用技術者資格の取得方法、試験時間、応募条件、科目)

>>:  観光地販売データ(観光客785万人超!貴陽「5月1日」文化観光レポートカード発表)

推薦する

電子商取引業務の主な業務は何ですか? (電子商取引事業者の試験を受けるには?受験要件は?業界の見通しは?)

電子商取引オペレーターの試験を受けるにはどうすればいいですか?要件は何ですか?業界の見通しはどうです...

MBA ブランドマーケティング (MBA ケース)

MBAケースインターネットセレブブランドの台頭はマーケティングと密接に関係しています。企業がさらに...

電子商取引運用データレポート(iiMedia Research)

iMediaコンサルティング公式アカウント[iiMedia Research]を検索してフォローし...

牛肉・羊肉ブランド企画(タワン3W消費者戦略計画|牛小凡:即席ステーキの「高級」ブランドをどう作るか)

タワン3W消費者戦略全計画|牛小凡:即席ステーキの「高級」ブランドをいかに構築するかTowerWa...

丹陽ブランド企画会社(丹陽メガネ:美しい都市名刺)

丹陽メガネ:美しい都市の名刺今朝、「メイド・イン・チャイナ 第1回丹陽眼鏡文化観光フェスティバル」が...

WordPress の基本チュートリアル: 一般的な基本設定

WodPess に関するチュートリアルはこれまでにも数多く紹介されてきました。この記事は主に初心者向...

成都地下鉄運行データ(交通部最新データ:成都都市軌道交通運行距離は557.8キロメートル)

運輸省の最新データ:成都の都市鉄道運行距離は557.8キロメートル交通運輸省は5日、「2020年都市...

江蘇省ブランド計画(ブランドデザインの鍵は何ですか?江蘇省のブランドデザイン会社は何ですか?)

ブランドデザインの鍵は何でしょうか?江蘇省のブランドデザイン会社は何ですか?まず、ブランドデザインは...

ユーザー操作操作(TOBユーザー操作)

TOBユーザー操作私たちは常にプライベートドメインの運用やマイクロエンタープライズの運用について話...

電子商取引の製品運用(超長文かつ実用的 | 史上最も完全な電子商取引運用マニュアル)

超ロング丈ドライグッズ |史上最も完全な電子商取引操作マニュアル15年間の急速な発展を経て、Tao...

Windows システムでローカル ホスト ファイルを変更する方法

Windowsシステムは国内ユーザーにとって最も馴染みのあるシステムであるため、使用中のWindow...

アクティビティ運用データ分析 (アクティビティ運用 | データを活用してアクティビティを推進する方法を説明した記事)

アクティビティオペレーション|データを活用してアクティビティを推進する方法を解説した記事編集者注:...

コンテンツ電子商取引にはどのような業務が含まれるか(電子商取引プラットフォームのコンテンツ業務を解説した記事)

電子商取引プラットフォームのコンテンツ運用に関する記事インターネット上には「コンテンツ」に関する記事...

データに基づいたユーザー操作(データに基づいた正確な操作とコアプロモーターの特性を習得すれば、すべてをうまく行うことができます...)

データに基づいた正確な操作とコアプロモーターの特性により、すべてをうまく行うことができます...ま...

GeoTrust SSL 証明書の年間費用はいくらですか?

GeoTust は、国内の企業や機関で広く使用されている SSL 証明書ブランドであり、世界的に有名...