手があれば初心者でもデータ分析ができる

手があれば初心者でもデータ分析ができる
データ分析に関しては、多くの人が過度に複雑なモデルやツールに夢中になり、核心部分を無視する傾向があります。
「迷信を打ち破る」ために、私は分かりやすく実践的なベビーシッターガイドを書くことにしました。

量子力学ではなくデータサイエンス
言語やツールがどれだけ洗練されていても、データ分析ではデータの取得、データのクリーニング、データの理解という3つのポイントを避けることはできません。
ホットな検索は非実用的で理解しがたいものが多いので難しいです。
次に、ケースを使用してこの記事を正式に開始してみましょう。
 案例背景:你需要为景区设计文创产品,但不清楚哪类文创产品受欢迎。你想通过分析文创产品的类型、价格和销量等数据来获取灵感。比如,哪些类型的文创产品卖得最好?价格与销量之间是否存在相关性? 数据需求:包含名称、分类、价格、销量、用途、人群、材质、风格。销量排名前100个商品数据,

生データを抽出し、無効な要件を削減します。
私たちは、プラットフォームがデータを取得するのが遅すぎる、または開発に多くの困難があるのではないかと常に感じていますが、実際には、プラットフォームは役に立たないデータを要求しすぎています。
リクエストをするときは、自分自身に何度も問いかけてください。それは本当に必要ですか?代替方法はありますか?
次に、オリジナルデータ、そしてオリジナルデータの少ないものを要求してください。
 
データ抽出の範囲を制御することで、冗長な情報を処理するための計算および手作業の負担を軽減できます。そして元のデータは簡単に結合できますが、結果データは抽出が複雑なだけでなく、処理も困難です
データを取得した後、生のデータは乱雑であることが多いため、急いでデータを分析しないでください。
データがクリーンアップされていない場合、その後の分析結果が歪んだり間違ったりする可能性があります。データが「クリーン」な場合にのみ、分析ツールとモデルが機能します。
次に、データを「読み取り可能」かつ「使用可能」にするためにデータをクリーンアップする方法を見てみましょう。

理解できるまで掃除すれば、機械も理解できるようになります
ツールレベルでは、Feishu の多次元テーブルを使用することをお勧めします。これにより、後続のグラフィックスがより便利になります。
1. データのクリーニング
まず、 「故宮」、「文化と創造」、「公式旗艦店」などの無駄なキーワードを削除します。
クリーニング後は、読み取りエクスペリエンスが向上するだけでなく、機械がデータを処理するために必要な計算能力も削減されます。
必要に応じて、空の値を埋めたり、ラベル形式を統一したりして、データが明確で標準化されていることを確認するなど、他のクリーニング方法を追加できます。
2. データ分類
2-1.特徴抽出
2 番目のステップでは、貴重な特徴を抽出する必要があります。たとえば、商品名に祭り、目的、人々のグループなどが含まれる場合です。
最も簡単な方法は、スマート ラベリングに Feishu のフィールド ショートカットを使用することですが、標準化しやすいこのタイプのデータの場合は、関数抽出の方が適しています。
たとえば、 REGEXEXTRACTALL関数:
 REGEXEXTRACTALL( [商品标题], "教师节礼物|生日礼物|乔迁礼物|儿童节礼物|结婚礼物|创意礼物|伴手礼" )

この機能は、商品タイトルから一致するギフトタイプを抽出し、「目的タグ」に変換します。

タグを抽出した後は、必ず関連キーワードを再度クリアしてください。
2-2.数値による分類
カテゴリの価格分布を分析する場合、価格データがまばらだと問題を効果的に特定できません。
しかし、価格を範囲に絞り込むと、データが集中し、分析しやすくなります。
 IFS( [商品价格] <= 50 , "50以下" ,  [商品价格] <= 100 , "100以下" ,  [商品价格] <= 200 , "200以下" ,  [商品价格] <= 500 , "500以下" ,  [商品价格] <= 10000 , "500以上" )
AI以外にも、 IFS関数を使うとより便利です。価格マッチング範囲内の値を対応する間隔に分類します。
クリーニングと分類を通じて、人間と機械の両方が理解できるようになり、分析の次のステップに進むことができます。

分析: ネジを締めて、ロケットを作らない

ヘルプ!上記の原文は24,000回閲覧されています
分析によく使用されるチャートは、トレンド チャート、円グラフ、棒グラフ、バー チャート、ワード クラウドです。問題の 80% は処理できるので、ポーターの 5 つの力について心配する必要はありません...
トレンドの変動により問題をより早く発見することができ、割合と変化により重要な問題に焦点を当てることができます。複合チャートのクロス分析とドリルダウン分析により、問題をさらに特定できます。
分析に戻りましょう。
01. 文化・創造製品の種類、販売量、価格
円グラフを分析すると、売上高シェアとカテゴリーシェアがほぼ一致していることがわかります。
しかし、「その他」のカテゴリーでは紙袋の販売数が2万個であり、データが歪んでいた。
そこで、紙袋商品を除外し、装飾品、文房具、食器など主要カテゴリーの売上を再度分析しました
カテゴリーは主に装飾品(29.4%)、文房具(22.6%)、食器(20.17%)に集中しており、カテゴリー数が多いものが売れ筋でもある。そのうち、平均価格が最も高かったのは食器類(210元)で、最も低かったのは文房具類(76元)だった。
02. 販売量と価格の関係

後続の分析のために製品をカテゴリ別に絞り込みます。右上隅のボタンに気づきましたか? Feishu ドキュメントによって生成されたチャートはインテリジェントに分析できるため、効率をさらに向上させることができます。
洞察

さまざまな商品カテゴリーの中で、調理器具は最も高い価格(210)ですが、販売量は最も高くありません(877)。

ジュエリー製品(154)は価格が中程度で、販売量(506)は比較的低い。

分析する

価格と販売量の相関関係は弱い。食器を例に挙げてみましょう。価格は比較的高いですが、販売量は相当なものです。ジュエリーの価格は中程度ですが、販売量は比較的少ないです。これは、価格が販売量を決定する唯一の要因ではなく、製品の機能、市場での位置付けなどによって影響を受ける可能性があることを示しています。
03. 使用状況、人口、材質が価格と売上に与える影響

洞察:

教師の日ギフトの販売数量は1,012個となり、全用途中最多となった。

こどもの日のギフトの価格はたったの35と比較的安価です。

分析:

使用量、価格、販売量の間には一定の相関関係があります。例えば、より高価な中秋節のギフトの販売数は 700 個であるのに対し、より安価な子供の日のギフトの販売数は 400 個でした。教師の日のギフトは最も高価ではありませんが、市場の需要に合致しているか、プロモーションがより効果的であるため、売上が目立っています。

 

全体的に、価格と販売量は正の相関関係にあり、価格の高い製品は比較的販売量が多い傾向があります。

使用状況をセグメント化すると、価格と販売量の相関関係についての結論は異なります。同じ方法を使用して、群衆、素材、創造性の影響を検証できます。

タグに基づいて生成されたワードクラウドには非常に奇妙で創造的な部分があり、非標準のデータは直接抽出に適していないことも示しています。

最後のステップは、提案を出力することです。分析には意見や提案が必要です。

観点:

1) 装飾品、文具、食器類が好調で、大量生産され、販売も好調で、装飾品の販売量が29.4%と最も多かった。

2) 販売量と価格の関係は複雑で、全体的に強い相関関係はありません。調理器具などの一部の高価値製品はかなりの売上を上げていますが、他のカテゴリでは相関特性は見られません。

3) 祭りの影響が顕著:教師の日の販売(1,012個)が明らかにリードし、より高価な中秋節の贈り物も好調でした(700個)。特定の祭りは売上に大きな影響を与えます。

4) 群衆とクリエイティブのデータは参考としてあまり意味がありません。SEO ではタイトルのターゲット ユーザーが部分的にしか明確に定義されていないため、クリエイティブのワード クラウドは比較的混沌としています。ターゲットを絞った検索を行うには、カテゴリ内の上位 5 つの製品を選択することをお勧めします

 

提案:

1)カスタマイズのコストを考慮すると、装飾と文房具のカテゴリに重点を置くことをお勧めします。

2) 単語の出現頻度に基づき、季節や休日の変動による売上への影響を軽減するために、旅行用バッグや室内装飾品など、幅広い層を対象とした日常的な製品のデザインを優先することが推奨されます。

3) さらに、クリスマス冷蔵庫マグネットなど、休日をテーマにした低コストで生産が速い製品を開発することもできます。



やっと
ビジネスの量が一定レベルに達するまでは、複雑な用語にあまり力を入れないでください。高いところに立つということは必ずしも遠くまで見渡せるということではありません。
そのレベルに達したら、専任のデータアナリストも雇ってこの作業を行うことになると思います。

<<:  TaobaoとWeChat Payが仲良くなってAlipayが嫉妬?

>>:  借金とギャンブルで、広正眼科は「資本迷路」に深く陥っている

推薦する

自動車販売ランキング(2023年 年間自動車販売ランキング一覧、あなたのお気に入りの車は何位にランクイン?)

2023年通年の自動車販売ランキングの総合リストで、あなたのお気に入りの車は何位にランクされていま...

ビジネス管理にはどのような側面が含まれますか? (企業経営)

ビジネス管理#役に立つ情報を教えましょう# 企業の開発全体の計画と管理を必要とする複雑なシステムプロ...

コンテンツ運用能力(コンテンツ運用は初級から上級まで幅広く、優れた「編集者」であることに加えて、これらの能力も必要です!)

コンテンツ運用の初級から上級まで、優れた「編集者」であることに加えて、これらの能力も必要です。数年...

ビッグデータの管理と運用(Toutiaoがビッグデータを操作し、正確な運用のルールを明らかにする)

Toutiaoはビッグデータを操作し、正確な操作のルールを明らかにするToutiaoプラットフォー...

運用管理の主な内容(運用管理の機能とは?要件とは?共通業務VS運用管理)

運用管理の機能は何ですか?要件は何ですか?シェアリングビジネスVS運用管理本文は合計1,100語で、...

さまざまなブランドの売上データ(ダブル11期間中の19ブランドの全サイクルデータを一足先にご紹介)

ダブル11の19ブランドのフルサイクルデータを一足先にチェック[原文:Yibang] 予想通り、本日...

企業VIブランド企画(ブランドVIデザインには何が含まれますか?)

ブランドVIデザインには何が含まれますか?ブランド VI デザインは、企業が自社の企業イメージを外部...

情報フロー広告クエリ(二流電子商取引|この記事を読んで情報フロー広告の具体的な運用プロセスを理解し、コンバージョンを向上させましょう)

二流電子商取引|この記事を読んで情報流通広告の具体的な運用プロセスを理解し、コンバージョンを向上させ...

ビッグデータの管理と運用(専門家向け概要)

プロフェッショナルクイックビュービッグデータの管理と応用4年制大学/経営学士プロフェッショナル紹介...

Shoplazza と Shopify のどちらが良いでしょうか?

今日のデジタル時代では、多くの企業がビジネスを拡大するために電子商取引に目を向けています。独自のオン...

越境電子商取引プラットフォームとして、Shopify と WooCommerce のどちらが優れているでしょうか?

今日では、外国貿易電子商取引を運営する場合、特にオンラインストアやショッピングモールを通じて商品を販...

Shopifyストアの請求サイクルを更新する方法

国境を越えた電子商取引を行う一部のユーザーは、ショッピファイ独立した外国貿易ウェブサイトを構築して、...

情報フロー広告のやり方(勝つためのコツはたった1つ!情報フロー広告の黄金律)

一手が勝ち!情報フロー広告の黄金律デジタルメディアの急速な発展に伴い、情報フロー広告はブランドプロ...