手があれば初心者でもデータ分析ができる

手があれば初心者でもデータ分析ができる
データ分析に関しては、多くの人が過度に複雑なモデルやツールに夢中になり、核心部分を無視する傾向があります。
「迷信を打ち破る」ために、私は分かりやすく実践的なベビーシッターガイドを書くことにしました。

量子力学ではなくデータサイエンス
言語やツールがどれだけ洗練されていても、データ分析ではデータの取得、データのクリーニング、データの理解という3つのポイントを避けることはできません。
ホットな検索は非実用的で理解しがたいものが多いので難しいです。
次に、ケースを使用してこの記事を正式に開始してみましょう。
 案例背景:你需要为景区设计文创产品,但不清楚哪类文创产品受欢迎。你想通过分析文创产品的类型、价格和销量等数据来获取灵感。比如,哪些类型的文创产品卖得最好?价格与销量之间是否存在相关性? 数据需求:包含名称、分类、价格、销量、用途、人群、材质、风格。销量排名前100个商品数据,

生データを抽出し、無効な要件を削減します。
私たちは、プラットフォームがデータを取得するのが遅すぎる、または開発に多くの困難があるのではないかと常に感じていますが、実際には、プラットフォームは役に立たないデータを要求しすぎています。
リクエストをするときは、自分自身に何度も問いかけてください。それは本当に必要ですか?代替方法はありますか?
次に、オリジナルデータ、そしてオリジナルデータの少ないものを要求してください。
 
データ抽出の範囲を制御することで、冗長な情報を処理するための計算および手作業の負担を軽減できます。そして元のデータは簡単に結合できますが、結果データは抽出が複雑なだけでなく、処理も困難です
データを取得した後、生のデータは乱雑であることが多いため、急いでデータを分析しないでください。
データがクリーンアップされていない場合、その後の分析結果が歪んだり間違ったりする可能性があります。データが「クリーン」な場合にのみ、分析ツールとモデルが機能します。
次に、データを「読み取り可能」かつ「使用可能」にするためにデータをクリーンアップする方法を見てみましょう。

理解できるまで掃除すれば、機械も理解できるようになります
ツールレベルでは、Feishu の多次元テーブルを使用することをお勧めします。これにより、後続のグラフィックスがより便利になります。
1. データのクリーニング
まず、 「故宮」、「文化と創造」、「公式旗艦店」などの無駄なキーワードを削除します。
クリーニング後は、読み取りエクスペリエンスが向上するだけでなく、機械がデータを処理するために必要な計算能力も削減されます。
必要に応じて、空の値を埋めたり、ラベル形式を統一したりして、データが明確で標準化されていることを確認するなど、他のクリーニング方法を追加できます。
2. データ分類
2-1.特徴抽出
2 番目のステップでは、貴重な特徴を抽出する必要があります。たとえば、商品名に祭り、目的、人々のグループなどが含まれる場合です。
最も簡単な方法は、スマート ラベリングに Feishu のフィールド ショートカットを使用することですが、標準化しやすいこのタイプのデータの場合は、関数抽出の方が適しています。
たとえば、 REGEXEXTRACTALL関数:
 REGEXEXTRACTALL( [商品标题], "教师节礼物|生日礼物|乔迁礼物|儿童节礼物|结婚礼物|创意礼物|伴手礼" )

この機能は、商品タイトルから一致するギフトタイプを抽出し、「目的タグ」に変換します。

タグを抽出した後は、必ず関連キーワードを再度クリアしてください。
2-2.数値による分類
カテゴリの価格分布を分析する場合、価格データがまばらだと問題を効果的に特定できません。
しかし、価格を範囲に絞り込むと、データが集中し、分析しやすくなります。
 IFS( [商品价格] <= 50 , "50以下" ,  [商品价格] <= 100 , "100以下" ,  [商品价格] <= 200 , "200以下" ,  [商品价格] <= 500 , "500以下" ,  [商品价格] <= 10000 , "500以上" )
AI以外にも、 IFS関数を使うとより便利です。価格マッチング範囲内の値を対応する間隔に分類します。
クリーニングと分類を通じて、人間と機械の両方が理解できるようになり、分析の次のステップに進むことができます。

分析: ネジを締めて、ロケットを作らない

ヘルプ!上記の原文は24,000回閲覧されています
分析によく使用されるチャートは、トレンド チャート、円グラフ、棒グラフ、バー チャート、ワード クラウドです。問題の 80% は処理できるので、ポーターの 5 つの力について心配する必要はありません...
トレンドの変動により問題をより早く発見することができ、割合と変化により重要な問題に焦点を当てることができます。複合チャートのクロス分析とドリルダウン分析により、問題をさらに特定できます。
分析に戻りましょう。
01. 文化・創造製品の種類、販売量、価格
円グラフを分析すると、売上高シェアとカテゴリーシェアがほぼ一致していることがわかります。
しかし、「その他」のカテゴリーでは紙袋の販売数が2万個であり、データが歪んでいた。
そこで、紙袋商品を除外し、装飾品、文房具、食器など主要カテゴリーの売上を再度分析しました
カテゴリーは主に装飾品(29.4%)、文房具(22.6%)、食器(20.17%)に集中しており、カテゴリー数が多いものが売れ筋でもある。そのうち、平均価格が最も高かったのは食器類(210元)で、最も低かったのは文房具類(76元)だった。
02. 販売量と価格の関係

後続の分析のために製品をカテゴリ別に絞り込みます。右上隅のボタンに気づきましたか? Feishu ドキュメントによって生成されたチャートはインテリジェントに分析できるため、効率をさらに向上させることができます。
洞察

さまざまな商品カテゴリーの中で、調理器具は最も高い価格(210)ですが、販売量は最も高くありません(877)。

ジュエリー製品(154)は価格が中程度で、販売量(506)は比較的低い。

分析する

価格と販売量の相関関係は弱い。食器を例に挙げてみましょう。価格は比較的高いですが、販売量は相当なものです。ジュエリーの価格は中程度ですが、販売量は比較的少ないです。これは、価格が販売量を決定する唯一の要因ではなく、製品の機能、市場での位置付けなどによって影響を受ける可能性があることを示しています。
03. 使用状況、人口、材質が価格と売上に与える影響

洞察:

教師の日ギフトの販売数量は1,012個となり、全用途中最多となった。

こどもの日のギフトの価格はたったの35と比較的安価です。

分析:

使用量、価格、販売量の間には一定の相関関係があります。例えば、より高価な中秋節のギフトの販売数は 700 個であるのに対し、より安価な子供の日のギフトの販売数は 400 個でした。教師の日のギフトは最も高価ではありませんが、市場の需要に合致しているか、プロモーションがより効果的であるため、売上が目立っています。

 

全体的に、価格と販売量は正の相関関係にあり、価格の高い製品は比較的販売量が多い傾向があります。

使用状況をセグメント化すると、価格と販売量の相関関係についての結論は異なります。同じ方法を使用して、群衆、素材、創造性の影響を検証できます。

タグに基づいて生成されたワードクラウドには非常に奇妙で創造的な部分があり、非標準のデータは直接抽出に適していないことも示しています。

最後のステップは、提案を出力することです。分析には意見や提案が必要です。

観点:

1) 装飾品、文具、食器類が好調で、大量生産され、販売も好調で、装飾品の販売量が29.4%と最も多かった。

2) 販売量と価格の関係は複雑で、全体的に強い相関関係はありません。調理器具などの一部の高価値製品はかなりの売上を上げていますが、他のカテゴリでは相関特性は見られません。

3) 祭りの影響が顕著:教師の日の販売(1,012個)が明らかにリードし、より高価な中秋節の贈り物も好調でした(700個)。特定の祭りは売上に大きな影響を与えます。

4) 群衆とクリエイティブのデータは参考としてあまり意味がありません。SEO ではタイトルのターゲット ユーザーが部分的にしか明確に定義されていないため、クリエイティブのワード クラウドは比較的混沌としています。ターゲットを絞った検索を行うには、カテゴリ内の上位 5 つの製品を選択することをお勧めします

 

提案:

1)カスタマイズのコストを考慮すると、装飾と文房具のカテゴリに重点を置くことをお勧めします。

2) 単語の出現頻度に基づき、季節や休日の変動による売上への影響を軽減するために、旅行用バッグや室内装飾品など、幅広い層を対象とした日常的な製品のデザインを優先することが推奨されます。

3) さらに、クリスマス冷蔵庫マグネットなど、休日をテーマにした低コストで生産が速い製品を開発することもできます。



やっと
ビジネスの量が一定レベルに達するまでは、複雑な用語にあまり力を入れないでください。高いところに立つということは必ずしも遠くまで見渡せるということではありません。
そのレベルに達したら、専任のデータアナリストも雇ってこの作業を行うことになると思います。

<<:  TaobaoとWeChat Payが仲良くなってAlipayが嫉妬?

>>:  借金とギャンブルで、広正眼科は「資本迷路」に深く陥っている

推薦する

情報フロー広告のデメリット(主流の情報フロー広告チャネルは何ですか?それらはどの程度効果的ですか?)

主流の情報フロー広告チャネルは何ですか?パフォーマンスはどうですか?市場における主流の情報フロー広告...

高級ワインが堅調に推移し、中級ワインが成長に貢献しました!水景坊は3四半期連続で売上増を達成

水景坊は長期戦略を着実に推進し、今年の第1四半期から第3四半期にかけて安定した成長を維持した。水景坊...

コンビニ食品売上データ(2023年コンビニ食品業界市場分析:全体の売上は減少、一部ブランドは反撃)

2023年のコンビニ食品業界市場の分析:全体的な売上は減少しているが、一部のブランドは復活している...

化粧品ブランドのマーケティング計画(ネットセレブ経済が流行している中、化粧品ブランドはネットセレブマーケティングでどのように成功できるのか?)

インターネットセレブ経済が人気を博す中、化粧品ブランドはどのようにしてインターネットセレブマーケティ...

母子用品のマーケティング方法(母子分野でテクノロジー製品をどのようにマーケティングするか?これらに注意する必要があります)

母子医療分野でテクノロジー製品をどのように販売するか?これらに注意する必要があります女性にとって服を...

不動産ブランドマーケティングプランニング(不動産業者が押さえておくべきマーケティングプランニングの10のポイント)

不動産業界の専門家が習得すべきマーケティング計画の10のポイントある有名な不動産会社のCEOはこう言...

SEMプロモーションプラン(SEMプロモーションマーケティングプラン)

SEMプロモーションマーケティングプラン1. SEM プロモーションとマーケティング計画プロモーシ...

春節プロモーション計画(2023年卯年春節マーケティングキャンペーン計画)

2023年卯年春節マーケティング計画 2023年1月22日は卯年の春節です。銅鑼と太鼓の音とともに...

年俸60万元の製品担当ディレクターが解雇された。

例えば、上海にいる私の友人は、製品関連の仕事を5年間続けた後、最終的に年収60万元の製品ディレクター...

コンテンツ運用データ(Toutiao運用の秘密:実用的な情報が満載、データ分析スキルも公開)

Toutiao 運営の秘密: 実用的な情報が満載、データ分析スキルが明らかにはじめに:見出しの操作...

CPU売上ランキング(デスクトップCPUラダーチャート2024年3月新版パソコンCPU性能ランキング一目でわかる)

デスクトップCPUラダーチャート2024年3月新版コンピュータCPU性能ランキング一目でわかるCPU...

Weeblyのウェブサイトページを開いたときに空白が表示される問題の解決策

最も一般的な Weebly エラーの 1 つは、Weebly Web サイトのページが空白で開くこと...

Rocky Linux システムのインストール グラフィック設定チュートリアル

Rocky Linux は、Entepise Linux と 100% BUG 互換性を持つように設...