データはどこから来ますか、そしてそのデータとは何ですか?
「データ」自体は空気のように存在し、霞の出現によってのみ私たちの心の中に明確に現れるのです。数百万年前、いや数億年前、人類がこの青い惑星にまだ現れていなかった頃から、データは常に存在し、人類の英知が突然ひらめいて真の意味が与えられるのを待っていました。 この高性能な計算機が登場する以前から、人々は「データ」をより具体的かつ簡単に数えられるようにするために、何万回もの探索を行ってきました。石器や骨片、木の幹など、身の回りにある硬い物体を、質感を彫刻して実物の表情を表現するための媒体として使うのは、自然なスタートのように思えます。 アフリカのウガンダとザイールの国境にあるイシャンゴ漁村で1960年に発掘された数え骨「イシャンゴ骨」は、1万年前の新石器時代初期のイシャンゴ族の作品であり、数え方が刻まれた最古の物体です。古代の部族の人々は、これらのくぼみを使って、日々の取引活動、物資の備蓄、大小の出来事を記録し、基本的な算術計算を行っていました。 イシャンゴ・ボーンズ 今日のコンピュータが普及した社会では、データがさらに重要になっています。ビッグデータの時代に生きる私たちは、データの重要性をすでに認識しています。では、データとは何でしょうか?単純に見える問題が、実は最も複雑な場合がよくあります。 今日、データのより一般的な定義は、多くの場合、コンピューターネイティブの観点からのものです。客観的な物事を観察し、測定し、推測し、統一された基準または非統一された基準に従って結果を記録します。これらのレコードは多かれ少なかれデータです。これらのデータは未処理であると予想され、元のオブジェクトの元の外観と形状を非常によく表します。 データ管理協会 (DAMA) も、データはテキスト、数字、グラフィック、画像、音声、ビデオの形式で事実を表現したものであると考えています。言い換えれば、データは事実を反映する必要があり、それはデータ収集技術とデータ解釈能力によって制限されます。これは理想かもしれません。 データは存在を表すものであり、存在は物質的、精神的を含め人間の意志に左右されるものではありません。物質的なもので言えば、自然界には風、雨、雷、稲妻、人間、動物といった存在が存在します。これらは明確に認識され、デジタル化するのに非常に便利です。精神面では、喜びや悲しみといった人の感情を主観的に何度も計測し、データ化することができます。 多くの場合、データはエンティティに適用されるようであり、ほとんどのデータはエンティティを特徴としています。エンティティを記述する際には体系的なデータが必要になることが多く、単一のデータはあまり一般的ではないようです。エンティティを記述する大量のデータを取得すると、量的な変化から質的な変化が生じることがよくあります。 データの収集は「情報」となり、情報の処理は「知識」となり、知識を適用すると「知恵」が生まれ、データは下位レベルの駆動力となります。これらは密接に結びついて進歩的であり、「DIKW ピラミッド」を形成しています。 データ・情報・知識変換モデル 東洋の知恵を見てみましょう。中国語の「データ」の語源はさておき、その文字通りの意味を見てみましょう。 「数字」には2つの意味があります。 1 つは、データでは、人の年齢や山の高さなどの事実を記録するために数字が使用されることが多いということです。もう 1 つのレベルは、数学的手法を使用して統計を実行し、最終的に、ある集団の平均年齢や、ある集団の山頂の平均高さなどの記録された結果を取得することです。どちらも、数学の平均の概念を適用しています。 「据」という文字を見ると、日常生活における領収書のことだと分かります。領収書は何かが起こったことの証拠です。それらは人間の脳の欠点を補い、時間を固定化します。したがって、「据」は事実です。データは事実のデジタル証拠です。 冒頭で述べたように、デジタル時代の私たちにとって、データは本当に空気のようなもので、もはやその概念について考える必要はありません。 私たちが毎日デジタル化されたコミュニティに住み、活気のあるスマートオフィスや商業エリアで働き、デジタルライフの利便性を享受していると、すべてがとても自然に思えますが、これはモノのインターネット時代の新しいデータエコロジーでもあります。 モノのインターネット時代のデータ よりよく考えることはより良いスタートにつながります。データの概念についての理解をさらに深める必要があります。データに関心のある方は、コメント欄にメッセージを残して、データについてどう考えているかお話しください。 著者: Li Qinghui (Xinba) データ製品の専門家、データ製品チームの責任者。データガバナンス、データ分析、データベース運用に優れている。 Python 書籍「Pandas in Simple Terms」の著者。 この記事はもともと、Everyone is a Product Manager で @一個データ人的私存地 によって公開されました。無断転載禁止 タイトル画像はCC0ライセンスに基づいてUnsplashから引用しています |
<<: 運用データのソース(純粋な乾物!トラフィックソースを分析してプラットフォームの運用結果を改善します)
>>: 運行データ監視(菏沢聯通は運行車両監視プラットフォームを構築し、車両管理レベルと効率を向上)
レストランのブランド紹介文はどのように書けばいいですか?ケータリング業界は、さまざまなブランドが次々...
新たなファンマーケティングモデルを模索する燕京ビールは、業界にとって良い例を示していますファンマーケ...
広告だけでなく、ブランドがマーケティングに Facebook を活用する 5 つの方法Faceboo...
hed コマンドは、1 つ以上のファイルの最初の行 (デフォルトは 0 行目) を印刷するか、データ...
618年の超高級携帯電話販売トップ10が発表:Huaweiモデル5機種、Appleモデル4機種【C...
Ubuntuは、セキュリティと安定性に優れた主流のLinuxディストリビューションの一つで、国内外の...
オムニメディアオペレーターとは何ですか?証明書を取得するにはどうすればよいですか?キャリアの見通しは...
ユーザー運営、商品運営、コミュニティ運営、アクティビティ運営の関係はどのようなものですか?オペレーシ...
マーケティングはクロスプラットフォームである必要があり、WeChatトラフィックはより正確であるマー...
ByteDance のオペレーション面接の質問にどう答えればいいですか?まずはタイトルを見てみまし...
起業家精神:インターネットやデジタル製品の運用と宣伝方法に関する経験の要約インターネットとデジタル...
電気オーブン皿や吊り鉄などはどのメーカーが良いでしょうか?小型家電22種販売ブランドランキング電気...
ビジネスを理解しておらず、指標が明確ではありませんか?これらの40セットのビジュアル大画面テンプレー...
農産物ブランドマーケティングの投入産出比率を向上させる方法投入産出比率は、ブランドマーケティングの効...
おすすめの Google SEO ツール 10 選: ウェブサイトの最適化に役立つ 10 個のツール...