داده های کمی چیست؟

از آنجایی که شرکت‌ها به طور وسیع برای کشف بینش‌های عملی بر حوزه علم داده تکیه می‌کنند، داده‌های کمی نیز اهمیت زیادی پیدا می‌کنند.

هم در دانشگاهیان و هم در طیف وسیعی از صنایع، کاربردهای گسترده سیستم‌های مبتنی بر هوش مصنوعی و الگوریتم‌‌های یادگیری ماشین، نقش حیاتی این داده ‌را گسترش داده است.

با وجود داده‌های زیاد برای تجزیه و تحلیل، تخمین زده می‌شود که در دو سال گذشته نقاط داده بیشتری نسبت به تعداد ستاره‌های قابل مشاهده تولید شده است. با توجه به بسیاری از فناوری‌های نوظهور که بر جمع‌‌آوری و تجزیه و تحلیل داده‌‌های کمی تکیه می‌‌کنند، درک قوی از چیستی داده‌‌های کمی و هدف آن‌ها یکی از جذاب‌‌ترین مهارت‌‌ها در بازار کار است.

داده‌های کمی چیست؟

داده‌های کمی داده‌های هستند که دارای ویژگی‌های عددی باشند. یکی از مهم‌‌ترین کارکردهای داده‌‌های کمی، پاسخ به سؤالاتی مانند «چند وقت» یا «چند تعداد» است. تنها راه پاسخ به این سؤالات، جمع آوری داده‌هایی است که قابل اندازه‌گیری هستند، به این معنی که می توان آنها را اندازه‌گیری کرد.

چرا داده‌های کمی مهم است؟

داده‌‌های کمی به دلیل تقاضای زیاد برای پیش ‌بینی‌هایی که می‌‌تواند تولید کنند، اهمیت فزاینده‌‌ای پیدا کرده‌اند. از پزشکی گرفته تا تولید، هر شرکت، دولت و تعداد زیادی از افراد به طور مرتب به شکلی از داده‌‌های کمی متکی هستند.

نمونه‌های داده‌های کمی

شما احتمالاً هر روز نمونه‌هایی از داده‌های کمی را می‌بینید. چند نمونه از داده‌های کمی را بصورت زیر می‌توان نام برد:

  • اینچ باران در سال
  • قد، وزن یا سن یک نفر
  • تعداد روزها در هفته، ماه یا سال
  • دماها
  • نمرات آزمون

انواع داده‌های کمی چیست؟

داده‌های کمی به دو دسته گسسته و پیوسته تقسیم می‌شوند. در حالیکه تجسم برای درک آنچه در دسته‌بندی کمی قرار می‌گیرد می‌تواند آسان باشد، تفاوت بین داده‌های گسسته و داده‌های پیوسته کمی پیچیده‌‌تر است. بهترین راه برای درک این تفاوت این است که داده‌های گسسته را قابل شمارش و داده‌های پیوسته را قابل اندازه‌گیری در نظر بگیریم.

داده های گسسته

از آنجایی که همه داده‌های قابل شمارش کمی هستند اما همه داده‌های کمی قابل شمارش نیستند. داده‌های گسسته، داده‌های شمارش شده است. بدین معنی که هر نقطه داده قابل شمارش نه تنها کمی، بلکه گسسته است. چند نمونه از داده‌های قابل شمارش را بصورت زیر می‌توان نام برد:

  • 10000 بازدید در یک صفحه وب
  • 2000000 رای در یک انتخابات
  • 100 لایک در اینستاگرام

داده های پیوسته

سرعت باد ناشی از طوفان قبلی یا وزن بزرگ ‌ترین کدو تنبل جهان نمونه‌هایی از داده‌‌های پیوسته است. داده‌های پیوسته می‌توانند اعشاری داشته باشند و چیزهای غیرقابل شمارش را نشان دهند.

با استفاده از موضوعات مشابه با داده‌های گسسته بالا، می‌توانید ببینید که چگونه داده‌های پیوسته در اندازه‌گیری و توصیف آن متفاوت است. چند نمونه از داده‌های پیوسته بشرح زیر است:

  • سن فرد در طول یک سال
  • 1.14 دقیقه صرف شده در یک صفحه وب
  • میانگین سنی رای دهندگان: 35 تا 50 سال
  • طول حلقه اینستاگرام بین 30 تا 45 ثانیه

موارد استفاده از داده‌های کمی

داده‌های کمی برای پیش بینی، حل مسائل و بهینه سازی فرآیندها و سیستم ها استفاده می‌شود. در اینجا چند نمونه از آنچه در عمل به نظر می‌رسد آورده شده است:

ریاضیات

ریاضیات به شدت به داده‌های کمی متکی است. مهندسان و ریاضیدانان روش‌هایی را برای تحقیقات پزشکی، تحقیقات بیولوژیکی و فرآیندهای صنعتی، از طریق تجزیه و تحلیل داده‌های کمی توسعه داده‌اند.

به عنوان مثال، استفاده ریاضی از داده‌‌های کمی می‌‌تواند توسط یک آماردان باشد که با مجموعه داده‌های بزرگی کار می‌‌کند تا تغییر وزن مجموعه‌‌ای از افراد را تعیین کند و اینکه آیا بین دو وضعیت پزشکی مختلف همبستگی وجود دارد یا خیر. اینها چند مشکل هستند که تنها از طریق تجزیه و تحلیل داده‌های کمی قابل تعیین هستند.

تحقیقات بازار

تحقیقات بازار یکی از قابل فروش ترین کاربردهای داده‌های کمی است. دانستن اینکه چه تعداد از مردم مایل به خرید یک محصول هستند، می‌تواند بینش قابل توجهی در مورد طراحی استراتژی بازاریابی توسط یک خرده فروش ارائه دهد.

با استفاده از پروفایل‌های مشتریان بالقوه، محققان بازار ابزارهایی را برای درک بهتر رفتار مشتری ایجاد می‌کنند. برای بدست آوردن داده‌‌های لازم برای ساخت این نوع گزارش‌‌ها، ابزارهای زیادی مانند نظرسنجی برای جمع‌‌آوری داده‌‌های کمی از یک جمعیت هدف استفاده می‌‌شود.

پیش بینی آب و هوا

پیش‌بینی آب و هوا به یک فرآیند داده محور تبدیل شده است. با توجه به دقیق‌تر شدن روش‌‌ها، می‌‌توان بروزرسانی‌‌های دقیقه به دقیقه را برای مردم مناطق آسیب‌ دیده ارائه کرد و جان ‌های بی ‌شماری را نجات داد.

مراکز تحقیقاتی تغییرات فشار هوا، سرعت باد و دما را بررسی می‌‌کنند، هر یک از این منابع، داده‌های کمی تولید می‌‌کنند که برای پیش‌‌بینی استفاده می‌‌شوند.

مهندسی ترافیک

با ادامه گسترش شهرها، مهندسان عمران مجبورند از روش‌های پیچیده‌تری برای حفظ جریان ثابت ترافیک در محیط‌های شهری با استفاده از مقادیر زیادی داده‌های کمی استفاده کنند.

تعداد خودروهایی که از یک تقاطع عبور می‌کنند، سرعت متوسط، تعداد تصادفات در یک بازه زمانی معین، همه این معیارها نمونه‌هایی از داده هایی هستند که می‌توانند به مهندسان در پیش‌بینی کمیت کمک کنند.

تجزیه و تحلیل سهام

شاخص‌های سهام و تحلیل بازار همگی بر تحلیل داده‌های کمی تکیه دارند. این تجزیه و تحلیل برای پیش بینی بازار سهام به عنوان یک کل و همچنین سهام جداگانه استفاده می‌شود. شاخص‌‌های بازار از سراسر جهان داده‌های کمی هستند که توسط شرکت‌‌های تحلیل کننده بازار با استفاده از نقاط داده زیاد، گزارش می‌‌شوند. این نقاط داده‌ای که آنها دریافت می‌کنند از بخش‌های کوچکتر بازار و مدل‌های کمی شرکت‌ها می‌آیند.

پیش بینی های اقتصادی

در زمانی پیش‌بینی اقتصاددانان، حجم زیادی از داده‌‌ها برای پیش‌‌بینی دقیق مورد تجزیه و تحلیل آماری قرار می‌گیرند. این پیش‌بینی می‌‌تواند شامل مجموعه داده‌هایی از جمله قیمت کالاها، تولید ناخالص داخلی (GDP) یک کشور یا نرخ تورم باشد که سال‌‌ها و گاهی ده‌ها سال داده‌ های کمی را در برگرفته است.

تجزیه و تحلیل رسانه های اجتماعی

یکی از ابزارهای محرک بازاریابی در اقتصاد دیجیتال، رسانه‌های اجتماعی است. زمانی که کاربران اجازه استفاده از داده‌ها را می‌دهند، فعالیت‌ آن داده‌های کمی در آن پلتفرم‌‌ها به شرکت‌‌های رسانه‌‌های اجتماعی ارائه می‌‌شود.

باتوجه به دخیل بودن معیارهای زیادی در این فرآیند، تعداد بازدیدکنندگان یک وب سایت و نرخ پرش یک صفحه، تعداد بازدیدکنندگانی که یک سایت را تنها پس از مشاهده یک صفحه ترک می‌کنند، دو داده بسیار مهم هستند که برای استراتژی های محتوا بسازید.

تفاوت بین داده های کمی و داده های کیفی چیست؟

داده‌ها به دو دسته کمی و کیفی تقسیم می‌شوند. هر دسته طیف وسیعی از انواع داده‌ها را پوشش می‌دهد و در نوع اطلاعات جمع‌آوری شده متفاوت هستند. داده‌های کمی مبتنی بر اطلاعات عددی که هم عینی و هم قابل اندازه گیری هستند بوده و داده‌های کیفی مبتنی بر داده‌های کاملاً غیر عددی هستند.

عددی در مقابل توصیفی

یک نمونه از داده‌های عددی در مقابل داده‌های توصیفی، توصیه یک طراح گرافیک به یک برند جهت استفاده از نوعی پالت رنگ است. طراح ممکن است پس از نظرسنجی متوجه شود که بیش از 50 نفر روی یک تبلیغ کلیک کرده‌اند که یک رنگ خاص نسبت به سایر رنگ ها بود. آنها ممکن است بگویند که یک پالت با تصویر برند بهتر مطابقت دارد زیرا آن رنگ احساس خاصی را در مشتریان ایجاد می‌کند.

قابل اندازه گیری در مقابل غیر قابل اندازه گیری

همچنین داده ها را می توان به دسته‌های قابل اندازه‌ گیری و غیرقابل اندازه‌گیری تفکیک کرد. هر منبع داده‌ای نمی‌تواند داده‌های کمی تولید کند.

برای مثال، بسیاری از بیمارستان‌ها با استفاده از مقیاس استاندارد درد، مواردی مانند درد را به روشی مشابه ارزیابی می‌کنند. اینکه بیمار بگوید درد او “بد” یا “وحشتناک” است غیرقابل اندازه گیری می باشد. هر فردی تفسیر متفاوتی از این کلمات دارد که اندازه گیری آنها را دشوار می‌کند.

با این حال، با مقیاس عددی درد، بیمار می‌تواند درد خود را در مقیاسی از 0 تا 10 بر اساس توصیف مجموعه ‌ای از 0، بدون درد و 10 شدیدترین دردی که تا به حال احساس کرده است، رتبه ‌بندی کند.

استفاده از این مقیاس سوگیری اندازه گیری را در داده ها از بین می برد و آن را قابل اندازه گیری تر می‌کند.

عینی در مقابل ذهنی

اکتشافات عینی اغلب می‌توانند به توصیه‌های ذهنی منجر شوند. برای مثال، هواشناسان از مدل‌‌هایی استفاده می‌‌کنند که فاکتورهای عددی را در نظر می‌ گیرند و قضاوت عینی در مورد محل وقوع طوفان انجام می‌‌دهند.

با استفاده از این داده ‌های عینی، همان هواشناسان از داده ‌های ذهنی برای ارائه توصیه ‌هایی به ساکنان استفاده می‌‌کنند، مانند روش ‌هایی که باید در موارد سیل یا بادهای خطرناک دنبال کنند.

روش های جمع آوری داده ها

هر دو نوع داده های کمی و کیفی روش‌های مشابهی برای جمع آوری داده ها دارند. مهم است که تفاوت ‌ها را در نحوه طراحی یک نظرسنجی برای جمع ‌آوری یک نوع داده به جای دیگری برجسته کنیم.

به عنوان مثال، یک نظرسنجی ممکن است از 20 نفر بخواهد تا بگویند یک طعم چه احساسی در آنها ایجاد کرده است. این نمونه ای از داده‌های کیفی است. اگر نظرسنجی از همان 20 نفر بخواهد که “بله” یا “خیر” را در فرمی انتخاب کنند که از آنها می‌‌پرسد آیا طعم آن را دوست دارند، اکنون داده‌‌های کمی ایجاد کرده است.

تفاوت در نحوه جمع‌‌آوری و گزارش‌ دهی اطلاعات است: 20 نفر با توصیف ‌های منحصربه ‌فرد از یک طعم در مقابل تعدادی از افراد از یک جمعیت، یک یا گزینه دیگر را انتخاب می‌‌کنند. یکی پاسخ‌های متنوعی ارائه می‌دهد، در حالیکه دیگری تعدادی از افرادی را که پاسخی را انتخاب کرده‌اند ارائه می‌دهد.

فرآیند جمع آوری و تجزیه و تحلیل داده های کمی

جمع آوری داده ها

روش های جمع آوری داده ها برای داده های کمی شامل ابزارهای زیادی است که بسته به صنعت متفاوت میباشد. موثرترین روش های جمع آوری داده های کمی، احتمال خطا را از معادله حذف می کند.

اعتبار سنجی و پاکسازی داده ها

برای اینکه تجزیه و تحلیل داده ها دقیق باشد، داده ها باید هنگام وارد شدن و پاکسازی آنها اعتبار سنجی شوند تا اطمینان حاصل شود که در حین انجام تجزیه و تحلیل هیچ خطایی رخ نمی‌دهد.

در این مرحله، یک مسئله رایج که می‌تواند پیش بیاید، تخمینی برای سوگیری اندازه‌گیری است، که در آن نقاط داده زیادی را می‌توان تخمین زد که نتایج نهایی را به طور قابل توجهی تغییر می‌دهد.

از آنجایی که اطلاعاتی که در حال تجزیه و تحلیل هستند برای اتخاذ تصمیمات تجاری اصلی ادامه می‌یابند، باید استانداردی از دقت رعایت شود.

تحلیل داده ها

پس از پاک شدن داده ها؛ گام بعدی انجام تجزیه و تحلیل کامل داده ها است که به دو روش تحلیل توصیفی و تحلیل استنباطی انجام می‌شود.

ابزارهای تحلیل کمی

  • SPSS (بسته آماری علوم اجتماعی)
  • STATA
  • برتری داشتن
  • SAS

آیا تمایل به آشنایی با موقعیت شغلی تحلیلگر داده دارید؟اکنون بیاموزید.

آیا تمایل به آشنایی با موقعیت شغلی مهندس داده دارید؟اکنون بیاموزید.