از آنجایی که شرکتها به طور وسیع برای کشف بینشهای عملی بر حوزه علم داده تکیه میکنند، دادههای کمی نیز اهمیت زیادی پیدا میکنند.
هم در دانشگاهیان و هم در طیف وسیعی از صنایع، کاربردهای گسترده سیستمهای مبتنی بر هوش مصنوعی و الگوریتمهای یادگیری ماشین، نقش حیاتی این داده را گسترش داده است.
با وجود دادههای زیاد برای تجزیه و تحلیل، تخمین زده میشود که در دو سال گذشته نقاط داده بیشتری نسبت به تعداد ستارههای قابل مشاهده تولید شده است. با توجه به بسیاری از فناوریهای نوظهور که بر جمعآوری و تجزیه و تحلیل دادههای کمی تکیه میکنند، درک قوی از چیستی دادههای کمی و هدف آنها یکی از جذابترین مهارتها در بازار کار است.
دادههای کمی چیست؟
دادههای کمی دادههای هستند که دارای ویژگیهای عددی باشند. یکی از مهمترین کارکردهای دادههای کمی، پاسخ به سؤالاتی مانند «چند وقت» یا «چند تعداد» است. تنها راه پاسخ به این سؤالات، جمع آوری دادههایی است که قابل اندازهگیری هستند، به این معنی که می توان آنها را اندازهگیری کرد.
چرا دادههای کمی مهم است؟
دادههای کمی به دلیل تقاضای زیاد برای پیش بینیهایی که میتواند تولید کنند، اهمیت فزایندهای پیدا کردهاند. از پزشکی گرفته تا تولید، هر شرکت، دولت و تعداد زیادی از افراد به طور مرتب به شکلی از دادههای کمی متکی هستند.
نمونههای دادههای کمی
شما احتمالاً هر روز نمونههایی از دادههای کمی را میبینید. چند نمونه از دادههای کمی را بصورت زیر میتوان نام برد:
- اینچ باران در سال
- قد، وزن یا سن یک نفر
- تعداد روزها در هفته، ماه یا سال
- دماها
- نمرات آزمون
انواع دادههای کمی چیست؟
دادههای کمی به دو دسته گسسته و پیوسته تقسیم میشوند. در حالیکه تجسم برای درک آنچه در دستهبندی کمی قرار میگیرد میتواند آسان باشد، تفاوت بین دادههای گسسته و دادههای پیوسته کمی پیچیدهتر است. بهترین راه برای درک این تفاوت این است که دادههای گسسته را قابل شمارش و دادههای پیوسته را قابل اندازهگیری در نظر بگیریم.
•داده های گسسته
از آنجایی که همه دادههای قابل شمارش کمی هستند اما همه دادههای کمی قابل شمارش نیستند. دادههای گسسته، دادههای شمارش شده است. بدین معنی که هر نقطه داده قابل شمارش نه تنها کمی، بلکه گسسته است. چند نمونه از دادههای قابل شمارش را بصورت زیر میتوان نام برد:
- 10000 بازدید در یک صفحه وب
- 2000000 رای در یک انتخابات
- 100 لایک در اینستاگرام
• داده های پیوسته
سرعت باد ناشی از طوفان قبلی یا وزن بزرگ ترین کدو تنبل جهان نمونههایی از دادههای پیوسته است. دادههای پیوسته میتوانند اعشاری داشته باشند و چیزهای غیرقابل شمارش را نشان دهند.
با استفاده از موضوعات مشابه با دادههای گسسته بالا، میتوانید ببینید که چگونه دادههای پیوسته در اندازهگیری و توصیف آن متفاوت است. چند نمونه از دادههای پیوسته بشرح زیر است:
- سن فرد در طول یک سال
- 1.14 دقیقه صرف شده در یک صفحه وب
- میانگین سنی رای دهندگان: 35 تا 50 سال
- طول حلقه اینستاگرام بین 30 تا 45 ثانیه
موارد استفاده از دادههای کمی
دادههای کمی برای پیش بینی، حل مسائل و بهینه سازی فرآیندها و سیستم ها استفاده میشود. در اینجا چند نمونه از آنچه در عمل به نظر میرسد آورده شده است:
• ریاضیات
ریاضیات به شدت به دادههای کمی متکی است. مهندسان و ریاضیدانان روشهایی را برای تحقیقات پزشکی، تحقیقات بیولوژیکی و فرآیندهای صنعتی، از طریق تجزیه و تحلیل دادههای کمی توسعه دادهاند.
به عنوان مثال، استفاده ریاضی از دادههای کمی میتواند توسط یک آماردان باشد که با مجموعه دادههای بزرگی کار میکند تا تغییر وزن مجموعهای از افراد را تعیین کند و اینکه آیا بین دو وضعیت پزشکی مختلف همبستگی وجود دارد یا خیر. اینها چند مشکل هستند که تنها از طریق تجزیه و تحلیل دادههای کمی قابل تعیین هستند.
• تحقیقات بازار
تحقیقات بازار یکی از قابل فروش ترین کاربردهای دادههای کمی است. دانستن اینکه چه تعداد از مردم مایل به خرید یک محصول هستند، میتواند بینش قابل توجهی در مورد طراحی استراتژی بازاریابی توسط یک خرده فروش ارائه دهد.
با استفاده از پروفایلهای مشتریان بالقوه، محققان بازار ابزارهایی را برای درک بهتر رفتار مشتری ایجاد میکنند. برای بدست آوردن دادههای لازم برای ساخت این نوع گزارشها، ابزارهای زیادی مانند نظرسنجی برای جمعآوری دادههای کمی از یک جمعیت هدف استفاده میشود.
• پیش بینی آب و هوا
پیشبینی آب و هوا به یک فرآیند داده محور تبدیل شده است. با توجه به دقیقتر شدن روشها، میتوان بروزرسانیهای دقیقه به دقیقه را برای مردم مناطق آسیب دیده ارائه کرد و جان های بی شماری را نجات داد.
مراکز تحقیقاتی تغییرات فشار هوا، سرعت باد و دما را بررسی میکنند، هر یک از این منابع، دادههای کمی تولید میکنند که برای پیشبینی استفاده میشوند.
• مهندسی ترافیک
با ادامه گسترش شهرها، مهندسان عمران مجبورند از روشهای پیچیدهتری برای حفظ جریان ثابت ترافیک در محیطهای شهری با استفاده از مقادیر زیادی دادههای کمی استفاده کنند.
تعداد خودروهایی که از یک تقاطع عبور میکنند، سرعت متوسط، تعداد تصادفات در یک بازه زمانی معین، همه این معیارها نمونههایی از داده هایی هستند که میتوانند به مهندسان در پیشبینی کمیت کمک کنند.
• تجزیه و تحلیل سهام
شاخصهای سهام و تحلیل بازار همگی بر تحلیل دادههای کمی تکیه دارند. این تجزیه و تحلیل برای پیش بینی بازار سهام به عنوان یک کل و همچنین سهام جداگانه استفاده میشود. شاخصهای بازار از سراسر جهان دادههای کمی هستند که توسط شرکتهای تحلیل کننده بازار با استفاده از نقاط داده زیاد، گزارش میشوند. این نقاط دادهای که آنها دریافت میکنند از بخشهای کوچکتر بازار و مدلهای کمی شرکتها میآیند.
• پیش بینی های اقتصادی
در زمانی پیشبینی اقتصاددانان، حجم زیادی از دادهها برای پیشبینی دقیق مورد تجزیه و تحلیل آماری قرار میگیرند. این پیشبینی میتواند شامل مجموعه دادههایی از جمله قیمت کالاها، تولید ناخالص داخلی (GDP) یک کشور یا نرخ تورم باشد که سالها و گاهی دهها سال داده های کمی را در برگرفته است.
• تجزیه و تحلیل رسانه های اجتماعی
یکی از ابزارهای محرک بازاریابی در اقتصاد دیجیتال، رسانههای اجتماعی است. زمانی که کاربران اجازه استفاده از دادهها را میدهند، فعالیت آن دادههای کمی در آن پلتفرمها به شرکتهای رسانههای اجتماعی ارائه میشود.
باتوجه به دخیل بودن معیارهای زیادی در این فرآیند، تعداد بازدیدکنندگان یک وب سایت و نرخ پرش یک صفحه، تعداد بازدیدکنندگانی که یک سایت را تنها پس از مشاهده یک صفحه ترک میکنند، دو داده بسیار مهم هستند که برای استراتژی های محتوا بسازید.
تفاوت بین داده های کمی و داده های کیفی چیست؟
دادهها به دو دسته کمی و کیفی تقسیم میشوند. هر دسته طیف وسیعی از انواع دادهها را پوشش میدهد و در نوع اطلاعات جمعآوری شده متفاوت هستند. دادههای کمی مبتنی بر اطلاعات عددی که هم عینی و هم قابل اندازه گیری هستند بوده و دادههای کیفی مبتنی بر دادههای کاملاً غیر عددی هستند.
• عددی در مقابل توصیفی
یک نمونه از دادههای عددی در مقابل دادههای توصیفی، توصیه یک طراح گرافیک به یک برند جهت استفاده از نوعی پالت رنگ است. طراح ممکن است پس از نظرسنجی متوجه شود که بیش از 50 نفر روی یک تبلیغ کلیک کردهاند که یک رنگ خاص نسبت به سایر رنگ ها بود. آنها ممکن است بگویند که یک پالت با تصویر برند بهتر مطابقت دارد زیرا آن رنگ احساس خاصی را در مشتریان ایجاد میکند.
• قابل اندازه گیری در مقابل غیر قابل اندازه گیری
همچنین داده ها را می توان به دستههای قابل اندازه گیری و غیرقابل اندازهگیری تفکیک کرد. هر منبع دادهای نمیتواند دادههای کمی تولید کند.
برای مثال، بسیاری از بیمارستانها با استفاده از مقیاس استاندارد درد، مواردی مانند درد را به روشی مشابه ارزیابی میکنند. اینکه بیمار بگوید درد او “بد” یا “وحشتناک” است غیرقابل اندازه گیری می باشد. هر فردی تفسیر متفاوتی از این کلمات دارد که اندازه گیری آنها را دشوار میکند.
با این حال، با مقیاس عددی درد، بیمار میتواند درد خود را در مقیاسی از 0 تا 10 بر اساس توصیف مجموعه ای از 0، بدون درد و 10 شدیدترین دردی که تا به حال احساس کرده است، رتبه بندی کند.
استفاده از این مقیاس سوگیری اندازه گیری را در داده ها از بین می برد و آن را قابل اندازه گیری تر میکند.
• عینی در مقابل ذهنی
اکتشافات عینی اغلب میتوانند به توصیههای ذهنی منجر شوند. برای مثال، هواشناسان از مدلهایی استفاده میکنند که فاکتورهای عددی را در نظر می گیرند و قضاوت عینی در مورد محل وقوع طوفان انجام میدهند.
با استفاده از این داده های عینی، همان هواشناسان از داده های ذهنی برای ارائه توصیه هایی به ساکنان استفاده میکنند، مانند روش هایی که باید در موارد سیل یا بادهای خطرناک دنبال کنند.
• روش های جمع آوری داده ها
هر دو نوع داده های کمی و کیفی روشهای مشابهی برای جمع آوری داده ها دارند. مهم است که تفاوت ها را در نحوه طراحی یک نظرسنجی برای جمع آوری یک نوع داده به جای دیگری برجسته کنیم.
به عنوان مثال، یک نظرسنجی ممکن است از 20 نفر بخواهد تا بگویند یک طعم چه احساسی در آنها ایجاد کرده است. این نمونه ای از دادههای کیفی است. اگر نظرسنجی از همان 20 نفر بخواهد که “بله” یا “خیر” را در فرمی انتخاب کنند که از آنها میپرسد آیا طعم آن را دوست دارند، اکنون دادههای کمی ایجاد کرده است.
تفاوت در نحوه جمعآوری و گزارش دهی اطلاعات است: 20 نفر با توصیف های منحصربه فرد از یک طعم در مقابل تعدادی از افراد از یک جمعیت، یک یا گزینه دیگر را انتخاب میکنند. یکی پاسخهای متنوعی ارائه میدهد، در حالیکه دیگری تعدادی از افرادی را که پاسخی را انتخاب کردهاند ارائه میدهد.
فرآیند جمع آوری و تجزیه و تحلیل داده های کمی
• جمع آوری داده ها
روش های جمع آوری داده ها برای داده های کمی شامل ابزارهای زیادی است که بسته به صنعت متفاوت میباشد. موثرترین روش های جمع آوری داده های کمی، احتمال خطا را از معادله حذف می کند.
• اعتبار سنجی و پاکسازی داده ها
برای اینکه تجزیه و تحلیل داده ها دقیق باشد، داده ها باید هنگام وارد شدن و پاکسازی آنها اعتبار سنجی شوند تا اطمینان حاصل شود که در حین انجام تجزیه و تحلیل هیچ خطایی رخ نمیدهد.
در این مرحله، یک مسئله رایج که میتواند پیش بیاید، تخمینی برای سوگیری اندازهگیری است، که در آن نقاط داده زیادی را میتوان تخمین زد که نتایج نهایی را به طور قابل توجهی تغییر میدهد.
از آنجایی که اطلاعاتی که در حال تجزیه و تحلیل هستند برای اتخاذ تصمیمات تجاری اصلی ادامه مییابند، باید استانداردی از دقت رعایت شود.
• تحلیل داده ها
پس از پاک شدن داده ها؛ گام بعدی انجام تجزیه و تحلیل کامل داده ها است که به دو روش تحلیل توصیفی و تحلیل استنباطی انجام میشود.
ابزارهای تحلیل کمی
- SPSS (بسته آماری علوم اجتماعی)
- STATA
- برتری داشتن
- SAS
آیا تمایل به آشنایی با موقعیت شغلی تحلیلگر داده دارید؟اکنون بیاموزید.
آیا تمایل به آشنایی با موقعیت شغلی مهندس داده دارید؟اکنون بیاموزید.