شناسایی داده‌ها برای تحلیل

متن فیلم

در این مرحله، شما درک درستی از مشکل و نتیجه مطلوب دارید - می‌دونید «کجا هستید» و «میخوایدکجا باشید». همچنین شما یک معیار دارید که به خوبی تعریف شده- می‌دونید «چه چیزی اندازه‌گیری میشه» و «چطور اندازه‌گیری میشه». گام بعدی برای شما شناسایی داده‌هایی است که برای مورد استفاده خودتون نیاز دارید. فرآیند شناسایی داده‌ها با تعیین اطلاعاتی که می‌خواهید جمع‌آوری کنید آغاز می‌شود. در این مرحله، شما در مورد اطلاعات خاص مورد نیاز خود و منابع احتمالی این داده‌ها تصمیم می‌گیرید. اهداف شما پاسخ به این سؤالات را تعیین می‌کنند. بیایید به عنوان مثال یک شرکت تولیدی را در نظر بگیریم که می‌خواهد بر اساس گروه سنی که بیشترین محصولات آن‌ها را خریداری می‌کند، کمپین‌های بازاریابی هدفمند ایجاد کند. هدف آن‌ها طراحی برنامه‌هایی است که بیشترین جذابیت را برای این بخش داشته باشد و آن‌ها را تشویق کند تا دوستان و همسالان خود را برای خرید این محصولات، بیشتر تحت تأثیر قرار دهند. بر اساس این مورد استفاده، برخی از اطلاعات واضحی که شناسایی خواهید کرد شامل مشخصات مشتری، سابقه خرید، موقعیت مکانی، سن، تحصیلات، حرفه، درآمد و وضعیت تأهل است. برای اطمینان از اینکه بینش بیشتری در مورد این بخش به دست می‌آورید، می‌توانید تصمیم بگیرید که داده‌های شکایات مشتریان را برای این بخش جمع‌آوری کنید تا نوع مشکلاتی که با آن مواجه هستند را درک کنید، زیرا این امر می‌تواند آن‌ها را از توصیه محصولات شما منصرف کند. برای اینکه بدانید چقدر از حل مشکلات خود راضی بوده‌اند، می‌توانید رتبه‌بندی‌ها را از نظرسنجی‌های خدمات مشتری جمع‌آوری کنید. با برداشتن یک گام به جلو، ممکن است بخواهید بفهمید که این مشتریان چگونه در مورد محصولات شما در رسانه‌های اجتماعی صحبت می‌کنند و چه تعداد از ارتباطات آن‌ها در این بحث‌ها با آن‌ها درگیر می‌شوند، به عنوان مثال، لایک‌ها، اشتراک‌گذاری‌ها و نظراتی که پست‌های آن‌ها دریافت می‌کند. مرحله بعدی در این فرآیند، تعریف برنامه‌ای برای جمع‌آوری داده‌ها است. شما باید یک بازه زمانی برای جمع‌آوری داده‌هایی که شناسایی کرده‌اید، تعیین کنید. برخی از داده‌های مورد نیاز شما ممکن است به صورت مداوم و برخی دیگر در یک دوره زمانی مشخص مورد نیاز باشند. به عنوان مثال، برای جمع‌آوری داده‌های بازدیدکنندگان وب‌سایت، ممکن است لازم باشد اعداد را به صورت بلادرنگ به‌روزرسانی کنید. اما اگر داده‌ها را برای یک رویداد خاص ردیابی می‌کنید، یک تاریخ شروع و پایان مشخص برای جمع‌آوری داده‌ها دارید. در این مرحله، می‌توانید تعریف کنید که چه مقدار داده برای رسیدن به یک تحلیل معتبر کافی است. آیا حجم تعریف‌شده، مثلاً همه مشتریان در محدوده سنی ۲۱ تا ۳۰ سال است؛ یا مجموعه‌ای از داده‌ها شامل صد هزار مشتری در محدوده سنی ۲۱ تا ۳۰ سال. همچنین می‌توانید از این مرحله برای تعریف وابستگی‌ها، خطرات، طرح کاهش و چندین عامل دیگر که به ابتکار شما مربوط می‌شوند، استفاده کنید. هدف از این طرح باید ایجاد شفافیت مورد نیاز برای اجرا باشد. مرحله سوم در این فرآیند، تعیین روش‌های جمع‌آوری داده‌های شماست. در این مرحله، روش‌های جمع‌آوری داده‌های مورد نیاز خود را شناسایی خواهید کرد. نحوه جمع‌آوری داده‌ها از منابع داده‌ای که شناسایی کرده‌اید، مانند سیستم‌های داخلی، سایت‌های رسانه‌های اجتماعی یا ارائه‌دهندگان داده‌های شخص ثالث را تعریف خواهید کرد. روش‌های شما به نوع داده‌ها، بازه زمانی مورد نیاز برای داده‌ها و حجم داده‌ها بستگی دارد. پس از نهایی شدن طرح و روش‌های جمع‌آوری داده‌ها، می‌توانید استراتژی جمع‌آوری داده‌های خود را پیاده‌سازی کرده و شروع به جمع‌آوری داده‌ها کنید. در طول مسیر، به‌روزرسانی‌هایی در طرح خود انجام خواهید داد زیرا شرایط با اجرای طرح در عمل تغییر می‌کند. داده‌هایی که شناسایی می‌کنید، منبع آن داده‌ها و شیوه‌هایی که برای جمع‌آوری داده‌ها به کار می‌گیرید، پیامدهایی برای کیفیت، امنیت و حریم خصوصی دارند. هیچ یک از این موارد ملاحظات یک‌باره نیستند، بلکه با طول چرخه عمر فرآیند تحلیل داده‌ها مرتبط هستند. کار با داده‌های منابع مختلف بدون در نظر گرفتن چگونگی سنجش آن‌ها در برابر معیار کیفیت می‌تواند منجر به شکست شود. برای اینکه داده‌ها قابل اعتماد باشند، باید عاری از خطا، دقیق، کامل، مرتبط و قابل دسترس باشند. شما باید ویژگی‌های کیفی، معیارها و نقاط بازرسی را تعریف کنید تا اطمینان حاصل شود که تحلیل شما بر اساس داده‌های باکیفیت انجام می‌شود. همچنین باید مراقب مسائل مربوط به حکمرانی داده‌ها، مانند امنیت، مقررات و انطباق‌ها باشید. سیاست‌ها و رویه‌های حاکمیت داده‌ها مربوط به قابلیت استفاده، یکپارچگی و قابلیت دسترسی داده‌ها هستند. جریمه‌های عدم انطباق می‌تواند به میلیون‌ها دلار برسد و به اعتبار نه تنها یافته‌های شما، بلکه سازمان شما نیز آسیب برساند. نکته مهم دیگر، حریم خصوصی داده‌ها است. داده‌هایی که جمع‌آوری می‌کنید باید از نظر محرمانگی، مجوز استفاده و انطباق با مقررات الزامی، بررسی شوند. بررسی‌ها، اعتبارسنجی‌ها و یک مسیر قابل حسابرسی باید برنامه‌ریزی شوند. از دست دادن اعتماد به داده‌های مورد استفاده برای تحلیل می‌تواند فرآیند را به خطر بیندازد، منجر به یافته‌های مشکوک شود و جریمه‌هایی را به همراه داشته باشد. شناسایی داده‌های مناسب گام بسیار مهمی در فرآیند تحلیل داده‌ها است. اگر این کار به درستی انجام شود، تضمین می‌کند که شما قادر خواهید بود از چندین منظر به یک مشکل نگاه کنید و یافته‌های شما معتبر و قابل اعتماد خواهد بود.

شناسایی داده‌ها برای تحلیل

توضیحات

فرآیند شناسایی داده‌ها و تعیین اطلاعاتی که می‌خواهید جمع‌آوری کنید

هزینه دوره:
1,000,000 تومان300,000 تومان

مقدمه‌ای بر تحلیل داده

8 ساعت و 32 دقیقه
68 قسمت
1. ماژول 1-تحلیل داده چیست؟
2. ماژول 2-اکوسیستم داده
3. ماژول 3-جمع‌آوری و رنگل کردن (wrangle) داده
4. ماژول 4-کاوش و مصورسازی داده و نتایج ارتباط
5. ماژول 5-فرصت‌های شغلی و تحلیل داده در عمل
قسمت های جدید هر هفته به این دوره اضافه خواهد شد.