خلاصه و نکات مهم
خلاصه و نکات مهم
خلاصه و نکات مهم
در این درس، اطلاعات زیر را آموختهاید:
پس از جمعآوری و وارد کردن دادههایی که شناسایی کردهاید، گام بعدی شما آمادهسازی آن برای تحلیل است. اینجاست که فرآیند Data Wrangling یا Data Munging وارد عمل میشود. Data Wrangling یک فرآیند تکراری است که شامل کاوش، تبدیل و اعتبارسنجی دادهها میشود.
تبدیل دادههای خام شامل وظایفی است که شما انجام میدهید:
- دستکاری و ترکیب ساختاری دادهها با استفاده از Joins وUnions.
- نرمالسازی دادهها، یعنی پاکسازی پایگاه داده از دادههای بلااستفاده و تکراری.
- غیر نرمالسازی دادهها، یعنی ترکیب دادهها از چندین جدول در یک جدول واحد به طوری که بتوان سریعتر به آنها پرسوجو کرد.
- پاکسازی دادهها، که شامل پروفایلبندی دادهها برای کشف مشکلات کیفی، مصورسازی دادهها برای شناسایی دادههای پرت و رفع مشکلاتی مانند مقادیر گمشده، دادههای تکراری، دادههای نامربوط، قالبهای متناقض، خطاهای نحوی و دادههای پرت است.
- غنیسازی دادهها، که شامل در نظر گرفتن نقاط داده اضافی است که میتوانند به مجموعه دادههای موجود ارزش افزوده دهند و منجر به تحلیل معنادارتری شوند.
نرمافزارها و ابزارهای متنوعی برای فرآیند تحلیل دادهها در دسترس هستند. برخی از محبوبترین آنها عبارتند از Excel Power Query، Spreadsheets، OpenRefine، Google DataPrep، Watson Studio Refinery، Trifacta Wrangler، Python و R که هر کدام مجموعه ویژگیها، نقاط قوت، محدودیتها و کاربردهای خاص خود را دارند.
هزینه دوره:
1,000,000 تومان300,000 تومان
مقدمهای بر تحلیل داده
8 ساعت و 32 دقیقه
68 قسمت
1. ماژول 1-تحلیل داده چیست؟
2. ماژول 2-اکوسیستم داده
3. ماژول 3-جمعآوری و رنگل کردن (wrangle) داده
4. ماژول 4-کاوش و مصورسازی داده و نتایج ارتباط
5. ماژول 5-فرصتهای شغلی و تحلیل داده در عمل
قسمت های جدید هر هفته به این دوره اضافه خواهد شد.