خلاصه و نکات مهم

خلاصه و نکات مهم

خلاصه و نکات مهم

خلاصه و نکات مهم

خلاصه و نکات مهم

در این درس، اطلاعات زیر را آموخته‌اید:

پس از جمع‌آوری و وارد کردن داده‌هایی که شناسایی کرده‌اید، گام بعدی شما آماده‌سازی آن برای تحلیل است. اینجاست که فرآیند Data Wrangling یا Data Munging وارد عمل می‌شود. Data Wrangling یک فرآیند تکراری است که شامل کاوش، تبدیل و اعتبارسنجی داده‌ها می‌شود.

تبدیل داده‌های خام شامل وظایفی است که شما انجام می‌دهید:

  • دستکاری و ترکیب ساختاری داده‌ها با استفاده از Joins وUnions.
  • نرمال‌سازی داده‌ها، یعنی پاکسازی پایگاه داده از داده‌های بلااستفاده و تکراری.
  • غیر نرمال‌سازی داده‌ها، یعنی ترکیب داده‌ها از چندین جدول در یک جدول واحد به طوری که بتوان سریع‌تر به آنها پرس‌وجو کرد.
  • پاکسازی داده‌ها، که شامل پروفایل‌بندی داده‌ها برای کشف مشکلات کیفی، مصورسازی داده‌ها برای شناسایی داده‌های پرت و رفع مشکلاتی مانند مقادیر گمشده، داده‌های تکراری، داده‌های نامربوط، قالب‌های متناقض، خطاهای نحوی و داده‌های پرت است.
  • غنی‌سازی داده‌ها، که شامل در نظر گرفتن نقاط داده اضافی است که می‌توانند به مجموعه داده‌های موجود ارزش افزوده دهند و منجر به تحلیل معنادارتری شوند.

نرم‌افزارها و ابزارهای متنوعی برای فرآیند تحلیل داده‌ها در دسترس هستند. برخی از محبوب‌ترین آن‌ها عبارتند از Excel Power Query، Spreadsheets، OpenRefine، Google DataPrep، Watson Studio Refinery، Trifacta Wrangler، Python و R که هر کدام مجموعه ویژگی‌ها، نقاط قوت، محدودیت‌ها و کاربردهای خاص خود را دارند.

هزینه دوره:
1,000,000 تومان300,000 تومان

مقدمه‌ای بر تحلیل داده

8 ساعت و 32 دقیقه
68 قسمت
1. ماژول 1-تحلیل داده چیست؟
2. ماژول 2-اکوسیستم داده
3. ماژول 3-جمع‌آوری و رنگل کردن (wrangle) داده
4. ماژول 4-کاوش و مصورسازی داده و نتایج ارتباط
5. ماژول 5-فرصت‌های شغلی و تحلیل داده در عمل
قسمت های جدید هر هفته به این دوره اضافه خواهد شد.