مقدمه‌ای بر کیفیت داده‌ها
مقدمه‌ای بر کیفیت داده‌ها
🔒
محتوای دوره
مشاهده ویدیو قفل است

برای مشاهده مشاهده ویدیو، ابتدا این دوره را خریداری کنید.

اگر قبلاً این دوره را خریداری کرده‌اید، وارد حساب خود شوید.

متن فیلم

تحلیل داده‌ها می‌تونه نقش محوری در تصمیم‌گیری‌ها و فرآیندهای تجاری ایفا کنه. برای استفاده از داده‌ها جهت تصمیم‌گیری‌های مطمئن، ما باید اطلاعات صحیحی درباره پروژه داشته باشیم و داده‌ها ما عاری از خطا باشند. در این ویدیو یاد می‌گیریم که چطور داده‌ها رو برای کشف ناسازگاری‌ها، نمایه‌سازی کنیم. چه با مجموعه‌های کوچکی از داده‌ها کار کنیم و چه یک صفحه گسترده با هزاران ردیف را تحلیل کنیم. یکی از دشوارترین بخش‌های تحلیل داده‌ها، یافتن و پاک نگه داشتن داده‌ها است. برای کمک به این فرآیند و ارزیابی داده‌ها، به دنبال این پنج ویژگی باشید: دقت، کامل بودن، قابلیت اطمینان، مرتبط بودن و به‌موقع بودن. دقت اولین و مهم‌ترین جنبه کیفیت داده‌ها است. یک تحلیلگر داده باید مجموعه داده‌ها را با حذف موارد تکراری، اصلاح خطاهای قالب‌بندی و حذف ردیف‌های خالی، پاک‌سازی کند. جنبه مهم دیگر کیفیت داده‌ها، تعیین این است که آیا اطلاعات مورد نیاز برای تکمیل مجموعه داده‌ها به راحتی در دسترس است یا خیر. چرا این موضوع به عنوان یک ویژگی برای داده‌های باکیفیت اهمیت دارد؟ فرض کنید وظیفه محاسبه درآمد کل فروش در هر منطقه به ما داده شده است. پس از جمع‌آوری داده‌ها، متوجه می‌شویم که هیچ منطقه‌ای مشخص نشده است. در این صورت، این داده‌ها ناقص تلقی می‌شوند و برای به دست آوردن داده‌های مورد نیاز، باید منابع دیگری در نظر گرفته شوند. قابلیت اطمینان یکی دیگر از عوامل حیاتی در تعیین کیفیت داده‌ها است. به عنوان مثال، فرض کنید وظیفه تعیین درآمد نماینده بر اساس مشتری به ما داده شده است. هنگام جمع‌آوری داده‌ها، متوجه می‌شویم که نمایندگان سوابق خود را نگه می‌دارند اما همیشه اطلاعات موجود در پایگاه داده مشترک شرکت را به‌روزرسانی نمی‌کنند. با در نظر گرفتن این عوامل، ما تشخیص می‌دهیم که داده‌های موجود در پایگاه داده مشترک شرکت غیرقابل اطمینان هستند و برای اطمینان از داده‌ها، باید فرآیندهای جدیدی ایجاد شود. مرتبط بودن یکی دیگر از ویژگی‌های داده‌های باکیفیت است. هنگام جمع‌آوری اطلاعات، یک تحلیلگر داده باید در نظر بگیرد که آیا داده‌های جمع‌آوری‌شده واقعاً برای پروژه ضروری هستند یا خیر. به عنوان مثال، هنگام بررسی داده‌های مربوط به درآمد فروش به ازای هر مشتری، اطلاعاتی مانند تاریخ تولد مشتری و سایر اطلاعات شخصی نیز گنجانده شده است. با تصمیم‌گیری زودهنگام برای حذف اطلاعات شخصی از مجموعه داده‌ها، تحلیلگر خود را از بررسی اطلاعات غیرضروری نجات می‌دهد. آخرین عامل در تعیین کیفیت داده‌ها، به‌موقع بودن است. این ویژگی به قابلیت دسترسی و دسترس‌پذیری داده‌های انتخاب‌شده اشاره دارد. فرض کنید گزارش فروش ما قرار است برای بررسی‌های هفتگی کارکنان استفاده شود، اما گزارش ما فقط ماهی یک بار به‌روزرسانی می‌شود. این خطا در به‌روزرسانی داده‌ها باعث می‌شود گزارش ما قدیمی شود و عواقب جدی برای بررسی‌های کارکنان داشته باشد. در این ویدیو نقش مهم یک تحلیلگر داده در ارزیابی داده‌ها را آموختیم. با در نظر گرفتن پنج ویژگی داده‌های با کیفیت خوب، یک تحلیلگر می‌تواند در زمان صرفه‌جویی کند، از مشکلات جدی جلوگیری کند و داده‌هایی داشته باشد که عاری از خطا باشند. در ویدیوی بعدی، داده‌های جمع‌آوری‌شده را دریافت کرده و نحوه وارد کردن آنها به صفحه گسترده خود را یاد خواهیم گرفت.

مقدمه‌ای بر کیفیت داده‌ها

توضیحات

پاکسازی و بررسی داده‌ها با استفاده از صفحات گسترده در این ماژول، با اهمیت کیفیت داده‌ها آشنا خواهید شد و یاد خواهید گرفت که چگونه داده‌های فایل را به اکسل وارد کنید. همچنین با اصول اولیه حریم خصوصی داده‌ها آشنا خواهید شد. علاوه بر این، یاد خواهید گرفت که چگونه داده‌های تکراری و نادرست را حذف کنید و چگونه ردیف‌های خالی را در داده‌های خود حذف کنید. در نهایت، یاد خواهید گرفت که چگونه با ناسازگاری‌ها در داده‌های خود مقابله کنید و چگونه از ویژگی‌های Flash Fill و Text to Columns برای کمک به دستکاری و استانداردسازی داده‌های خود استفاده کنید. اهداف یادگیری اهمیت کیفیت داده‌ها را توضیح دهید. داده‌های فایل را به اکسل وارد کنید. اصول اولیه حریم خصوصی داده‌ها را شرح دهید. داده‌های تکراری، داده‌های نادرست و ردیف‌های خالی را در اکسل حذف کنید. ناسازگاری‌های داده‌ها را برطرف کنید. داده‌ها را با استفاده از ویژگی‌های Flash Fill و Text to Columns در اکسل دستکاری و استانداردسازی کنید.

دسترسی محدود
برای مشاهده کامل این قسمت، دوره را تهیه کنید

پس از خرید، به همه قسمت‌های این دوره دسترسی خواهید داشت.

هزینه دوره40٪ تخفیف
1,200,000 تومان720,000 تومان
فهرست دوره

مبانی اکسل برای تحلیل داده‌ها

11 ساعت و 36 دقیقه
48 قسمت