
مشاهده ویدیو قفل است
برای مشاهده مشاهده ویدیو، ابتدا این دوره را خریداری کنید.
متن فیلم
تحلیل دادهها میتونه نقش محوری در تصمیمگیریها و فرآیندهای تجاری ایفا کنه. برای استفاده از دادهها جهت تصمیمگیریهای مطمئن، ما باید اطلاعات صحیحی درباره پروژه داشته باشیم و دادهها ما عاری از خطا باشند. در این ویدیو یاد میگیریم که چطور دادهها رو برای کشف ناسازگاریها، نمایهسازی کنیم. چه با مجموعههای کوچکی از دادهها کار کنیم و چه یک صفحه گسترده با هزاران ردیف را تحلیل کنیم. یکی از دشوارترین بخشهای تحلیل دادهها، یافتن و پاک نگه داشتن دادهها است. برای کمک به این فرآیند و ارزیابی دادهها، به دنبال این پنج ویژگی باشید: دقت، کامل بودن، قابلیت اطمینان، مرتبط بودن و بهموقع بودن. دقت اولین و مهمترین جنبه کیفیت دادهها است. یک تحلیلگر داده باید مجموعه دادهها را با حذف موارد تکراری، اصلاح خطاهای قالببندی و حذف ردیفهای خالی، پاکسازی کند. جنبه مهم دیگر کیفیت دادهها، تعیین این است که آیا اطلاعات مورد نیاز برای تکمیل مجموعه دادهها به راحتی در دسترس است یا خیر. چرا این موضوع به عنوان یک ویژگی برای دادههای باکیفیت اهمیت دارد؟ فرض کنید وظیفه محاسبه درآمد کل فروش در هر منطقه به ما داده شده است. پس از جمعآوری دادهها، متوجه میشویم که هیچ منطقهای مشخص نشده است. در این صورت، این دادهها ناقص تلقی میشوند و برای به دست آوردن دادههای مورد نیاز، باید منابع دیگری در نظر گرفته شوند. قابلیت اطمینان یکی دیگر از عوامل حیاتی در تعیین کیفیت دادهها است. به عنوان مثال، فرض کنید وظیفه تعیین درآمد نماینده بر اساس مشتری به ما داده شده است. هنگام جمعآوری دادهها، متوجه میشویم که نمایندگان سوابق خود را نگه میدارند اما همیشه اطلاعات موجود در پایگاه داده مشترک شرکت را بهروزرسانی نمیکنند. با در نظر گرفتن این عوامل، ما تشخیص میدهیم که دادههای موجود در پایگاه داده مشترک شرکت غیرقابل اطمینان هستند و برای اطمینان از دادهها، باید فرآیندهای جدیدی ایجاد شود. مرتبط بودن یکی دیگر از ویژگیهای دادههای باکیفیت است. هنگام جمعآوری اطلاعات، یک تحلیلگر داده باید در نظر بگیرد که آیا دادههای جمعآوریشده واقعاً برای پروژه ضروری هستند یا خیر. به عنوان مثال، هنگام بررسی دادههای مربوط به درآمد فروش به ازای هر مشتری، اطلاعاتی مانند تاریخ تولد مشتری و سایر اطلاعات شخصی نیز گنجانده شده است. با تصمیمگیری زودهنگام برای حذف اطلاعات شخصی از مجموعه دادهها، تحلیلگر خود را از بررسی اطلاعات غیرضروری نجات میدهد. آخرین عامل در تعیین کیفیت دادهها، بهموقع بودن است. این ویژگی به قابلیت دسترسی و دسترسپذیری دادههای انتخابشده اشاره دارد. فرض کنید گزارش فروش ما قرار است برای بررسیهای هفتگی کارکنان استفاده شود، اما گزارش ما فقط ماهی یک بار بهروزرسانی میشود. این خطا در بهروزرسانی دادهها باعث میشود گزارش ما قدیمی شود و عواقب جدی برای بررسیهای کارکنان داشته باشد. در این ویدیو نقش مهم یک تحلیلگر داده در ارزیابی دادهها را آموختیم. با در نظر گرفتن پنج ویژگی دادههای با کیفیت خوب، یک تحلیلگر میتواند در زمان صرفهجویی کند، از مشکلات جدی جلوگیری کند و دادههایی داشته باشد که عاری از خطا باشند. در ویدیوی بعدی، دادههای جمعآوریشده را دریافت کرده و نحوه وارد کردن آنها به صفحه گسترده خود را یاد خواهیم گرفت.
مقدمهای بر کیفیت دادهها
توضیحات
پاکسازی و بررسی دادهها با استفاده از صفحات گسترده در این ماژول، با اهمیت کیفیت دادهها آشنا خواهید شد و یاد خواهید گرفت که چگونه دادههای فایل را به اکسل وارد کنید. همچنین با اصول اولیه حریم خصوصی دادهها آشنا خواهید شد. علاوه بر این، یاد خواهید گرفت که چگونه دادههای تکراری و نادرست را حذف کنید و چگونه ردیفهای خالی را در دادههای خود حذف کنید. در نهایت، یاد خواهید گرفت که چگونه با ناسازگاریها در دادههای خود مقابله کنید و چگونه از ویژگیهای Flash Fill و Text to Columns برای کمک به دستکاری و استانداردسازی دادههای خود استفاده کنید. اهداف یادگیری اهمیت کیفیت دادهها را توضیح دهید. دادههای فایل را به اکسل وارد کنید. اصول اولیه حریم خصوصی دادهها را شرح دهید. دادههای تکراری، دادههای نادرست و ردیفهای خالی را در اکسل حذف کنید. ناسازگاریهای دادهها را برطرف کنید. دادهها را با استفاده از ویژگیهای Flash Fill و Text to Columns در اکسل دستکاری و استانداردسازی کنید.
برای مشاهده کامل این قسمت، دوره را تهیه کنید
پس از خرید، به همه قسمتهای این دوره دسترسی خواهید داشت.