مبانی کلان داده
مبانی کلان داده
برای مشاهده ویدیو ، لطفا دوره را خریداری نمایید.یا در صورتی که دوره را خریداری کرده اید وارد حساب کاربری خود شوید.

متن فیلم

داده‌های به ظاهر ساده مثل عادات سفر و سرگرمی‌هامون، باز کردن قفل تلفن همراه یا استفاده از ساعت هوشمند زمانی که کنار همدیگه قرار می‌گیرن، دنیای عظیمی رو شکل می‌دن که بهش میگیم کلان‌داده. اما اهمیت کلان‌داده فقط در حجمش نیست، بلکه در ویژگی‌هایی مثل سرعت تولید، تنوع داده‌ها، صحت و ارزشی که می‌تونه ایجاد کنه خلاصه می‌شه. در ادامه می‌خوایم ببینیم که کلان‌داده دقیقاً یعنی چی و چرا اینقدر برای کسب‌وکارها و زندگی ما اهمیت داره. در این دنیای دیجیتال، هر کسی ردی از خود به جا می‌گذارد. از عادات سفر ما گرفته تا تمرینات و سرگرمی‌هایمان، تعداد فزاینده دستگاه‌های متصل به اینترنت که روزانه با آن‌ها تعامل داریم، حجم عظیمی از داده‌ها را در مورد ما ثبت می‌کنند و حتی نامی برای آن وجود دارد: کلان‌داده. ارنست و یانگ تعریف زیر را ارائه می‌دهند: کلان‌داده به حجم پویا، بزرگ و متفاوتی از داده‌ها اشاره دارد که توسط افراد، ابزارها و ماشین‌ها ایجاد می‌شود. برای جمع‌آوری، میزبانی و پردازش تحلیلی حجم عظیم داده‌های جمع‌آوری‌شده به فناوری جدید، نوآورانه و مقیاس‌پذیر نیاز است تا بینش‌های تجاری بلادرنگ مربوط به مصرف‌کنندگان، ریسک، سود، کارایی، مدیریت بهره‌وری و افزایش ارزش سهامدار ایجاد شود. هیچ تعریف واحدی از کلان‌داده وجود ندارد، اما عناصر خاصی در تعاریف مختلف مشترک هستند، مانند سرعت، حجم، تنوع، صحت و ارزش. اینها Vهای کلان‌داده هستند. Velocity ، سرعتی است که داده‌ها با آن جمع می‌شوند. داده‌ها در فرآیندی که هرگز متوقف نمی‌شود، بسیار سریع تولید می‌شوند. فناوری‌های پخش نزدیک به زمان واقعی یا بلادرنگ، محلی و مبتنی بر ابر می‌توانند اطلاعات را بسیار سریع پردازش کنند. Volume ، مقیاس داده‌ها یا افزایش مقدار داده‌های ذخیره شده است. محرک‌های حجم، افزایش منابع داده، حسگرهای با وضوح بالاتر و زیرساخت‌های مقیاس‌پذیر هستند. Variety ، تنوع داده‌ها است. داده‌های ساختاریافته به طور مرتب در ردیف‌ها و ستون‌های پایگاه‌های داده رابطه‌ای قرار می‌گیرند، در حالی که داده‌های بدون ساختار مانند توییت‌ها، پست‌های وبلاگ، تصاویر، اعداد و ویدیو به صورت از پیش تعریف شده سازماندهی نمی‌شوند. تنوع همچنین نشان می‌دهد که داده‌ها از منابع مختلف می‌آیند؛ ماشین‌ها، افراد و فرآیندها، چه داخلی و چه خارجی برای سازمان‌ها. محرک‌ها عبارتند از فناوری‌های تلفن همراه، رسانه‌های اجتماعی، فناوری‌های پوشیدنی، ویدئوی فناوری‌های جغرافیایی و بسیاری از موارد دیگر. Veracity ، کیفیت و منشأ داده‌ها و انطباق آن با واقعیت‌ها و دقت آن است. ویژگی‌ها شامل سازگاری، کامل بودن، جامعیت و ابهام هستند. محرک‌ها شامل هزینه و نیاز به قابلیت ردیابی هستند. با وجود حجم زیاد داده‌های موجود، بحث در مورد دقت داده‌ها در عصر دیجیتال داغ است. آیا اطلاعات واقعی هستند یا کاذب؟ Value ، توانایی و نیاز ما برای تبدیل داده‌ها به ارزش است. ارزش فقط سود نیست. ممکن است مزایای پزشکی یا اجتماعی و همچنین رضایت مشتری، کارمند یا شخصی داشته باشد. دلیل اصلی اینکه مردم برای درک کلان‌داده وقت می‌گذارند، استخراج ارزش از آن است. بیایید به چند نمونه از Vها در عمل نگاه کنیم. سرعت. هر 60 ثانیه، ساعت‌ها فیلم در یوتیوب آپلود می‌شود که در حال تولید داده است. به این فکر کنید که داده‌ها با چه سرعتی در طول ساعت‌ها، روزها و سال‌ها جمع‌آوری می‌شوند. حجم. جمعیت جهان تقریباً 7 میلیارد نفر است و اکثریت قریب به اتفاق آن‌ها اکنون از دستگاه‌های دیجیتال استفاده می‌کنند. تلفن‌های همراه، رایانه‌های رومیزی و لپ‌تاپ، دستگاه‌های پوشیدنی و غیره. همه این دستگاه‌ها تقریباً 2.5 کوینتیلیون بایت داده را هر روز تولید، ضبط و ذخیره می‌کنند. این معادل 10 میلیون دی‌وی‌دی بلو-ری است. تنوع. بیایید در مورد انواع مختلف داده‌ها فکر کنیم. متن، تصاویر، فیلم، صدا، داده‌های سلامت از دستگاه‌های پوشیدنی و انواع مختلف داده‌ها از دستگاه‌های متصل به اینترنت اشیا. صحت. هشتاد درصد از داده‌ها بدون ساختار در نظر گرفته می‌شوند و ما باید راه‌هایی برای تولید بینش‌های قابل اعتماد و دقیق ابداع کنیم. داده‌ها باید دسته‌بندی، تحلیل و مصورسازی شوند. دانشمندان داده، امروزه، از کلان‌داده‌ها بینش‌هایی استخراج می‌کنند و با چالش‌هایی که این مجموعه داده‌های عظیم ایجاد می‌کنند، مقابله می‌کنند. مقیاس داده‌های جمع‌آوری‌شده به این معنی است که استفاده از ابزارهای مرسوم تحلیل داده‌ها امکان‌پذیر نیست، با این حال، ابزارهای جایگزینی که از قدرت محاسبات توزیع‌شده بهره می‌برند، می‌توانند بر این مشکل غلبه کنند. ابزارهایی مانند آپاچی اسپارک، هادوپ و اکوسیستم آن، روش‌هایی برای استخراج، بارگذاری، تحلیل و پردازش داده‌ها در منابع محاسباتی توزیع‌شده ارائه می‌دهند و بینش‌ها و دانش جدیدی را ارائه می‌دهند. این امر به سازمان‌ها راه‌های بیشتری برای ارتباط با مشتریان خود و غنی‌سازی خدماتی که ارائه می‌دهند، می‌دهد. بنابراین دفعه بعد که ساعت هوشمند خود را به دست می‌کنید، قفل گوشی هوشمند خود را باز می‌کنید یا ورزش خود را پیگیری می‌کنید، به یاد داشته باشید که داده‌های شما سفری را آغاز می‌کنند که ممکن است آن را در سراسر جهان، از طریق تحلیل کلان‌داده‌ها و بازگشت به شما، طی کند.

مبانی کلان داده

توضیحات

کلان داده و Vهای کلان‌داده

هزینه دوره:
1,000,000 تومان300,000 تومان

مقدمه‌ای بر تحلیل داده

8 ساعت و 32 دقیقه
68 قسمت
1. ماژول 1-تحلیل داده چیست؟
2. ماژول 2-اکوسیستم داده
3. ماژول 3-جمع‌آوری و رنگل کردن (wrangle) داده
4. ماژول 4-کاوش و مصورسازی داده و نتایج ارتباط
5. ماژول 5-فرصت‌های شغلی و تحلیل داده در عمل
قسمت های جدید هر هفته به این دوره اضافه خواهد شد.