
متن فیلم
دادههای به ظاهر ساده مثل عادات سفر و سرگرمیهامون، باز کردن قفل تلفن همراه یا استفاده از ساعت هوشمند زمانی که کنار همدیگه قرار میگیرن، دنیای عظیمی رو شکل میدن که بهش میگیم کلانداده. اما اهمیت کلانداده فقط در حجمش نیست، بلکه در ویژگیهایی مثل سرعت تولید، تنوع دادهها، صحت و ارزشی که میتونه ایجاد کنه خلاصه میشه. در ادامه میخوایم ببینیم که کلانداده دقیقاً یعنی چی و چرا اینقدر برای کسبوکارها و زندگی ما اهمیت داره. در این دنیای دیجیتال، هر کسی ردی از خود به جا میگذارد. از عادات سفر ما گرفته تا تمرینات و سرگرمیهایمان، تعداد فزاینده دستگاههای متصل به اینترنت که روزانه با آنها تعامل داریم، حجم عظیمی از دادهها را در مورد ما ثبت میکنند و حتی نامی برای آن وجود دارد: کلانداده. ارنست و یانگ تعریف زیر را ارائه میدهند: کلانداده به حجم پویا، بزرگ و متفاوتی از دادهها اشاره دارد که توسط افراد، ابزارها و ماشینها ایجاد میشود. برای جمعآوری، میزبانی و پردازش تحلیلی حجم عظیم دادههای جمعآوریشده به فناوری جدید، نوآورانه و مقیاسپذیر نیاز است تا بینشهای تجاری بلادرنگ مربوط به مصرفکنندگان، ریسک، سود، کارایی، مدیریت بهرهوری و افزایش ارزش سهامدار ایجاد شود. هیچ تعریف واحدی از کلانداده وجود ندارد، اما عناصر خاصی در تعاریف مختلف مشترک هستند، مانند سرعت، حجم، تنوع، صحت و ارزش. اینها Vهای کلانداده هستند. Velocity ، سرعتی است که دادهها با آن جمع میشوند. دادهها در فرآیندی که هرگز متوقف نمیشود، بسیار سریع تولید میشوند. فناوریهای پخش نزدیک به زمان واقعی یا بلادرنگ، محلی و مبتنی بر ابر میتوانند اطلاعات را بسیار سریع پردازش کنند. Volume ، مقیاس دادهها یا افزایش مقدار دادههای ذخیره شده است. محرکهای حجم، افزایش منابع داده، حسگرهای با وضوح بالاتر و زیرساختهای مقیاسپذیر هستند. Variety ، تنوع دادهها است. دادههای ساختاریافته به طور مرتب در ردیفها و ستونهای پایگاههای داده رابطهای قرار میگیرند، در حالی که دادههای بدون ساختار مانند توییتها، پستهای وبلاگ، تصاویر، اعداد و ویدیو به صورت از پیش تعریف شده سازماندهی نمیشوند. تنوع همچنین نشان میدهد که دادهها از منابع مختلف میآیند؛ ماشینها، افراد و فرآیندها، چه داخلی و چه خارجی برای سازمانها. محرکها عبارتند از فناوریهای تلفن همراه، رسانههای اجتماعی، فناوریهای پوشیدنی، ویدئوی فناوریهای جغرافیایی و بسیاری از موارد دیگر. Veracity ، کیفیت و منشأ دادهها و انطباق آن با واقعیتها و دقت آن است. ویژگیها شامل سازگاری، کامل بودن، جامعیت و ابهام هستند. محرکها شامل هزینه و نیاز به قابلیت ردیابی هستند. با وجود حجم زیاد دادههای موجود، بحث در مورد دقت دادهها در عصر دیجیتال داغ است. آیا اطلاعات واقعی هستند یا کاذب؟ Value ، توانایی و نیاز ما برای تبدیل دادهها به ارزش است. ارزش فقط سود نیست. ممکن است مزایای پزشکی یا اجتماعی و همچنین رضایت مشتری، کارمند یا شخصی داشته باشد. دلیل اصلی اینکه مردم برای درک کلانداده وقت میگذارند، استخراج ارزش از آن است. بیایید به چند نمونه از Vها در عمل نگاه کنیم. سرعت. هر 60 ثانیه، ساعتها فیلم در یوتیوب آپلود میشود که در حال تولید داده است. به این فکر کنید که دادهها با چه سرعتی در طول ساعتها، روزها و سالها جمعآوری میشوند. حجم. جمعیت جهان تقریباً 7 میلیارد نفر است و اکثریت قریب به اتفاق آنها اکنون از دستگاههای دیجیتال استفاده میکنند. تلفنهای همراه، رایانههای رومیزی و لپتاپ، دستگاههای پوشیدنی و غیره. همه این دستگاهها تقریباً 2.5 کوینتیلیون بایت داده را هر روز تولید، ضبط و ذخیره میکنند. این معادل 10 میلیون دیویدی بلو-ری است. تنوع. بیایید در مورد انواع مختلف دادهها فکر کنیم. متن، تصاویر، فیلم، صدا، دادههای سلامت از دستگاههای پوشیدنی و انواع مختلف دادهها از دستگاههای متصل به اینترنت اشیا. صحت. هشتاد درصد از دادهها بدون ساختار در نظر گرفته میشوند و ما باید راههایی برای تولید بینشهای قابل اعتماد و دقیق ابداع کنیم. دادهها باید دستهبندی، تحلیل و مصورسازی شوند. دانشمندان داده، امروزه، از کلاندادهها بینشهایی استخراج میکنند و با چالشهایی که این مجموعه دادههای عظیم ایجاد میکنند، مقابله میکنند. مقیاس دادههای جمعآوریشده به این معنی است که استفاده از ابزارهای مرسوم تحلیل دادهها امکانپذیر نیست، با این حال، ابزارهای جایگزینی که از قدرت محاسبات توزیعشده بهره میبرند، میتوانند بر این مشکل غلبه کنند. ابزارهایی مانند آپاچی اسپارک، هادوپ و اکوسیستم آن، روشهایی برای استخراج، بارگذاری، تحلیل و پردازش دادهها در منابع محاسباتی توزیعشده ارائه میدهند و بینشها و دانش جدیدی را ارائه میدهند. این امر به سازمانها راههای بیشتری برای ارتباط با مشتریان خود و غنیسازی خدماتی که ارائه میدهند، میدهد. بنابراین دفعه بعد که ساعت هوشمند خود را به دست میکنید، قفل گوشی هوشمند خود را باز میکنید یا ورزش خود را پیگیری میکنید، به یاد داشته باشید که دادههای شما سفری را آغاز میکنند که ممکن است آن را در سراسر جهان، از طریق تحلیل کلاندادهها و بازگشت به شما، طی کند.