
مشاهده ویدیو قفل است
برای مشاهده مشاهده ویدیو، ابتدا این دوره را خریداری کنید.
متن فیلم
این روزها دادهکاوی یکی از اصلیترین مسیرها برای کشف الگوها و تصمیمگیریهای هوشمنده. برای این کار نرمافزارها و ابزارهای متنوعی توسعه یافتند که هر کدوم قابلیتها و کاربردهای خاص خودشون رو دارند. در ادامه با چند نمونه از این ابزارها آشنا خواهیم شد. در این ویدیو، با برخی از نرمافزارها و ابزارهای رایج برای دادهکاوی، مانند: Spreadsheets، R-Language، Python، IBM SPSS Statistics، IBM Watson Studio و SAS آشنا خواهیم شد. صفحات گسترده، مانند Microsoft Excel و Google Sheets، معمولاً برای انجام وظایف اولیه دادهکاوی استفاده میشوند. صفحات گسترده میتوانند برای میزبانی دادههایی که از سیستمهای دیگر در قالبی با دسترسی آسان و خوانا صادر شدهاند، استفاده شوند. میتوانید جداول محوری را برای نمایش جنبههای خاص دادههای خود تغییر دهید، که زمانی حیاتی است که حجم عظیمی از دادهها را برای مرتبسازی و تحلیل داشته باشید. آنها همچنین مقایسه بین مجموعههای مختلف داده را نسبتاً آسانتر میکنند. افزونههای موجود برای اکسل، مانند Data Mining Client ، XLMiner وKnowledgeMiner ، به شما امکان میدهند وظایف رایج دادهکاوی، مانند دستهبندی، رگرسیون، قوانین انجمنی، خوشهبندی و ساخت مدل را انجام دهید. GoogleSheets همچنین مجموعهای از افزونهها را دارد که میتوانند برای تحلیل و دادهکاوی استفاده شوند، مانند Text Analysis ، Text Mining وGoogle Analytics. R یکی از پرکاربردترین زبانها برای انجام مدلسازی آماری و محاسبات توسط آمارشناسان و دادهکاوهاست. R با صدها کتابخانه که به صراحت برای عملیات دادهکاوی مانند رگرسیون، دستهبندی، خوشهبندی دادهها، کاوش قوانین انجمنی، متنکاوی، تشخیص دادههای پرت و تحلیل شبکههای اجتماعی ساخته شدهاند، بستهبندی شده است. برخی از بستههای محبوب R شامل tm و twitteR هستند. tm، چارچوبی برای برنامههای متنکاوی در R، توابعی برای متنکاوی ارائه میدهد. twitteR چارچوبی برای کاوش توییتها فراهم میکند. R Studio یک محیط توسعه یکپارچه (IDE) متنباز محبوب برای کار با زبان برنامهنویسی R است. کتابخانههای پایتون مانند Pandas و NumPy معمولاً برای دادهکاوی استفاده میشوند. Pandas یک ماژول متنباز برای کار با ساختارها و تحلیل دادههاست و احتمالاً یکی از محبوبترین کتابخانهها برای تحلیل دادهها در پایتون است. این زبان به شما امکان میدهد دادهها را در هر قالبی بارگذاری کنید و یک پلتفرم ساده برای سازماندهی، مرتبسازی و دستکاری آن دادهها فراهم میکند. با استفاده از Pandas، میتوانید: محاسبات عددی اولیه مانند میانگین، میانه، مد و دامنه، محاسبه آمار و پاسخ به سوالات مربوط به همبستگی بین دادهها و توزیع دادهها؛ کاوش بصری و کمی دادهها و مصور سازی دادهها با کمک سایر کتابخانههای پایتون را انجام دهید. NumPy ابزاری برای محاسبات ریاضی و آمادهسازی دادهها در پایتون است و همچنین مجموعهای از توابع و قابلیتهای توکار را برای دادهکاوی ارائه میدهد. Jupyter Notebooks به ابزار انتخابی دانشمندان داده و تحلیلگران داده هنگام کار با پایتون برای انجام دادهکاوی و تحلیل آماری تبدیل شده است. SPSS مخفف Statistical Package for Social Sciences است. در حالی که این نام نشان دهنده کاربرد اصلی آن در زمینه علوم اجتماعی است، اما به طور گسترده برای تحلیل پیشرفته، تحلیل متن، تحلیل روند، اعتبارسنجی فرضیات و تبدیل مشکلات تجاری به راهحلهای علوم داده استفاده میشود. SPSS متن بسته است و برای استفاده نیاز به مجوز دارد. SPSS دارای رابط کاربری آسان است که برای کارهای پیچیده به حداقل کدنویسی نیاز دارد. این نرمافزار با ابزارهای مدیریت داده کارآمد و به دلیل قابلیتهای تحلیل عمیق و نتایج دقیق دادهها محبوب است. IBM Watson Studio که بخشی از IBM Cloud Pak for Data است، از مجموعهای از ابزارهای متنباز مانند Jupyter notebooks بهره میبرد و آنها را با ابزارهای متنباز IBM گسترش میدهد ترکیبی که این محیط را به بستری قدرتمند برای تحلیل دادهها و علم داده تبدیل میکند. این نرمافزار از طریق یک مرورگر وب در فضای ابری عمومی، فضای ابری خصوصی و به عنوان یک برنامه دسکتاپ در دسترس است. Watson Studio اعضای تیم را قادر میسازد تا در پروژههایی که میتوانند از تحلیل اکتشافی ساده گرفته تا ساخت مدلهای یادگیری ماشین و هوش مصنوعی متغیر باشند، همکاری کنند. همچنین شامل جریانهای SPSS Modeller است که شما را قادر میسازد به سرعت مدلهای پیشبینیکننده را برای دادههای تجاری خود توسعه دهید. SAS Enterprise Miner یک میز کار جامع و گرافیکی برای دادهکاوی است. این نرمافزار قابلیتهای قدرتمندی را برای کاوش تعاملی دادهها فراهم میکند که کاربران را قادر میسازد تا روابط درون دادهها را شناسایی کنند. SAS میتواند اطلاعات را از منابع مختلف مدیریت کند، دادهها را کاوش و تبدیل کند و آمار را تحلیل کند. این نرمافزار یک رابط کاربری گرافیکی برای کاربران غیرفنی ارائه میدهد. با SAS، میتوانید: الگوهای موجود در دادهها را با استفاده از طیف وسیعی از تکنیکهای مدلسازی موجود شناسایی کنید؛ روابط و ناهنجاریهای موجود در دادهها را بررسی کنید؛ دادههای بزرگ را تحلیل کنید؛ قابلیت اطمینان یافتههای حاصل از فرآیند تحلیل دادهها را تأیید کنید. SAS به دلیل سینتکس خود برای استفاده بسیار آسان است و همچنین اشکالزدایی آن آسان است. این زبان توانایی مدیریت پایگاههای داده بزرگ را دارد و امنیت بالایی را به کاربران خود ارائه میدهد. در این ویدیو، ما تنها با تعدادی از ابزارهای دادهکاوی موجود در حال حاضر آشنا شدیم. تصمیم شما در مورد بهترین ابزار برای نیازهایتان، به اندازه و ساختارهای دادهای که ابزار پشتیبانی میکند، ویژگیهایی که ارائه میدهد، قابلیتهای مصور سازی دادهها، نیازهای زیرساختی، سهولت استفاده و قابلیت یادگیری آن بستگی دارد. استفاده از ترکیبی از ابزارهای دادهکاوی برای برآورده کردن تمام نیازهای شما نسبتاً رایج است.
برای مشاهده کامل این قسمت، دوره را تهیه کنید
پس از خرید، به همه قسمتهای این دوره دسترسی خواهید داشت.