ابزارهای داده‌کاوی
ابزارهای داده‌کاوی
🔒
محتوای دوره
مشاهده ویدیو قفل است

برای مشاهده مشاهده ویدیو، ابتدا این دوره را خریداری کنید.

اگر قبلاً این دوره را خریداری کرده‌اید، وارد حساب خود شوید.

متن فیلم

این روزها داده‌کاوی یکی از اصلی‌ترین مسیرها برای کشف الگوها و تصمیم‌گیری‌های هوشمنده. برای این کار نرم‌افزارها و ابزارهای متنوعی توسعه یافتند که هر کدوم قابلیت‌ها و کاربردهای خاص خودشون رو دارند. در ادامه با چند نمونه از این ابزارها آشنا خواهیم شد. در این ویدیو، با برخی از نرم‌افزارها و ابزارهای رایج برای داده‌کاوی، مانند: Spreadsheets، R-Language، Python، IBM SPSS Statistics، IBM Watson Studio و SAS آشنا خواهیم شد. صفحات گسترده، مانند Microsoft Excel و Google Sheets، معمولاً برای انجام وظایف اولیه داده‌کاوی استفاده می‌شوند. صفحات گسترده می‌توانند برای میزبانی داده‌هایی که از سیستم‌های دیگر در قالبی با دسترسی آسان و خوانا صادر شده‌اند، استفاده شوند. می‌توانید جداول محوری را برای نمایش جنبه‌های خاص داده‌های خود تغییر دهید، که زمانی حیاتی است که حجم عظیمی از داده‌ها را برای مرتب‌سازی و تحلیل داشته باشید. آن‌ها همچنین مقایسه بین مجموعه‌های مختلف داده را نسبتاً آسان‌تر می‌کنند. افزونه‌های موجود برای اکسل، مانند Data Mining Client ، XLMiner وKnowledgeMiner ، به شما امکان می‌دهند وظایف رایج داده‌کاوی، مانند دسته‌بندی، رگرسیون، قوانین انجمنی، خوشه‌بندی و ساخت مدل را انجام دهید. GoogleSheets همچنین مجموعه‌ای از افزونه‌ها را دارد که می‌توانند برای تحلیل و داده‌کاوی استفاده شوند، مانند Text Analysis ، Text Mining وGoogle Analytics. R یکی از پرکاربردترین زبان‌ها برای انجام مدل‌سازی آماری و محاسبات توسط آمارشناسان و داده‌کاوهاست. R با صدها کتابخانه که به صراحت برای عملیات داده‌کاوی مانند رگرسیون، دسته‌بندی، خوشه‌بندی داده‌ها، کاوش قوانین انجمنی، متن‌کاوی، تشخیص داده‌های پرت و تحلیل شبکه‌های اجتماعی ساخته شده‌اند، بسته‌بندی شده است. برخی از بسته‌های محبوب R شامل tm و twitteR هستند. tm، چارچوبی برای برنامه‌های متن‌کاوی در R، توابعی برای متن‌کاوی ارائه می‌دهد. twitteR چارچوبی برای کاوش توییت‌ها فراهم می‌کند. R Studio یک محیط توسعه یکپارچه (IDE) متن‌باز محبوب برای کار با زبان برنامه‌نویسی R است. کتابخانه‌های پایتون مانند Pandas و NumPy معمولاً برای داده‌کاوی استفاده می‌شوند. Pandas یک ماژول متن‌باز برای کار با ساختارها و تحلیل داده‌هاست و احتمالاً یکی از محبوب‌ترین کتابخانه‌ها برای تحلیل داده‌ها در پایتون است. این زبان به شما امکان می‌دهد داده‌ها را در هر قالبی بارگذاری کنید و یک پلتفرم ساده برای سازماندهی، مرتب‌سازی و دستکاری آن داده‌ها فراهم می‌کند. با استفاده از Pandas، می‌توانید: محاسبات عددی اولیه مانند میانگین، میانه، مد و دامنه، محاسبه آمار و پاسخ به سوالات مربوط به همبستگی بین داده‌ها و توزیع داده‌ها؛ کاوش بصری و کمی داده‌ها و مصور سازی داده‌ها با کمک سایر کتابخانه‌های پایتون را انجام دهید. NumPy ابزاری برای محاسبات ریاضی و آماده‌سازی داده‌ها در پایتون است و همچنین مجموعه‌ای از توابع و قابلیت‌های توکار را برای داده‌کاوی ارائه می‌دهد. Jupyter Notebooks به ابزار انتخابی دانشمندان داده و تحلیلگران داده هنگام کار با پایتون برای انجام داده‌کاوی و تحلیل آماری تبدیل شده است. SPSS مخفف Statistical Package for Social Sciences است. در حالی که این نام نشان دهنده کاربرد اصلی آن در زمینه علوم اجتماعی است، اما به طور گسترده برای تحلیل پیشرفته، تحلیل متن، تحلیل روند، اعتبارسنجی فرضیات و تبدیل مشکلات تجاری به راه‌حل‌های علوم داده استفاده می‌شود. SPSS متن بسته است و برای استفاده نیاز به مجوز دارد. SPSS دارای رابط کاربری آسان است که برای کارهای پیچیده به حداقل کدنویسی نیاز دارد. این نرم‌افزار با ابزارهای مدیریت داده کارآمد و به دلیل قابلیت‌های تحلیل عمیق و نتایج دقیق داده‌ها محبوب است. IBM Watson Studio که بخشی از IBM Cloud Pak for Data است، از مجموعه‌ای از ابزارهای متن‌باز مانند Jupyter notebooks بهره می‌برد و آن‌ها را با ابزارهای متن‌باز IBM گسترش می‌دهد ترکیبی که این محیط را به بستری قدرتمند برای تحلیل داده‌ها و علم داده تبدیل می‌کند. این نرم‌افزار از طریق یک مرورگر وب در فضای ابری عمومی، فضای ابری خصوصی و به عنوان یک برنامه دسکتاپ در دسترس است. Watson Studio اعضای تیم را قادر می‌سازد تا در پروژه‌هایی که می‌توانند از تحلیل اکتشافی ساده گرفته تا ساخت مدل‌های یادگیری ماشین و هوش مصنوعی متغیر باشند، همکاری کنند. همچنین شامل جریان‌های SPSS Modeller است که شما را قادر می‌سازد به سرعت مدل‌های پیش‌بینی‌کننده را برای داده‌های تجاری خود توسعه دهید. SAS Enterprise Miner یک میز کار جامع و گرافیکی برای داده‌کاوی است. این نرم‌افزار قابلیت‌های قدرتمندی را برای کاوش تعاملی داده‌ها فراهم می‌کند که کاربران را قادر می‌سازد تا روابط درون داده‌ها را شناسایی کنند. SAS می‌تواند اطلاعات را از منابع مختلف مدیریت کند، داده‌ها را کاوش و تبدیل کند و آمار را تحلیل کند. این نرم‌افزار یک رابط کاربری گرافیکی برای کاربران غیرفنی ارائه می‌دهد. با SAS، می‌توانید: الگوهای موجود در داده‌ها را با استفاده از طیف وسیعی از تکنیک‌های مدل‌سازی موجود شناسایی کنید؛ روابط و ناهنجاری‌های موجود در داده‌ها را بررسی کنید؛ داده‌های بزرگ را تحلیل کنید؛ قابلیت اطمینان یافته‌های حاصل از فرآیند تحلیل داده‌ها را تأیید کنید. SAS به دلیل سینتکس خود برای استفاده بسیار آسان است و همچنین اشکال‌زدایی آن آسان است. این زبان توانایی مدیریت پایگاه‌های داده بزرگ را دارد و امنیت بالایی را به کاربران خود ارائه می‌دهد. در این ویدیو، ما تنها با تعدادی از ابزارهای داده‌کاوی موجود در حال حاضر آشنا شدیم. تصمیم شما در مورد بهترین ابزار برای نیازهایتان، به اندازه و ساختارهای داده‌ای که ابزار پشتیبانی می‌کند، ویژگی‌هایی که ارائه می‌دهد، قابلیت‌های مصور سازی داده‌ها، نیازهای زیرساختی، سهولت استفاده و قابلیت یادگیری آن بستگی دارد. استفاده از ترکیبی از ابزارهای داده‌کاوی برای برآورده کردن تمام نیازهای شما نسبتاً رایج است.

ابزارهای داده‌کاوی

توضیحات

آشنایی با نرم‌افزارها و ابزارهای رایج داده‌کاوی

دسترسی محدود
برای مشاهده کامل این قسمت، دوره را تهیه کنید

پس از خرید، به همه قسمت‌های این دوره دسترسی خواهید داشت.

هزینه دوره40٪ تخفیف
1,000,000 تومان600,000 تومان
فهرست دوره

مقدمه‌ای بر تحلیل داده

8 ساعت و 32 دقیقه
68 قسمت