شناسایی الگو - یادگیری ماشین

حل تشریحی سوالات شناسایی الگو - یادگیری ماشین - کنکور دکتری مهندسی کامپیوتر 1403

سوالات شناسایی الگو - یادگیری ماشین

25 سوال
66.

یک شبکه عصبی پرسگترونی، با دو نهرون در لایه ورودی، 3 نرون در لایه پنهان و یک نرون در لایه خروجی داریم. کدام‌یک از توابع فعالیت زیر (برای نرون‌های لایه پنهان) فضای دوبعدی ورودی را به نقاط داخلی مکعبی به اضلاع واحد نگاشت می‌کند؟

1)

پله واحد

2)

تانژانت هیپربولیک

3)

ReLu

4)

سیگموئید

67.

در یک مسئله طبقه‌بندی دو کلاسه با روش C-SVM در صورت افزایش C، کدام مورد در رابطه با عرض حاشیه (margin) درست است؟

1)

تغییر نمی‌کند.

2)

افزایش می‌یابد.

3)

کاهش می‌یابد.

4)

در حالت کلی نمی‌توان اظهار نظر کرد.

68.

شکل زیر، طبقه‌بندی داده‌ها با دو کلاس سفید و سیاه را نشان می‌دهد. دو نمونه داده خط‌چین 1 و 2، هنوز طبقه‌بندی نشده‌اند. اگر از روش K_NN، با مقادیر K=1، K=3 بدون تابع وزن‌دهی استفاده کنیم، کلاس‌های اختصاص یافته به این دو نمونه، کدام است؟

69.

برای بردار تصادفی x با میانگین صفر، در مورد تعداد مقادیر ویژه غیرصفر ماتریس همبستگی و ماتریس کوواریانس آنها کدام مورد درست است؟

1)

برابر است.

2)

در حالت کلی نمی‌توان اظهار نظر کرد.

3)

تعداد مربوط به ماتریس همبستگی بیشتر است.

4)

تعداد مربوط به ماتریس کوواریانس بیشتر است.

70.

ضریب همبستگی بین دو ویژگی i و j با استفاده از کواریانس آنها، با رابطه تعریف می‌شود که و انحراف معیار دو ویژگی است. کدام مورد در خصوص ضریب همبستگی درست است؟

1)

همواره نامنفی است.

2)

می‌تواند مثبت یا منفی باشد.

3)

هر عدد حقیقی می‌تواند باشد.

4)

اگر ضریب همبستگی این دو ویژگی صفر باشد، ویژگی‌ها مستقل از هم هستند.

71.

اگر فاصله ماهالانوبیس دو نقطه برابر و فاصله اقلیدسی همان نقاط باشد، کدام مورد همواره درست است؟

1)

2)

3)

4)

در حالت کلی، نمی‌توان اظهار نظر کرد.

72.

برای طبقه‌بندی یک مسئله 2 کلاسه، از یک پرسپترون (با بردار وزن w و بایاس با تابع فعالیت زیر، استفاده شده است. در صورتی که بردار وزن اولیه w را صفر درنظر بگیریم، پس از وارد کردن فقط یک داده به پرسپترون، کدام یک از شروط زیر باید برقرار باشد تا کلیه وزن‌های w صفر باقی بمانند؟

1)

و ورودی متعلق به کلاس یک باشد.

2)

و ورودی متعلق به کلاس صفر باشد.

3)

و ورودی متعلق به کلاس صفر باشد.

4)

و ورودی متعلق به کلاس یک باشد.

73.

در یک مسئله دو کلاسه و دوبعدی، مرز تصمیم برای یک طبقه‌بندی از نوع درخت تصمیم، چه شکلی می‌تواند داشته باشد؟


1)

تعدادی هذلولی

2)

تعدادی خط مایل

3)

تعداد خطوط افقی و عمودی

4)

تعدادی دایره یا بیضی

74.

در طبقه‌‎بندی کننده بیز دوکلاسه با دو ویژگی، مرز تصمیم کدام‌یک از حالت‌های زیر نمی‌تواند باشد؟

1)

دو خط متقاطع

2)

هذلوله

3)

بیضی

4)

سهمی

75.

در یک مسئله طبقه‌بندی دو کلاسه، نتایج زیر به‌سوی داده‌های تست به‌دست آمده است. x چه مقداری نمی‌تواند باشد؟

20= تعداد داده‌ها در کلاس منفی

1)

صفر

2)

1

3)

2

4)

3

76.

و را دو کلاس در نظر بگیرید که توابع توزیع بردار ویژگی x در دو کلاس، به‌صورت و است. اگر، و ، آنگاه رابطه مرز تصمیم دو کلاس توسط Bayesian classifier کدام است؟ (توجه: در گزینه‌ها، K را تابعی از ها در نظر بگیرید.)e


1)

2)

3)

4)

77.

در یک نرون عصبی از نوع پرسپترون، از تابع فعالیت سیگموئید (تابع زیر) استفاده شده است. اگر خروجی نرون برای یک ورودی خاص شده باشد، مقدار مشتق تابع سیگموئید در آن لحظه، چه مقدار است؟

1)

2)

3)

4)

78.

کدام روش زیر، نمی‌تواند به خطای آموزش صفر برای هر دادگان جدایی‌پذیر خطی برسد؟

1)

پرسگترون

2)

درخت تصمیم

3)

k-NN با k=1

4)

Hard-margin SVM

79.

در یک پرسپترون که از تابع فعالیت سیگموئید استفاده می‌کند، کدام مورد درست است؟

1)

فقط امکان انفجار گرادیان وجود دارد.

2)

فقط امکان محوشدگی گرادیان وجود دارد.

3)

محوشدگی گرادیان و انفجار گرادیان برای آن، ممکن نیست.

4)

ممکن است هم دچار محوشدگی گرادیان و هم انفجار گرادیان بشود.

80.

از بین طبقه‌بندی‌های نمودار ROC شکل زیر، کدام‌یک به تصمیم تصادفی نزدیک‌تر است؟ ( مربوط به ضلع بالا و سمت چپ مربع است).

1)

2)

3)

4)

81.

در صورتی که بخواهیم یک تابع خطای محدب f(x) را با روش stochastic gradient descent به حداقل برسانیم، با فرض شروع از یک نقطه اختیاری، کدام مورد زیر درباره ضریب یادگیری در مرحله t (یعنی )، رسیدن به پاسخ بهینه سراسری را تضمین می‌کند؟

1)

اگر در هر مرحله، باشد.

2)

اگر در هر مرحله، و باشد.

3)

اگر در هر مرحله، به‌صورت تغییر کند.

4)

اگر در هر مرحله، به‌صورت تغییر کند.

82.

در یک دسته داده جدایی‌پذیر خطی دوکلاسه، یک طبقه‌بند Hard SVM آموزش داده‌ایم، اگر داده جدیدی به دادگان آموزشی اضافه شود، به قسمتی که در داخل حاشیه (margin) قرار گرفته و دادگان کماکان جدایی‌پذیر خطی باقی بمانند، در صورت آموزشی مجدد سیستم با دادگان جدید، کدام مورد در خصوص عرض حاشیه، درست است؟

1)

تغییر نمی‌کند.

2)

کوچکتر از قبل می‌شود.

3)

بزرگ‌تر از قبل می‌شود.

4)

در حالت کلی، نمی‌توان اظهارنظر کرد.

83.

در یک طبقه‌بندی دوکلاسی تک بُعدی که نسبت احتمال پیشین دو کلاس است، یک ویژگی داریم که تابع چگالی احتمال آن در دو کلاس، به‌صورت زیر داده شده است. مرز طبقه‌بند بیز کدام است؟

؟؟؟

1)

صفر

2)

1

3)

4)

4

84.

در یک مسئله k-nn با مقدار k=1، در صورتی که تعداد داده‌ها به سمت بی‌نهایت میل کند، تضمین می‌شود که خطای سیستم، از چه حدی نسبت به خطای بیز، فراتر نمی‌رود؟

1)

ربع

2)

نصف

3)

دو برابر

4)

چهار برابر

85.

در یک مسئله طبقه‌بندی دوکلاسی با سه ویژگی، بردار میانگین و ماتریس کوواریانس دو کلاس، به‌صورت زیر داده شده است. می‌خواهیم با معیار فیشر (نسبت پراکندگی بین کلاس به پراکندگی درون کلاسی) از بین سه ویژگی، ویژگی بهتر را انتخاب کنیم. کدام ویژگی بهتر است؟

1)

اول

2)

دوم

3)

سوم

4)

تمایزی بین سه ویژگی نیست.

86.

در فضای دوبُعدی ، دو داده از دو کلاس به‌صورت زیر داریم (داده‌های معروف به XOR)، با تبدیل ، این چهار داده را به فضای دوبُعدی می‌بریم. با کدام تبدیل، در فضای داده‌ها جدایی‌پذیر خطی خواهند بود؟


XOR

0

0

0

1

1

0

1

0

1

0

1

1


1)

2)

3)

4)

87.

از یک متغیر تصادفی گوسی با متوسط مجهول و واریانس معلوم، N مشاهده را داریم: ، با روش Maximum Likelihood ، مقدار متوسط را تخمین زده و آن را می‌نامیم. اگر به N داده فوق، یک داده دیگر که از همان توزیع تولید شده اضافه کنیم و مجددا با روش ML، متوسط را تخمین زده و بنامیم، کدام رابطه، همواره درست است؟

1)

2)

3)

4)

در حالت کلی، نمی‌توان در مورد برابری و اظهار نظر کنیم.

88.

کدام مورد درباره خوشه‌بندی k-means، درست است؟

1)

یک روش با نظارت است.

2)

با افزایش تعداد خوشه‌ها، هرگز نمی‌توان مقدار بهینه تابع هزینه را افزایش داد.

3)

مقادیر مراکز نهایی خوشه‌ها، همواره مستقل از مقادیر مراکز اولیه خوشه‌ها هستند.

4)

مستقل از مقادیر تنظیمات اولیه، این روش همواره به یک جواب منحصر به فرد می‌رسد.

89.

کدام مورد درباره روش bagging، درست است؟

1)

در این روش، از نمونه‌برداری تصادفی با جایگذاری استفاده می‌شود.

2)

هدف اصلی آن کاهش با یاس الگوریتم یادگیرنده است.

3)

تنها زمانی به کارای بالاتر از یادگیرنده (learner) اولیه می‌رسد که دقت همگی آنها، کمتر از 0/5 باشد.

4)

در صورت استفاده از آن برای Logistic regression، پاسخ خوبی به‌دست نمی‌آید، زیرا همه یادگیرنده‌ها (learners)، دقیقا به یک مرز تصمیم می‌رسند.

90.

در مقایسه دو طبقه‌بند نزدیک‌ترین همسایگی 1-NN با 3-NN، کدام مورد در رابطه با 1-NN درست است؟

1)

دارای واریانس و بایاس کمتری است.

2)

دارای واریانس و بایاس بیشتری است.

3)

دارای واریانس کمتر و بایاس بیشتری است.

4)

دارای واریانس بیشتر و بایاس کمتری است.