صفحه اصلی

تست لایک

کنکور دکتری

مهندسی کامپیوتر - نرم افزار

شناسایی الگو - یادگیری ماشین

حل تشریحی سوالات شناسایی الگو - یادگیری ماشین - کنکور دکتری مهندسی کامپیوتر 1401

منوی آزمون (درس ها)

درباره آزمون ساختمان داده ها و طراحی الگوریتم ها(20 سوال)مدار منطقی و معماری کامپیوتر(20 سوال)سیستم های عامل پیشرفته(15 سوال)پایگاه داده های پیشرفته(10 سوال)شناسایی الگو - یادگیری ماشین(25 سوال)شبکه های پیشرفته(10 سوال)معماری کامپیوتر پیشرفته - VLSI پیشرفته(25 سوال)

سوالات شناسایی الگو - یادگیری ماشین

25 سوال

77.

از یک جمعیت که تابع توزیع تجمیعی احتمال (CDF) آن به صورت F(x) است به تعداد ۲۰ نمونه به صورت i.i.d انتخاب شده است که تعداد و بازه نمونه های به دست آمده به صورت جدول زیر است. تخمین MLE برای پارامتر $θ$ کدام است؟

$F (x) = 1 - \frac{θ}{x}$ $for θ < x < \infty$

1)

5

2)

5/5

3)

5/75

4)

6

مشاهده پاسخ ها

78.

در صورتی که داده های شکل زیر را به کمک SVM خطی (Hard Margin Linear SVM) دسته بندی نماییم، ضریب لاگرانژ $α$ متناظر با داده $[10]$ پس از حل Dual، تابع هدف کدام است؟

1)

0/33

2)

1/5

3)

2/5

4)

3/5

مشاهده پاسخ ها

79.

اگر بخواهیم از آزمون فرض‌ها برای انتخاب یا عدم انتخاب ویژگی در یک مسئله از دسته بندی دودسته‌ای استفاده کنیم و بخواهیم پذیرش یا رد پذیرش یا رد فرض صفر $H_{0} : Δ μ = μ_{1} - μ_{2} = 0$ را به کمک N نمونه $x_{1}, x_{2}, \dots, x_{N}$ از دسته 1 و N نمونه $y_{1}, y_{2}, \dots, y_{N}$ از دسته 2 را بررسی کنیم، در صورتی که واریانس ویژگی‌های دو دسته برابر باشند، $(σ_{1}^{2} = σ_{2}^{2})$ و مقدار واریانس دسته ها را ندانیم، مقدار Test Statistic در مورد نظر کدام است؟

$\overline{\overline{x}} = \frac{1}{2} \sum_{i = 1}^{N} x_{i}$ و $\overline{y} = \frac{1}{n} \sum_{i = 1}^{N} y_{i}$

1)

$q = \frac{( x - y ) - ( μ _{1} - μ _{2} )}{( 2 N ) ( 1 2 N - 2 ) ( \sum _{i = 1}^{N} ( x _{i} - x ) ^{2} + \sum _{i = 1}^{N} ( y _{i} - y ) ^{2} )}$

2)

$q = \frac{( x - y ) - ( μ _{1} - μ _{2} )}{\frac{1}{2 N} ( \frac{1}{N} ( \sum _{i = 1}^{N} ( x _{i} - x ) ^{2} + \frac{1}{N} \sum _{i = 1}^{N} ( y _{i} - y ) ^{2} ) )}$

3)

$q = \frac{( x - y ) - ( μ _{1} - μ _{2} )}{\frac{1}{2 N - 2} \frac{2}{N} ( \sum _{i = 1}^{N} ( x _{i} - x ) ^{2} + \sum _{i = 1}^{N} ( y _{i} - y ) ^{2} )}$

4)

$q = \frac{( x - y ) - ( μ _{1} - μ _{2} )}{\frac{1}{2 N - 2} ( \frac{1}{N} ( \sum _{i = 1}^{N} ( x _{i} - x ) ^{2} + \frac{1}{N} \sum _{i = 1}^{N} ( y _{i} - y ) ^{2} ) )}$

مشاهده پاسخ ها

79.

کدام یک از دو ماتریس داده شده زیر ماتریس کوواریانس معتبر است؟

$A = 1 - 1 2 - 1 2 - 1 2 - 1 1 B = 4 - 1 1 - 1 4 - 1 1 - 1 4$

1)

فقط B

2)

فقط A

3)

هر دو ماتریس A و B

4)

هیج کدام

مشاهده پاسخ ها

80.

کدام یک از دسته بندهای زیر قادر به جداسازی صحیح داده های آموزشی شکل زیر دسته های دایره و مثلث است؟

1 Logistic regression

2 SVM with linear kernel

3 SVM with RBF kernel

4 Decision tree

5 3-nearest-neighbor classifier (with Euclidean distance)

1)

1:no,2:no,3:yes,4:yes,5:no

2)

1:no,2:no,3:yes,4:no,5:no

3)

1:yes,2:no,3:no,4:yes,5:no

4)

1:no,2:no,3:no,4:yes,5:no

مشاهده پاسخ ها

81.

داده های شکل زیر را در نظر بگیرید اولین مولفه اساسی کدام است؟

1)

$[0, 1]^{T}$

2)

$[1, 0]^{T}$

3)

$[2, 1]^{T}$

4)

$[2, - 1]^{T}$

مشاهده پاسخ ها

82.

مجموعه نقاط دو بعدی در دو کلاس مفروض به شرح زیر میباشند.

$C_{1} = {(0, - 1)^{T}, (1, 0)^{T}, (2, 1)^{T}}$

$C_{2} = {(1, 1)^{T}, (- 1, 1)^{T}, (- 1, - 1)^{T}, (- 2, - 1)^{T}}$

T به معنای ترانهاده بردار است، مؤلفه اصلی این نقاط کدام است؟

1)

$\frac{1}{34} (53)$

2)

$\frac{1}{34} (153)$

3)

$\frac{1}{34} (53)$

4)

$\frac{1}{34} (153)$

مشاهده پاسخ ها

83.

یک دسته بند از نوع بیزسالو (NaiveBayes) با سه متغیر ورودی دودویی Boolean $x_{1}$ و $x_{2}$ و $x_{3}$ برچسب دودویی y را در نظر بگیرید. برای آموزش این طبقه چه تعداد پارامتر باید تخمین زده شود؟

1)

5

2)

6

3)

7

4)

8

مشاهده پاسخ ها

84.

در صورتی میگوییم فرضیه (یا مدل) h بر روی داده های آموزشی overfit شده است که، فرضیه دیگری مانند $h^{'}$ وجود داشته باشد و . .................

1)

خطای $h^{'}$ بر روی داده های آموزشی کمتر از h و خطای h بر روی کل توزیع داده ها کمتر از $h^{'}$ باشد.

2)

خطای h بر روی داده های آموزشی کمتر از $h^{'}$ و خطای $h^{'}$ بر روی کل توزیع داده ها کمتر از h باشد.

3)

خطای h بر روی داده های آموزشی بیشتر از خطای $h^{'}$ روی داده‌های تست باشد.

4)

خطای $h^{'}$ بر روی داده های آموزشی بیشتر از خطای h روی داده‌های تست باشد.

مشاهده پاسخ ها

85.

کدام یک از موارد زیر میتواند موجب کاهش بیش برازش در SVM شود؟

1)

کاهش واریانس کرنل RBF

2)

Soft margin در نظر گرفتن

3)

افزایش درجه کرنل چند جمله ای

4)

افزایش ضریب بخش مربوط به جریمه دسته بندی نادرست (C)

مشاهده پاسخ ها

86.

زنجیره مارکوف مربوط به یک بازی با دیاگرام گذر زیر را در نظر بگیرید.

فرض کنید با شروع از حالت $i$ ، انقدر بازی را ادامه میدهید تا زمانی که به یکی از حالتهایه 0 یا N برسید که در این صورت بازی تمام است با شروع از حالت i، به طور متوسط چقدر طول میکشد تا بازی تمام شود؟

1)

i

2)

N-i

3)

i(N-i)

4)

$\frac{1}{2} (N - i)$

مشاهده پاسخ ها

87.

یک مجموعه داده در فضای دوبعدی به‌صورت $(X_{1}, X_{2}, Y)$ را در نظر بگیرید که در آن $X_{1}$ و $X_{2}$ ویژگی های داده و Y برچسب داده است. پس از یادگیری پارامترهای دسته بند بیز ساده (Naive Bayes) جدول زیر به دست آمده است. اگر بدانیم درست نمایی (likelihood) دو نمونه (1,0,1) و (0,1,0) در مدل داده شده برابر $\frac{1}{180}$ آنگاه P(Y = 1) کدام است؟

1)

$\frac{3}{4}$

2)

$\frac{2}{3}$

3)

$\frac{1}{2}$

4)

$\frac{1}{4}$

مشاهده پاسخ ها

88.

کدام یک از روابط زیر رابطه حد بالای Sample complexity با بعد VC را در چارچوب یادگیری PAC به درستی نشان میدهد؟

1)

$m \geq max (\frac{1}{\in} lo g_{2} (\frac{1}{δ}), \frac{V C ( H ) - 1}{32 \in})$

2)

$m \geq \frac{1}{2 \in ^{2}} (4 ln (\frac{1}{\in}) + 8 V C (H) ln (\frac{1}{δ}))$

3)

$m \geq \frac{1}{2 \in ^{2}} (4 lo g_{2} (\frac{2}{δ}) + V C (H) lo g_{2} (\frac{13}{\in}))$

4)

$m \geq \frac{1}{\in} (4 lo g_{2} (\frac{2}{δ}) + 8 V C (H) lo g_{2} (\frac{13}{\in}))$

مشاهده پاسخ ها

89.

فرض کنید یک مجموعه داده برای رگرسیون در اختیار دارید که توسط یک چند جمله ای درجه ۳ تولید شده است.

در مورد بایاس و واریانس مدلهای تخمین گر زیر بر روی مجموعه داده ذکر شده نسبت به مدل واقعی تولید کننده داده کدام نتیجه گیری درست است؟

1)

1

2)

2

3)

3

4)

هیچ‌کدام

مشاهده پاسخ ها

90.

اگر ماتریس کوواریانس یک مجموعه داده به صورت ماتریس C باشد نسبت پراکندگی داده در جهت مؤلفه اول First component به جهت مؤلفه دوم Second component (یا همان $\frac{λ _{1}}{λ _{2}}$ ) در روش کاهش ابعاد PCA به کدام عدد نزدیکتر است؟

$C = \frac{1}{5} (18552)$

1)

3

2)

9

3)

20

4)

34

مشاهده پاسخ ها

91.

به عنوان یک ایده اگر بخواهیم از بسط تیلور برای تخمین بهتر مقدار تابع هزینه C حول نقطه w در شبکه های عصبی استفاده کنیم و فرایند نزول در امتداد گرادیان (Gradient descent) را برای یافتن وزنهای بهینه به صورت موثرتری انجام دهیم در صورتی که فقط از سه جمله اول بسط استفاده کنیم رابطه $Δ w$ به چه صورت خواهد بود؟ ( $η$ نرخ یادگیری $Λ C$ بردار گرادیان تابع هزینه و H ماتریس هسیان (Hessian matrix) تابع هزینه است که در آن $H [i, j] = δ^{2} C . δ w_{i} δ w_{j}$ است.)

1)

$Δ w = - η H^{- 1} \forall C$

2)

$Δ w = - η H \forall C$

3)

$Δ w = - ηH H^{- 1} \forall C$

4)

استفاده از ایده بسط تیلور بدین منظور مفید نیست.

مشاهده پاسخ ها

92.

کدام مورد در خصوص الگوریتم خوشه بندی k-means نادرست است؟

1)

نسبت به داده های نویزی حساسیت بالایی دارد.

2)

با رسیدن به بهینه سراسری خاتمه پیدا می کند.

3)

از نظر زمان کارا است و مرتبه زمانی مطلوبی دارد.

4)

نسبت به داده های پرت (outlier) حساسیت بالایی دارد.

مشاهده پاسخ ها

93.

کدام روش برای مواجهه با بیش برازش شدن (overfitting) درخت تصمیم مناسب نیست؟

1)

اجازه دهیم که درخت به داده های آموزشی overfit شود و سپس با استفاده از داده های اعتبار سنجی، برخی انشعاب های درخت را هرس کنیم.

2)

در حین آموزش درخت تصمیم پیش از اینکه درخت همه داده های آموزشی را به درستی دسته بندی کند، به صورت زودهنگام به ساخت درخت خاتمه دهیم.

3)

اجازه دهیم که درخت به داده های آموزشی overfit شود، و سپس درخت را به مجموعه قوانین تبدیل میکنیم و با استفاده از داده های اعتبار سنجی برخی از قوانین را حذف کنیم.

4)

داده های آموزشی را با استفاده از نمونه برداری نامتوازن (imbalance کنیم و سپس با استفاده از داده های نامتوازن شده آموزش درخت را انجام دهیم.

مشاهده پاسخ ها

94.

کدام یک از روشهای زیر از روشهای یادگیری تنبل (lazy) محسوب نمی شود؟

1)

(Locally weighted regression) رگرسیون محلی وزن دار

2)

(Case based reasoning) استدلال مبتنی بر مورد

3)

بردار ماشین پشتیبان (SVM)

4)

نزدیکترین همسایه (KNN)

مشاهده پاسخ ها

95.

داده های زیر را در نظر بگیرید که مؤلفه دوم برچسب داده و مؤلفه اول بردار ویژگی داده است.

$x_{1} ((03), 1) x_{2} ((12), 1) x_{3} ((21), 1) x_{4} ((54), 1)$

در صورتی که برای جداسازی دو دسته از ماشین بردار پشتیبان (SVM) استفاده شود. در تابع هزینه $\frac{1}{2} ω^{T} ω - \sum_{i = 1}^{4} α_{i} [y_{i} (ω^{T} x_{i} + b) - 1]$ مقدار $α_{4}$ به کدام است؟ ( $y_{i}$ برچسب داده i ام است.)

1)

0/5

2)

0/25

3)

صفر

4)

-0/5

مشاهده پاسخ ها

96.

شبکه بیزین با ۹ متغیر دودویی به شکل زیر را در نظر بگیرید کدام یک از روابط زیر همیشه در مورد این شبکه

درست است؟

1)

P(A.I)=P(A)P(I)

2)

P(C|B.F)=P(C|F)

3)

P(A,B|G)=P(A|G)P(B|G)

4)

P(B.H|E.G) = P(B|EG)P(H|E.G)

مشاهده پاسخ ها

97.

یک کرنل گاوسی با رابطه $k (x_{1}, x_{2}) = e^{- \frac{∥ x _{1} - x _{2} ∥ ^{2}}{2}}$ را در نظر بگیرید. فاصله بین دو بردار ویژگی $X_{1} = [1, 1]^{T}$ و $X_{2} = [2, 2]^{T}$ در فضای جدید برابر با کدام مورد است؟

1)

$2$

2)

$e^{- 1}$

3)

$e^{- \frac{1}{2}}$

4)

$2 - \frac{2}{e ^{2}}$

مشاهده پاسخ ها

98.

فرض کنید در حال انجام یک بازی با دو سکه هستید. سکه اول با احتمال $θ$ و سکه دوم با احتمال $2 θ$ شیر می آید.

پس از چندین پرتاب این سکه‌ها نتایج به شکل جدول زیر به‌دست آمده است:

مقدار Log-Likelihood این داده ها بر اساس $θ$ چقدر است؟

1)

$lo g 2 + 3 lo g (1 - 2 θ)$

2)

$lo g 2 + 2 lo g θ + 3 lo g (1 - 2 θ)$

3)

$2 lo g θ + 3 lo g (1 - 2 θ)$

4)

$lo g 2 + 2 lo g θ$

مشاهده پاسخ ها

99.

کدام گزینه بعد VC یک دسته بند $- NN$ (نزدیکترین همسایه) را نشان میدهد که N تعداد نمونه های آموزشی است؟

1)

1

2)

2

3)

$\infty$

4)

N

مشاهده پاسخ ها

100.

در رابطه با روش خوشه بندی مقید (constraint clustering) کدام گزینه نادرست است؟

1)

روش خوشه بندی مقید یک روش بدون نظارت (unsupervised) است.

2)

برخی الگوریتم های خوشه بندی مقید قیدها را به صورت قید سخت و برخی دیگر به صورت قید نرم در نظر می گیرند.

3)

در روش خوشه بندی مقید در مورد نمونه های داده که باید در یک خوشه قرار بگیرند قیدها با راهنمایی هایی ارائه می شود.

4)

در روش خوشه بندی مقید در مورد نمونه های داده که باید در خوشه های متمایز قرار بگیرند قیدها با راهنمایی هایی ارائه می شود.

مشاهده پاسخ ها