معماری کامپیوتر پیشرفته - VLSI پیشرفته

حل تشریحی سوالات معماری کامپیوتر پیشرفته - VLSI پیشرفته - کنکور دکتری مهندسی کامپیوتر 1404

سوالات معماری کامپیوتر پیشرفته - VLSI پیشرفته

25 سوال
101.

کدام یک از موارد زیر، از مزایای روش (Interleaved Memory) به نسبت راه کارهایی که از این روش استفاده نمی کنند نیست؟

1)

کاهش CPI پردازنده ها

2)

کاهش سربار پیاده سازی حافظه ها

3)

افزایش Concurrency (همروندی) در اجرای برنامه ها

4)

افزایش سرعت دسترسی به Chip تراشه های حافظه اصلی به دلیل حجم کوچک تر Chipها

102.

دو معماری کامپیوتر زیر را در نظر بگیرید. کدام مورد در خصوص نحوه آدرس دهی حافظه نهان معماری "الف" و "ب" به ترتیب درست است؟ (راهنمایی: هر دو معماری از آدرس دهی Vityual استفاده می کنند.)

1)

logical و logical

2)

physical و logical

3)

physical و physical

4)

logical و physical

103.

با در نظر گرفتن سربار پیاده سازی سیاست های نوشتن Write through و Write back، کدام سیاست برای پیاده سازی L1 Instruction Cache پیشنهاد می شود؟

1)

Write Back با حذف فیلد Dirty یا Use

2)

تفاوتی بین آنها از نظر سربار پیاده سازی نیست.

3)

Write Back

4)

Write through

104.

تحت چه شرایطی (Clock Cycle Per Instruction)CPI می تواند کوچکتر از 1 باشد؟

1)

با تغییر ساختار حافظه پنهان

2)

زمانی که در خط لوله هیچ گونه هزاردی نداشته باشیم.

3)

زمانی که تعدادی از دستورات بتوانند به صورت موازی اجرا شوند.

4)

در حالت ایدآل، مقدار CPI می تواند 1 باشد و کمتر از 1 امکان پذیر نیست.

105.

یکی از راه های کاهش نرخ شکست (Miss Rate) در طراحی حافظه نهان، افزایش ظرفیت حافظه نهان می باشد. کدام یک از موارد زیر، از معایب این روش است؟

1)

افزایش زمان Hit Time

2)

افزایش Miss Penalty

3)

افزایش Miss Time

4)

افزایش CPI

106.

در یک پردازنده 2-issue superscalar از تکنیک loop unrolling برای حذف / کاهش تأخیر ناشی از وابستگی های داده ای استفاده می شود. پردازنده امکان اجرای موازی یک دستور ممیز شناور را به همراه هر دستور از نوع دیگری (غیر از ممیز شناور) مثل مراجعه به حافظه و یا محاسبات اعداد صحیح دارد. جدول زیر، میزان تأخی آماده سازی نتایج در اجرای متوالی دستورات را در واحد پالس ساعت نشان می دهد. اگر فرض کنیم که برای اجرای دستورات حلقه زیر از دوبار باز کردن حلقه (unrolling=2) استفاده شود، تعداد پالس های ساعت مورد نیاز برای اجرای تکه کد زیر چقدر است؟

(دستورات بررسی شرط و پرش شرطی، هر کدام یک پالس ساعت تأخیر نیاز دارند.

تأخیر

نوع دستور بعدی

نوع دستور در حالِ اجرا

3

ممیز شناور

ممیز شناور

2

نوشتن در حافظه

ممیز شناور

1

ممیز شناور

خواندن از حافظه

0

نوشتن در حافظه

خواندن از حافظه

0

محاسبات صحیح

محاسبات صحیح

Loop:L.D F0,0 ;F0=array element

ADD.D F4,F0,F2 ;floating point add

S.D 0(R1),F4 ;store result

SUBI R1,R1.#8 ;decrement pointer

BNEZ R1,Loop ;branch

1)

11

2)

10

3)

9

4)

8

107.

در حافظه نهان با ثابت نگه داشتن ظرفیت کل آن (total cache size)، اندازه بلاک ها را افزایش داده ایم. کدام مورد در خصوص انواع نرخ نبود داده (cach miss) اعم از Compulsory و Capacity درست است؟

1)

موجب کاهش نرخ نبودِ داده از نوع conflict می شود.

2)

موجب افزایش نرخ نبودِ داده از نوع conflict می شود.

3)

موجب ثابت ماندن نرخ نبودِ داده از نوع conflict می شود.

4)

به طور موقت، باعث کاهش نرخ نبود داده از نوع Compulsory می شود.

108.

در رویکرد پیش بینی انشعاب (Dynamic branch predictin)، روش پیش بینی انشعاب دوبیتی (2-bit predictor) در حلقه تودرتوی زیر، چند بار پیش بینی نادرست دارد؟ (فرض کنید اولین پیش بینی درست باشد.)

1)

200

2)

201

3)

202

4)

20000

109.

در یک پردازنده با خط لوله 5 مرحله ای و قابلیت پیش بینی انشعاب، برنامه ای در حال اجرا است که 20 درصد دستورات آن، انشعاب هستند. فرض کنید Clock Per Instruction (CPI) در حالت ایده آل برابر 1/2 باشد. اگر دقت پیش بینی انشعاب 80 درصد باشد و هر پیش بینی اشتباه 4 چرخه ساعت هزینه زمانی داشته باشد، میزان CPI چه مقدار خواهد بود؟

1)

1/36

2)

2

3)

2/24

4)

4/4

110.

در پردازنده ای با معماری 32 بیتی، میزان حافظه نهان 8KB است و با تکنیک Direct map پیاده سازی شده. اندازه هر بلاک حافظه نهان 4 کلمه و هر کلمه 4 بایت است. برای جستجوی داده در این حافظه، پهنای مقایسه گری که داده مورد نظر CPU را با داده موجود در حافظه بررسی می کند، چند بیت است؟

1)

32

2)

20

3)

19

4)

9

111.

کاربرد الگوریتم توماسلو (Tomasulo) چیست؟

1)

کاهش هزاردهای ساختاری

2)

کاهش هزاردهای وابستگی داده ها

3)

کاهش هزاردهای کنترلی

4)

موارد 2 و 3

112.

پردازنده ای دارای ساختار خط لوله است. 4 ایستگاه اول باید طی شود تا آدرس دستورات پرش محاسبه شود. بعد از آن 2 ایستگاه دیگر طی شود تا صحت شرط مشخص شود. اگر استراتژی برخورد با دستورات پرش، فرض بر taken بودن باشد ولی دستوری که وارد شده not taken باشد، آنگاه تعداد تأخیر (stall) برای این شرایط، چند پالس ساعت می شود؟

113.

وقتی از cache استفاده می شود، برای کاهش زمان دسترسی به حافظه می توان از روش critical word first استفاده کرد یعنی وقتی که miss رخ می دهد ابتدا کلمه مورد نظر CPU و سپس بقیه کلمات بلوک را بخواند. این استراتژی باعث بهبود چه موردی می شود؟

1)

کاهش miss rate

2)

کاهش hit time

3)

کاهش miss penalty

4)

کاهش hit time و افزایش miss penalty

114.

در یک پردازنده با 4 هسته پردازشی و فرکانس کاری 2GHz، 10 درصد دستورات در هسته ها نیاز به ارتباط با سایر هسته ها دارند و به ازای آن دستورات، عملیات هسته مربوط تا اجابت درخواست به مدت 2 نانوثانیه متوقف می شود. اگر CPI در پردازنده در حالتی که به ارتباط بین هسته ها نیاز نباشد، برابر 0/3 درصد دستورات آن نیاز به ارتباط دارند و زمان انتظار پردازنده در هر ارتباط 3 نانو ثانیه است، به چه میزان است؟

1)

3

2)

2/4

3)

2

4)

1/5

115.

در سیستم چندپردازنده (Multiprocessors) برای همگن بودن حافظه های نهان همه پردازنده ها (cache coherence) از روش بشنود (Snooping) استفاده می شود. اگر یک بلوک از حافظه در حافظه نهان چند پردازنده مختلف باشد و یکی از آن پردازنده ها بخواهد که محتویات بلوک مذکور را تغییر دهد، چه وقایعی رخ می دهد؟

1)

پردازنده نویسنده، بلوک را exclusive می برد و بقیه پردازنده ها بلوک را shared می کنند.

2)

پردازنده نویسنده، بلوک را به حالت invalid می برد و بقیه پردازنده ها بلوک را exclusive می کنند.

3)

پردازنده نویسنده، بلوک را به حالت shared می برد و بقیه پردازنده ها بلوک را invalid می کنند.

4)

پردازنده نویسنده، بلوک را به حالت exclusive می برد و بقیه پردازنده ها بلوک را invalid می کنند.

116.

کدام مورد، در خصوص عواقب ناشی از عدم رعایت قواعد طراحی درست نیست؟

1)

افزایش تعداد متوسط تراشه های خراب در مرحله ساخت

2)

معمولا، کاهش طول عمر تراشه

3)

خراب شدن تابع منطقی طرح

4)

افزایش احتمالی تأخیر طرح

117.

کدام مورد در خصوص قفل شدگی (Latchup) و اثر بدنه (Body effect) درست است؟

1)

اثر بدنه وابسته به مقدار ولتاژ آستانه است و با تغییر ضخامت عایق زیر گیت می توان آن را از بین برد.

2)

اثر بدنه با تغییر لی اوت یک گیت قابل رفع نیست ولی قفل شدگی را با تغییر رسم لی اوت می توان از بین برد.

3)

هم اثر بدنه و هم قفل شدگی را با تغییر نوع فناوری ساخت می توان از بین برد.

4)

هم اثر بدنه و هم قفل شدگی را با تغییر رسم لی اوت می توان از بین برد.

118.

به ورودی وارونگر زیر، سیگنالی با پریود 10 نانو ثانیه و با ولتاژ 3/3 ولت متصل شده است. مقدار توان دینامیکی مصرف شده در این دروازه، به طور تقریبی کدام است؟

1)

5mW

2)

12mW

3)

4)

119.

در حافظه فقط خواندنی زیر، بیت های بیت های آدرس و بیت های داده خروجی هستند. محتوای دو آدرس 0001 و 1010 به ترتیب کدام است؟

1)

0011 و 0001

2)

0100 و 1000

3)

0100 و 0001

4)

0010 و 1000

120.

اگر تعداد ماسک های مورد نیاز برای ساخت یک ترانزیستور NMOS با یک لایه فلز در یک فناوری ساخت، برابر با 4 ماسک باشد، تعداد ماسک های لازم برای ساخت یک PMOS با 6 لایه فلز کدام است؟

1)

15

2)

10

3)

9

4)

8

121.

در لی اوت زیر، پورت های C، B، A و C=NOT(C) ورودی های مدار و Z خروجی آن است. این لی اوت (lay out) چه تابع منطقی را پیاده می کند؟

1)

AND سه ورودی

2)

MUX دو به یک

3)

NOR سه ورودی

4)

NAND سه ورودی

122.

بافر دوطبقه زیر را در نظر بگیرید. بهترین اندازه برای طبقه دوم (x) برای اینکه تأخیر شارژ خازن خروجی حداقل شود، کدام است؟

1)

20

2)

14/1

3)

11/5

4)

10

123.

شکل زیر، چه تابعی را پیاده سازی می کند؟

1)

2)

3)

4)

124.

برای مدار زیر که تمام فلیپ فلاپ ها به پالس ساعت یکسان وصل هستند، اطلاعات زیر داده شده است. کوچک ترین پریود پالس ساعت که این مدار می تواند به درستی کار کند، برحسب نانوثانیه چقدر است؟

Setup time=5 nsec, 3 nsec<Clock-to-Q delay <4 nsec, 1 nsec<NOT gate delay<4 nsec, 2 nsec<AND gate delay<6 nsec, 2 nsec<OR gate delay<6 nsec

1)

12

2)

24

3)

25

4)

50

125.

مدار شکل زیر، از یک معکوس کننده CMOS و دو ترانزیستور تشکیل شده و پارامترهای مدار به صورت Vdd=3,Vt=0.6V است.

اگر ورودی مدار صفر ولت باشد، ولتاژ نقاط Y و Z به ترتیب چند ولت است؟

1)

3 و 2/7

2)

3/4 و 2/7

3)

3 و 3

4)

2/4 و 1/8