مجله اینترنتی دیتاسرا
امروز پنجشنبه ۲۴ آبان ۱۳۹۷

مشخصات مربوط به شکل گیری و کارایی سیستم های موازی در مقیاس بزرگ Performance Properties of Large Scale Parallel Systems

Abstract



There are several metrics that characterize the performance of a parallel system, such as, parallel execution time, speedup and eciency. A number of properties of these metrics have been studied. For example, it is a well known fact that given a parallel architecture and a problem of a xed size, the speedup of a parallel algorithm does not continue to increase with increasing number of processors. It usually tends to saturate or peak at a certain limit. Thus it may not be useful to employ more than an optimal number of processors for solving a problem on a parallel computer. This optimal number of processors depends on the problem size, the parallel algorithm and the parallel architecture. In this paper we study the impact of parallel processing overheads and the degree of concurrency of a parallel algorithm on the optimal number of processors to be used when the criterion for optimality is minimizing the parallel execution time. We then study a more general criterion of optimality and show how operating at the optimal point is equivalent to operating at a unique value of eciency which is characteristic of the criterion of optimality and the properties of the parallel system under study. We put the technical results derived in this paper in perspective with similar results that have appeared in the literature before and show how this paper generalizes and/or extends these earlier results.



چکیده فارسی



چندین متریک و اندازه استاندارد وجود دارد که مشخص کننده کارایی و شکل گیری مربوط به سیستم موازی مانند زمان اجرا شدن موازی، تسریع و کارایی می باشد. تعدادی از مشخصات مربوط به این استانداردهای متریک مورد مطالعه قرار گرفته بود. برای مثال این یک حقیقت شناخته شده می باشد که یک معماری موازی مشخص و یک مساله مربوط به اندازه ثابت شده مورد بحث قرار گرفته است و تسریع مربوط به الگوریتم موازی برای افزایش یافتن با تعداد فزاینده ای از پردازش کننده ها ادامه نیافته است. این معمولا تمایل به اشباع شدن یا حداکثر شدن در یک محدوده معین دارد. بنابراین این برای به کار بردن بیش از یک تعداد بهینه ای از پردازش کننده ها برای حل کردن یک مساله براساس یک کامپیوتر موازی ممکن نیست که مفید باشد. این تعداد بهینه از پردازش کننده ها بستگی به اندازه مساله، الگوریتم موازی و معماری موازی دارد. در این مقاله ما اثر مربوط به بالاسری های پردازش کننده موازی و درجه مربوط به همزمانی الگوریتم موازی را براساس تعداد بهینه ای از پردازش کننده هامورد مطالعه قرار داده ایم که این موارد به صورت ملاکی برای بهینه بودن مورد استفاده قرار می گیرد که زمان اجرا شدن موازی را به حداقل می رساند. ما سپس ملاک بسیار کلی تری از بهینه شدن را مورد مطالعه قرار می دهیم و چگونگی اجرا شدن را در نقطه بهینه نشان می دهیم که معادل با اجرایی شدن در یک مقدار منحصر به فردی از کارایی است که مشخص کننده ملاکی از بهینه شدن و مشخصات مربوط به سیستم موازی تحت مطالعه است. ما نتایج فنی به دست آمده در این مقاله را در دیدگاهی با نتایجی مشابه مورد بررسی قرار داده ایم که در مقاله قبل از این نشان داده شده است و علاوه بر این نتایج کلی شده و نتایج اولیه نیز به صورت گسترده در این مقاله نشان داده شده است.


مشخصات

مشخصات

توسط: Anshul Gupta and Vipin Kumar مجله: Journal of Parallel and Distributed Computing سال انتشار: 1993 میلادی تعداد صفحات متن اصلی: 21 تعداد صفحات متن ترجمه: 26 تاریخ درج: ۱۳۹۵/۸/۲۶ منبع: دیتاسرا

خرید آنلاین فایل ترجمه

خرید آنلاین فایل ترجمه

عنوان: مشخصات مربوط به شکل گیری و کارایی سیستم های موازی در مقیاس بزرگ حجم: 314.18 کیلوبایت فرمت فایل: pdf قیمت: 14000 تومان رمز فایل (در صورت نیاز): www.datasara.com

دانلود فایل اصلی

دانلود فایل اصلی

عنوان: Performance Properties of Large Scale Parallel Systems

رمز فایل
رمز فایل (در صورت نیاز): www.datasara.com

نمای مطلب

1- مقدمه



بی پرده کامپیوترهای موازی صدها تا هزارها پردازشگر را به کار گرفته اند که به صورت تجاری امروزه در دسترس هستند و اساسا قدرت محاسبه کردن خام بالاتری را در مقایسه با سوپر کامپیوترهای مداوما سریع دارند. دسترسی مربوط به چنین سیستم هایی در ارزیابی مربوط به کارایی کامپیوترهای موازی موجود می باشد که حاوی تعداد زیادی از پردازش کننده ها می باشد.



کارایی مربوط به الگوریتم موازی نمی تواند در جداسازی کردن از معماری موازی مورد اجرا تحت مطالعه قرار گیرد. برای هدف مربوط به ارزیابی کردن کارایی ما یک سیستم موازی را به عنوان ترکیبی از الگوریتم موازی معرفی کرده ایم و معماری موازی در آن براساس اجرایی شدن آن تعریف شده است. چندین استاندارد متریک وجود دارد که مشخص کننده کارایی سیستم موازی مانند زمان اجرایی شدن موازی، تسریع و کارایی می باشد. تعدادی از مشخصات مربوط به این متریک ها مورد مطالعه قرار گرفته است. این حقیقت به خوبی شناخته شده است که معماری موازی و مساله مربوط به اندازه ثابت شده مشخص می باشد و تسریع مربوط به الگوریتم موازی برای افزایش یافتن با تعداد فزاینده ای از پردازش کننده ها ادامه نیافته است. این معمولا تمایل به اشباع شدن یا حداکثر شدن در یک محدوده معین دارد. چنان چه در اوایل سال 1967، Amdahl مشاهده ای را ایجاد کرد که در آن اگر s به عنوان بخش سریالی در یک الگوریتم باشد، سپس تسریع آن برای یک مساله با اندازه ثابت شده توسط 1/s محدود می گردد و هیچ گونه موضوعی در مورد چگونگی و تعداد پردازش کننده های مورد استفاده وجود ندارد. Gastafason, Montry و Benner به صورت آزمایشی نشان دادند که حد بالا براساس تسریع و سرعت می تواند توسط افزایش یافتن اندازه مساله غالب گردد چنان چه تعداد پردازش کننده افزایش می یابد. Worley نشان داد که برای کلاس مربوط به الگوریتم های موازی، اگر زمان اجرا شدن موازی ثابت گردد در این صورت یک اندازه مساله ای وجود دارد که نمی تواند در زمان ثابت شده با توجه به تعداد پردازش کننده های مورد استفاده حل گردد. Flatt و Kennedy برخی از حدهای بالا را مرتبط با کارایی مربوط به کامپیوترهای موازی در حضور بالاسری های هم زمان و ارتباطی به دست آوردند. آن ها نشان دادند که اگر بالاسری پردازش کننده موازی برای یک محاسبه معین دارای مشخصه های ملاکی موفقیت آمیزی باشد سپس یک مقدار منحصر به فرد از p0 برای تعدادی از پردازش کننده ها وجود دارد که در آن ها زمان اجرا شدن موازی برای یک اندازه مساله معین حداقل می باشد. به هر حال، از این نقطه نظر، کارایی مربوط به اجرا شدن موازی نسبتا ضعیف می باشد. بنابراین آن ها پیشنهاد می کنند که تعداد پردازش کننده ها باید برای حداکثر کردن محصول کارایی و سرعت انتخاب گردد. Flatt و Kennedy و Tang و li همچنین حداکثر شدن متوسط هندسه وزنی کارایی و سرعت را پیشنهاد می کنند. Eager و همکاران پیشنهاد کردند که یک نقطه اجرا شدن بهینه باید مانند کارایی اجرا شدن انتخاب گردد که به صورت گرد شده 5/0 می باشد.



بیشتر نتایج نشان داده شده در این مقاله به صورت گسترده و وسیع می باشند و در برخی از موارد نتایج کلی شده در بالا توسط نویسندگان مورد اشاره قرار گرفته است. هر سیستم موازی دارای یک تابع بالاسری منحصر به فرد می باشد که مقدار آن بستگی به اندازه مساله دارد که مورد بررسی قرار گرفته است و علاوه بر این به تعداد پردازش کننده های به کار رفته نیز بستگی دارد. به هر حال، هر الگوریتم موازی دارای یک درجه ذاتی همزمانی است که تعیین کننده حداکثر تعداد پردازش کننده هایی است که می تواند به صورت هم زمان در هر زمان مشخصی اشغال گردد در حالی که مساله برای یک اندازه مشخصی حل شده است. در این مقاله ما اثرات مربوط به تابع بالاسری و درجه هم زمان بودن را براساس اندازه های کارایی مانند سرعت، زمان اجرا شدن و کارایی مورد مطالعه قرار داده ایم و تعداد بهینه ای از پردازش کننده ها را که تحت ملاک های مختلف و بهینه شده ای قرار دارند را مورد استفاده قرار داده است.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



سازمان دهی مربوط به مقاله به صورت زیر می باشد. در بخش دوم ما عبارت های استفاده شده در این مقاله را تعریف کرده ایم. در بخش سوم و چهارم ما نتایج فنی را به دست آورده ایم. در بخش پنجم ما این نتایج را در دیدگاهی مشابه با نتایجی قرار داده ایم که در ابتدا در مقاله ظاهر شده بود و نشان دهنده تعداد نتایج به دست آمده در این جا می باشد که به صورت کلی شده درآمده است و یا به صورت گستره هایی از نتایج اولیه می باشد. با استفاده از این مقاله، مثال های استفاده شده در این مقاله نشان دهنده این نتایج در مفهوم الگوریتم های موازی برای مساله های عملی مانند FFT، ضرب ماتریس، کوتاه ترین مسیرها و غیره می باشد. اگر چه برای راحت ارائه شدن این موارد، مثال ها به صورت مساله های ساده و منظم محدود شده است و مشخصات مربوط به سیستم های موازی که در این جا مورد مطالعه قرار گرفته است برای سیستم های موازی به خوبی اعمال شده است.



یک نسخه اولیه از این مقاله در منبع 13 وجود دارد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



در این بخش ما به صورت رسمی عبارت های مورد استفاده در بقیه این مقاله را توصیف کرده ایم.



سیستم موازی: ترکیبی از معماری موازی و الگوریتم موازی براساس آن اجرایی شده است. ما فرض کرده ایم که کامپیوتر موازی مورد استفاده یک پردازش کننده موازی می باشد برای مثال همه پردازش کننده ها و کانال های ارتباطی از نظر سرعت برابر می باشند.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



برطبق تعریف ما، پیچیدگی مربوط به زمان متوالی برای الگوریتم شناخته شده سریع مساله ای را حل می کند که تعیین کننده اندازه مساله است. اگر زمان گرفته شده توسط یک الگوریتم متوالی بهینه یک مساله را در مورد اندازه مساله W براساس پردازش کننده مجزا حل نماید آن به صورت Ts است و سپس (نیاز به دانلود ترجمه) و (نیاز به دانلود ترجمه) است که (نیاز به دانلود ترجمه) یک ثابت وابسته ماشینی است.



زمان اجرا شدن موازی Tp: زمان آزاد شده از گشتاور مربوط به محاسبه موازی آغاز کننده نسبت به گشتاور مربوط به اجرایی شدن نهایی آخرین پردازش کننده است. برای یک سیستم موازی مشخص ، Tp به صورت طبیعی تابعی از اندازه مساله یا W و تعداد پردازش کننده ها یا P است و ما آگاهی اوقات آن را به صورت (نیاز به دانلود ترجمه) خواهیم نوشت.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



سرعت S: نسبت مربوط به سریال زمان اجرایی شدن برای الگوریتم های سریالی شناخته شده سریع یا Ts با توجه به زمان اجرایی شدن موازی برای الگوریتم انتخاب شده یا Tp است.



کل بالاسری موازی T0: جمع کل همه بالاسری های پرداخت شده ناشی از پردازش کردن موازی توسط همه پردازش کننده ها. این شامل هزینه های ارتباطی، کار غیر ضروری و زمان ایده آل ناشی از هم زمان بودن و اجزای سریالی الگوریتم است. به صورت ریاضی (نیاز به دانلود ترجمه) است.



به منظور ساده سازی کردن آنالیز، ما فرض کرده ایم که T0 به صورت یک کمیت غیر منفی است. این اشاره به سرعتی دارد که معمولا توسط P محدود شده است. برای مثال سرعت می تواند به صورت خطی سوپر باشد و T0 می تواند منفی باشد در صورتی که حافظه به صورت سلسله وار باشد و دسترسی های زمانی در مراحل مجزا افزایش یابند چنان چه حافظه توسط افزایش ها در برنامه مورد استفاده قرار می گیرد. در این مورد، سرعت محاسبه کردن موثر برای یک برنامه بزرگ براساس پردازش کننده سریالی در مقایسه با به کار بردن پردازش کننده های مشابه در کامپیوتر موازی آهسته تر خواهد بود. دلیل این امر این است که یک الگوریتم مداوم با استفاده از بیت های حافظه ای M تنها به صورت بیت های M/P براساس هر پردازش گر مربوط به پردازشگر P کتمپیوتر موازی مورد استفاده قرار خواهد گرفت. نتایج اصلی مربوط به این مقاله هنوز با حافظه سلسله وار موجود می باشد به جز این که قابلیت مقیاس پذیری و استانداردهای متریک برای کارایی به صورت ناپیوسته خواهد بود و عبارت های مربوط به آن ها در محدوده های مختلف مربوط به اندازه های مساله متفاوت خواهد بود. فرضیه مربوط به حافظه فلت به ما کمک می کند تا بر روی مشخصات الگوریتم و معماری موازی بدون توجه کردن به جزئیات ماشینی خاص متمرکز گردیم.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



کارایی E: نسبت سرعت S به تعداد پردازش کننده ها P. بنابراین (نیاز به دانلود ترجمه) .



درجه هم زمانی C(W): حداکثر تعداد وظایفی که می تواند به صورت هم زمان در هر زمان مشخصی در الگوریتم موازی اجرایی شود. به صورت مشخصی، برای یک W مشخص، الگوریتم موازی نمی تواند برای بیش از C(W) پردازش کننده مورد استفاده قرار گیرد. C(W) تنها بستگی به الگوریتم موازی دارد و مستقل از معماری می باشد. برای مثال برای ضرب کردن دو ماتریس N*N با استفاده از الگوریتم ضرب کماتریس موازی Fox (نیاز به دانلود ترجمه) و (نیاز به دانلود ترجمه) است. این به آسانی مشاهده می گردد که اگر محصول پردازشگر زمانی به صورت (نیاز به دانلود ترجمه) باشد سپس است.



حداکثر تعداد پردازش کننده های قابل استفاده : تعداد پردازش کننده هایی که دارای عملکرد حداکثری سرعت (نیاز به دانلود ترجمه) برای یک W مشخص است. این حداکثر تعداد پردازش کننده هایی می باشد که ممکن است مورد استفاده قرار گیرد زیرا با استفاده از پردازش کننده های بیشتر، سرعت افزایش نخواهد یافت.



3-- حداکثر زمان اجرا شدن موازی



در این بخش ما رفتار مربوط به Tp را در مقابل منحنی p به ماهیت تابع بالاسری T0 ربط داده ایم. چنان چه تعداد پردازش کننده ها افزایش می یابد Tp برای هر یک از روش های مجانب به صورت مقدار حداقلی یا دست یافتن حداقلی خواهد بود و مجددا به صو.رت افزایشی آغاز می گردد. ما تابع های بالاسری را معرفی کرده ایم که منجر به یک مورد و یا دیگر موارد می شود. ما نشان داده ایم که در هر موردی، مساله می تواند در زمان حداقلی با استفاده از تعداد معینی از پردازش کننده ها حل گردد که ما آن ها را (نیاز به دانلود ترجمه) می نامیم. با استفاده از پردازش کننده های بیشتر در مقایسه با (نیاز به دانلود ترجمه) هر یک دارای هیچ گونه اثری نخواهند بود و یا این که کارایی مربوط به سیستم موازی برحسب زمان اجرا شدن موازی کاهش خواهد یافت.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



ما اکنون رفتار Tp را تحت دو شرایط متفاوت را مورد مطالعه قرار می دهیم.



1-3- مورد I:



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



سیستم موازی و طبیعی بسیار مهمی برای تابع بالاسری وجود دارد که سریع تر از (نیاز به دانلود ترجمه) رشد نمی یابد. یکی از این سیستم ها در مثال 1 در زیر توصیف شده است. چنین سیستم هایی به صورت معمولی ارتقا می یابند در حالی که با استفاده از حافظه مشترک یا ماشین های SIMD دارای یک پیام برای آغاز کردن داده های ارتباطی نمی باشند.



شکل 1- یک Tp معمول در مقابل منحنی p برای



مثال 1: FFT موازی براساس هایپر مکعب SIMD



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



مورد II:



زمانی که (نیاز به دانلود ترجمه) سریع تر از (نیاز به دانلود ترجمه) رشد می یابد، یک نظر اجمالی در معادله 1 نشان خواهد داد که عبارت w/p به صورت کاهشی با افزایش یافتن p حفظ خواهد شد در حالی که عبارت (نیاز به دانلود ترجمه) افزایش خواهد یافت. بنابراین کل Tpدر ابتدا کاهش خواهد یافت و سپس با افزایش یافتن p افزایش می یابد که ناشی از حداقل شدن مجزا می باشد. اکنون ما رابطه بین W و p را چنان به دست می آوریم که Tp حداقل می گردد. به ما اجازه دهید تا p0 به صورت مقداری از p باشد که عبارت ریاضی براساس معادله 1 R.H.S برای Tp به صورت مقدار حداقلی آن باشد.



در ، Tp حداقل می باشد و بنابراین (نیاز به دانلود ترجمه) است.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



به دلیل ساده شدن آنالیز زیر، ما فرض کرده ایم که (نیاز به دانلود ترجمه) است و برای همه iها است. آنالیزهایی مشابه با شکل زیر می تواند حتی بدون فرض کردن شکل بگیرد و نتایج مشابه در این زمینه می تواند به دست بیاید (ضمیمه الف). با جانشین کردن (نیاز به دانلود ترجمه) برای (نیاز به دانلود ترجمه) در معادله 2 ما می توانیم معادله زیر را به دست آوریم:



برای تابع بالاسری توصیف شده در بالا معادله 3 تعیین کننده رابطه بین W و P برای حداقل کردن Tp فراهم شده ای می باشد که در آن T0 سریع تر از (نیاز به دانلود ترجمه) رشد می یابد. به دلیل ماهیت مربوط به معادله 3، این ممکن نیست که معمولا برای بیان کردن PP به عنوان تابعی از W در شکلی بسته ممکن باشد. بنابراین معادله 3 حل می شود و در نتیجه یک عبارت R.H.S در یک زمان در نظر گرفته می شود و بقیه نادیده گرفته می شود. اگر عبارت iام در نظر گرفته شود، رابطه (نیاز به دانلود ترجمه) دارای عملکرد (نیاز به دانلود ترجمه) است. این می تواند نشان دهنده این باشد که (ضمیمه ب) که در بین همه راه حل های i برای p به دست آمده در این روش، سرعت برای هر w مشخصی حداکثر می باشد در زمانی که (نیاز به دانلود ترجمه) است و (نیاز به دانلود ترجمه) برای همه iها مطرح می باشد. ما عبارت jام مربوط به T0 را تحت عنوان عبارت غالب می شناسیم در صورتی که مقدار (نیاز به دانلود ترجمه) در بین همه مقدارهای (نیاز به دانلود ترجمه) حداقل می باشد زیرا این عبارتی می باشد که تعیین کننده رتبه P0 برای حل کردن معادله 2 برای مقادیر بزرگ W و p است. اگر عبارت jام به صورت عبارت غالب T0 باشد سپس معادله حل شده 3 با توجه به عبارت jام براساس عملکردهای R.H.S به صورت عبارت تخمینی زیر برای p0 برای مقادیر بزرگ w است:



مقدار p0 بنابراین به دست می آید که می تواند در عبارتی برای TP برای تعیین کردن حداقل زمان اجرا شدن موازی برای W مشخص مورد استفاده قرار گیرد. مقدار p0 در زمان به کار بردن کارایی دارای عملکردی به صورت زیر است:



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



معادله های 4 و 5 به ترتیب دارای عملکردهای ریاضی P0 و E0 هستند. اما مقدار به دست آمده P0 ممکن است از C(W) تجاوز نماید. بنابراین در عمل، در نقظه کارایی حداکثری، تعداد پردازش کننده های (نیاز به دانلود ترجمه) توسط (نیاز به دانلود ترجمه) برای یک W مشخص تعیین می گردد. بنابراین این ممکن می باشد که C(W) برای یک الگوریتم موازی ممکن است تعیین کننده زمان اجرا شدن حداقلی در مقایسه با شرایط ریاضی به دست آمده باشد. مثال زیر نشان دهنده این مورد می باشد:



مثال 2: الگوریتم مربوط به کوتاه ترین مسیر نواری Floyd براساس Mesh



تعدادی از الگوریتم های مربوط به کوتاه ترین مسیر موازی در منبع 25 بحث شده است. اجرا شدن الگوریتم Floyd را در نظر بگیرید که ماتریس مجاور نمودار N*N در بین پردازش کننده های P نواری می باشد چنان چه هر پردازش کننده ردیف های کامل N/P مربوط به ماتریس را ذخیره می کند. اندازه مساله W در این جا توسط N به توان 3 برای یافتن همه مسیرهای کوتاه براساس یک نمودار N گره ای مشخص می گردد. در هر یک از فواصل زمانی N برای این الگوریتم، یک پردازش کننده یک ردیف با طول N را برای ماتریس مجاور نمودار برای هر پردازش کننده ای را ارتقا می دهد. چنان چه در منبع 25 نشان داده شده است، اگر پردازش کننده P در ارتباط با یک مش شکل گیری با مسیریابی از طریق سرنخ باشد در این صورت کل بالاسری ناشی از این ارتباط توسط (نیاز به دانلود ترجمه) مشخص می گردد. در این جا ts و tw ثابت های مرتبط با زمان آغاز شدن پیام و سرعت پیام انتقالی به ترتیب می باشند. از آن جایی که tw اغلب در مقایسه با ts بسیار کوچک است از این رو، (نیاز به دانلود ترجمه) است. از معادله 3 p0 معادل با (نیاز به دانلود ترجمه) است. اما از آن جایی که در بیشتر پردازش کننده های N می توان این الگوریتم را استفاده کرد، است. حداقل زمان اجرا شدن برای این سیستم موازی بنابراین به صورت (نیاز به دانلود ترجمه) برای (نیاز به دانلود ترجمه) است.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



این همچنین برای دو سیستم موازی دارای T0 مشابه ممکن خواهد بود. در چنین مواردی یک آنالیز از تابع بالاسری ممکن است نسبت به اعتقاد مربوط به دو سیستم موازی معادل برحسب حداکثر سرعت و حداقل زمان اجرا شدن غلط و ناممکن باشد. مثال 3 در زیر نشان دهنده موردی در زمانی می باشد که سرعت در p=p0 حداکثر است. الگوریتم مربوط در مثال 2 دارای T0 دقیقا مشابهی می باشد و بنابراین P0 مشابه می باشد اما سرعت در p= C(W) به دلیل (نیاز به دانلود ترجمه) حداکثر می باشد. بنابراین دو سیستم موازی توصیف شده در مثال های 2 و 3 برحسب حداکثر کارایی آن ها متفاوت می باشند اگر چه توابع بالاسری مشابه می باشند.



شکل 2- Tp در مقابل منحنی p برای (نیاز به دانلود ترجمه) و برای نشان دادن (نیاز به دانلود ترجمه) در زمانی که (نیاز به دانلود ترجمه) است.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



در این مثال ما یک سیستم موازی متفاوت را شامل دیگر تغییرات الگوریتم Floyd بحث شده در منبع 25 را در نظر گرفته ایم و یک مش تقریبا پیچیده با مسیریابی ذخیره ای و رو به جلو را مطرح کرده ایم. در این الگوریتم، ماتریس مجاور N*N نسبت به بلوک های زیر مجموعه ای با اندازه هر یک (نیاز به دانلود ترجمه) مجزا شده است و این زیر بلوک ها براساس مش مربوط به پردازش کننده P تصویرسازی شده است. در این نسخه از الگوریتم Floyd یک پردازش کننده مربوط به عناصر (نیاز به دانلود ترجمه) در بین پردازش کننده های (نیاز به دانلود ترجمه) در هر فاصله زمانی N پخش شده است. چنان چه در منبع 25 نشان داده شده است، این نتایج در کل بالاسری است. از آن جایی که عبارت T0 مشابه با مثال 2 می باشد، مجددا (نیاز به دانلود ترجمه) است. اما C(W) برای نسخه کنترل کردن حیطه الگوریتم به صورت (نیاز به دانلود ترجمه) است. بنابراین (نیاز به دانلود ترجمه) در این مورد به صورت است.



برای (نیاز به دانلود ترجمه) و ، معادله 3 دارای مقدار عملکرد p0=738 برای یک نمودار با 100 گره است. سرعت با 738 پردازش کننده در مقدار 246 حداکثر می گردد اما کارایی در این سرعت حداکثری تنها 33/0 است.



شکل های 2 و 3 به صورت نموداری Tp را به عنوان تابعی از p منطبق با مثال های 2 و 3 به ترتیب نشان می دهد.



شکل 3: Tp در مقابل منحنی p برای نشان دهنده (نیاز به دانلود ترجمه) در زمانی است که (نیاز به دانلود ترجمه) است.



3-3- حداقل کردن Tp و تابع هم کارایی



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



ما اکنون نشان می دهیم که به غیر از (نیاز به دانلود ترجمه) برای سیستم موازی، یک کارایی منحصر به فرد در نقطه ای از کارایی حداکثری به دست می آید. این مقدار E تنها بستگی به مشخصات سیستم موازی دارد و مستقل از W یا Tp است. برای نوعی از تابع بالاسری فرض شده در بخش 2-3، رابطه زیر تعیین کننده تابع هم کارایی برای کارایی E است.



به صورت مشخصی این معادله دارای شکل یکسانی مانند معادله 3 است اما دارای ثابت های متفاوتی می باشد. عبارت غالب براساس R.H.S دارای رابطه عملکردی بین W و P در یک شکل بسته شده در هر دو معادله می باشد. اگر این به صورت عبارت jام باشد سپس هر دو معادله دارای مجانب های معادلی خواهد بود در صورتی که عبارت های jام آن ها یکسان باشد. این مقادیر برای اجرایی شدن در یک کارایی مناسب می باشد که توسط رابطه زیر مشخص شده است و توسط معادل یابی ضریب های مربوط به عبارت های jام معادله های 3 و 6 به دست آمده است.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



چنان چه در منبع 22 و 10 بحث شد، رابطه بین اندازه مساله و حداکثر تعداد پردازش کننده ها می تواند در حالت هزینه بهینه برای حل کردن مساله مورد استفاده قرار گیرد که توسط تابع هم کارایی مشخص می گردد. اغلب با استفاده از بیشتر پردازش کننده ها تا جایی که ممکن می باشد نتایج به صورت سیستم هزینه غیر بهینه مطرح می گردد. برای مثال، با اضافه کردن اعداد n براساس وظایف هایپر مکعب مربوط به n پردازشگر می توان زمان اجرا شدن حقیقی را برای این مساله به حداقل رساند. این به صورت یک سیستم موازی با هزینه بهینه نمی باشد زیرا (نیاز به دانلود ترجمه) است. استنباط مهم مربوط به این نتیجه در این بخش نشان داده شده است که در مورد سیستم های موازی مطرح شده است که رابطه بین اندازه مساله و تعداد پردازش کننده ها برای سرعت حداکثری توسط تابه هم کارایی مشخص شده است، زمان اجرا شدن حداقلی مجانب می تواند در یک حالت هزینه بهینه به دست بیاید. برای مثال اگر پردازش کننده های (نیاز به دانلود ترجمه) برای اضافه کردن اعداد n براساس هایپر مکعب مورد استفاده قرار گیرند، سیستم موازی به صورت هزینه بهینه خواهد بود و زمان اجرا شدن موازی هنوز به صورت (نیاز به دانلود ترجمه) خواهد بود.



توجه گردد که تطابق بین تابع هم کارایی و رابطه بین W و p برای اجرا شدن در Tp حداقلی شکست خواهد خورد در صورتی که (نیاز به دانلود ترجمه) در عبارت غالب کمتر و یا معادل با 1 باشد. در این مورد، یک عبارت در مقایسه با بقیه تعیین کننده تابع هم کارایی خواهد بود که شرایط را برای Tp حداقلی تعیین خواهد کرد.



4-3- خلاصه ای از نتایج



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



•- برای الگوریتم های موازی با ، سرعت حداکثری در p=C(W) به دست می آید و برای الگوریتم هایی با (نیاز به دانلود ترجمه) حداکثر سرعت در (نیاز به دانلود ترجمه) به دست می آید که P0 برای یک W مشخص توسط حل کردن معادله 3 تعیین می گردد.



•- برای الگوریتم های موازی با T0 به شکل توصیف شده در بخش 2-3 اگر عبارت Jام به صورت عبارت غالب در عبارت برای T0 باشد و (نیاز به دانلود ترجمه) باشد، سپس کارایی در نقطه سرعت حداکثری معمولا صرف نظر از اندازه مساله یکسان باقی می ماند و توسط (نیاز به دانلود ترجمه) مشخص می گردد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



4-- حداقل کردن



با استفاده از بخش های قبلی، این مشخص می باشد که اجرا شدن در یک نقطه که Tp در ؟آن حداقل می باشد ممکن نیست که یک ایده خوب باشد زیرا برای برخی از سیستم های موازی کارایی در این نقطه ممکن است کم باشد. از سوی دیگر، حداکثر کارایی معمولا در p=1 به دست می آید که به صورت مشخصی نقطه سرعت حداقلی می باشد. بنابراین به منظور دست یافتن به یک تعادل بین سرعت و کارایی، چندین محقق اجرا شدن را در یک نقطه پیشنهاد داده اند که در آن مقدار (نیاز به دانلود ترجمه) برای برخی از ثابت ها و برای اندازه مساله مشخص w حداقل می گردد. این امر را می توان در منبع 33 مشاهده کرد که این منطبق با نقطه ای است که در آن (نیاز به دانلود ترجمه) برای اندازه مساله مشخصی حداکثر می گردد.



بنابراین (نیاز به دانلود ترجمه) حداقل خواهد بود در زمانی که (نیاز به دانلود ترجمه) برای یک w مشخص حداکثر می باشد و توسط حداقل کردن ، ما یک نقطه اجرایی را با توجه به هم سرعت و هم کارایی انتخاب می کنیم که وزن های نسبی آن ها توسط مقدار r تعیین می گردد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



مجددا، مانند بخش قبلی، دو مورد در این زمینه به صورت زیر بیان می گردد:



1-4: مورد I-



از آن جایی که (نیاز به دانلود ترجمه) است در صورتی که (نیاز به دانلود ترجمه) باشد سپس کل قدرت P در عبارتی برای (نیاز به دانلود ترجمه) منفی خواهد بود و بنابراین مقدار آن از نظر ریاضی کمتر از حد پایین و به صورت (نیاز به دانلود ترجمه) خواهد بود. بنابراین با استفاده از بیشتر پردازش کننده این امر شدنی خواهد بود و منجر به حداقل شدن (نیاز به دانلود ترجمه) خواهد شد. به عبارت دیگر، برای این مورد (نیاز به دانلود ترجمه) حداقل است در زمانی که P=C(W) است.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.


 برچسب ها: 

Performance Properties of Large Scale Parallel Systems

مشخصات مربوط به شکل گیری و کارایی سیستم های موازی در مقیاس بزرگ

ISI

Paper

Papers

مشخصات

Article

Articles

مقاله ISI

دانلود ISI

مقیاس بزرگ

ترجمه مقاله

دریافت مقاله

ISI کامپیوتر

مقاله انگلیسی

Persian Paper

خرید ترجمه ISI

ترجمه مقاله ISI

Persian Article

دانلود مقاله ISI

مقاله رایگان ISI

خرید ترجمه مقاله

دانلود ترجمه ISI

دانلود مقاله جدید

مقالات رایگان ISI

دریافت مقالات ISI

مقاله ISI با ترجمه

مقاله انگلیسی جدید

خرید ترجمه انگلیسی

فروش ترجمه انگلیسی

مقاله ISI کامپیوتر

دانلود مقاله انگیسی

ترجمه مقاله انگلیسی

دانلود ISI کامپیوتر

مقالات معتبر انگلیسی

ترجمه مقالات انگلیسی

دریافت مقاله انگلیسی

ترجمه مقاله کامپیوتر

دانلود مقاله جدید ISI

دریافت مقاله کامپیوتر

مقاله انگلیسی با ترجمه

مقاله انگلیسی کامپیوتر

دانلود رایگان مقاله ISI

خرید ترجمه ISI کامپیوتر

Translate English Paper

دانلود مقالات رایگان ISI

ترجمه مقاله ISI کامپیوتر

دانلود مقاله ISI با ترجمه

دانلود مقاله انگلیسی جدید

دریافت مقاله انگلیسی جدید

دانلود مقاله ISI کامپیوتر

مقاله رایگان ISI کامپیوتر

خرید ترجمه مقاله کامپیوتر

دانلود ترجمه ISI کامپیوتر

Translate English Article

ترجمه مقالات معتبر انگلیسی

دانلود مقاله جدید کامپیوتر

مقالات رایگان ISI کامپیوتر

دریافت مقالات ISI کامپیوتر

Translate Paper in English

دانلود مقاله انگلیسی رایگان

دانلود رایگان مقاله انگلیسی

دانلود مقاله انگلیسی رایگان

دریافت مقاله انگلیسی رایگان

مقاله ISI با ترجمه کامپیوتر

مقاله انگلیسی جدید کامپیوتر

خرید ترجمه انگلیسی کامپیوتر

فروش ترجمه انگلیسی کامپیوتر

دانلود مقاله انگیسی کامپیوتر

ترجمه مقاله انگلیسی کامپیوتر

Translate Article in English

دانلود مقاله انگلیسی با ترجمه

دریافت مقاله انگلیسی با ترجمه

مقالات معتبر انگلیسی کامپیوتر

ترجمه مقالات انگلیسی کامپیوتر

دریافت مقاله انگلیسی کامپیوتر

دانلود مقاله جدید ISI کامپیوتر

مقاله انگلیسی با ترجمه کامپیوتر

Translation of Paper in English

دانلود رایگان مقاله ISI کامپیوتر

دانلود مقالات رایگان ISI کامپیوتر

Translation of Article in English

شکل گیری و کارایی سیستم های موازی

دانلود مقاله ISI با ترجمه کامپیوتر

دانلود مقاله انگلیسی جدید کامپیوتر

دریافت مقاله انگلیسی جدید کامپیوتر

ترجمه مقالات معتبر انگلیسی کامپیوتر

دانلود مقاله انگلیسی رایگان کامپیوتر

دانلود رایگان مقاله انگلیسی کامپیوتر

دانلود مقاله انگلیسی رایگان کامپیوتر

دریافت مقاله انگلیسی رایگان کامپیوتر

دانلود مقاله انگلیسی با ترجمه کامپیوتر

دریافت مقاله انگلیسی با ترجمه کامپیوتر

تقویت کننده ی شبه تفاضلی کلاس-AB برمبنای اینورتر CMOS برای کاربردهای HF
فايل پيوست

 Abstract This paper presents a CMOS inverter-based c1ass-AB pseudo differential amplifier for HF applications using new sim pIe rail-to-rail CMFB circuit. The proposed circuit em ploys two CMOS inverters and the ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 5000 تومان

روش جاروب رو به عقب، برای حل پخش بار در شبکه های توزیع
فايل پيوست

Abstract A methodology for the analysis of radial or weakly meshed distribution systems supplying voltage dependent loads is here developed. The solution process is iterative and, at each step, loads are ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 8000 تومان

بازسازی سه بعدی و تشخیص چهره با استفاده از ICA مبتنی بر هسته و شبکه های عصبی
فايل پيوست

Abstract Kernel-based nonlinear characteristic extraction and classification algorithms are popular new research directions in machine learning. In this paper, we propose an improved photometric stereo scheme based on improved kernel-independent component ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 9000 تومان

جمع کننده کامل 1 بیتی زیر آستانه ای در فناوری تراشه هاى نیمه هادى اکسید فلزى تکمیلى65 نانومتری
فايل پيوست

 Abstract In this paper a new full adder (FA) circuit optimized for ultra low power operation is proposed. The circuit is based on modified XOR gates operated in the subthreshold region ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 5000 تومان

اصول حسابداری مالیات بر ارزش افزوده :مفاهیم و موضوعات
فايل پيوست

Abstract The Value Added Tax Accounting (VATA) is one of those newly emerged concepts, which were emphasized much in the context of VISION 2020 by the industry, business, profession, academic, administration, ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 3000 تومان

تئوری محدودیت ها؛ ارزیابی مقایسه ای
فايل پيوست

 Abstract The worldwide economic reorganisation of the last decade has regularly been accompanied by appeals to concepts of lean manufacturing and flexible systems. These generally imply a scaling of productive and ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 5000 تومان

روابط میان رقابت، واگذاری، تغییر سیستم های مدیریت حسابداری و عملکرد: یک مدل مسیر
فايل پيوست

Abstract This paper is concerned with an empirical investigation into the relations among competition, delegation, management accounting and control systems (MACS) change and organizational performance. It follows a standard contingency type ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 8000 تومان

تاثیر فناوری اطلاعات بر روی بازدهی شرکت حسابداری
فايل پيوست

 Abstract In recent years, information technology (IT) has played a critical role in the services provided by the public accounting industry. However, no empirical research has evaluated the impact of IT ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 7000 تومان

روند همگرایی هیئت استاندارهای حسابداری بین المللی و هیئت استاندارهای حسابداری مالی و نیاز به آموزش حسابداری مبتنی بر مفهوم
فايل پيوست

 Abstract The increasing globalization of the U.S. economy drives interest in international accounting standards. In this respect, the convergence process between the International Accounting Standards Board (IASB) and the Financial Accounting ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 4000 تومان

تاثیر مرحله چرخه عمر سازمانی بر استفاده از هزینه یابی مبتبی بر فعالیت
فايل پيوست

Abstract This paper investigates if the use of an activity-based cost-accounting system differs among firms in different organizational life cycle stages. We apply the Miller and Friesen [Miller, D., Friesen, P.H., ... [ ادامه مطلب ]

انتشارات: IEEE
پرداخت و دانلود قیمت: 9000 تومان

فایل اکسل جامع طراحی دیوار حائل (با در نظر گرفتن نیروی زلزله)
فايل پيوست

تک فایل اکسل طراحی دیوار حائل (با در نظر گرفتن نیروی زلزله) دیوار حائل یا سازه نگهبان بنایی است که به منظور تحمل بارهای جانبی ناشی از خاکریز پشت دیوار، سازه ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 7500 تومان
 مشخصات کلی: 

گروه: اکسل طراحی

2 فایل اکسل مجزا جهت طراحی فونداسیون تجهیزات افقی، قائم و پیت (Air Separation Units, Heat Exchangers, Drums, Pits...)
فايل پيوست

2 فایل اکسل مجزا جهت طراحی فونداسیونهای تجهیزات: Air Separation Units, Heat Exchangers, Horizontal & Vertical Drums, Pits پالایشگاه ها و مجتمعهای پتروشیمی مجموعه هایی متشکل از تجهیزات گوناگون صنعتی هستند؛ تجهیزاتی ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 9500 تومان
 مشخصات کلی: 

گروه: اکسل طراحی

3 فایل اکسل مجزا جهت طراحی فونداسیون های تجهیزات دینامیک: Compressors & Pumps (reciprocating & centrifugal), Oil-Water Skid
فايل پيوست

3 فایل اکسل مجزا جهت طراحی فونداسیونهای تجهیزات دینامیک: Compressors & Pumps (reciprocating & centrifugal), Oil / Water Skid در ساخت یک مجتمع پتروشیمی تجهیزات متعددی مورد استفاده قرار می گیرد. برخی از ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 12500 تومان
 مشخصات کلی: 

گروه: اکسل طراحی

دستورالعمل جامع آشنایی با اصول طراحی سکوهای ثابت فلزی دریایی
فايل پيوست

مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 25000 تومان

دستورالعمل کاربردی و گام به گام طراحی سازه های باز بتنی (پایپ رک ها) و فونداسیون
فايل پيوست

مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 15000 تومان

دستورالعمل طراحی سازه های فولادی به روش DIRECT ANALYSIS METHOD بر اساس آئین نامه AISC با استفاده از نرم افزارهای SAP و ETABS
فايل پيوست

مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 12500 تومان

دستورالعمل طراحی فونداسیون های تجهیزات ارتعاشی (چرخشی، رفت و برگشتی)ـفارسی
فايل پيوست

مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 12500 تومان

دستورالعمل طراحی فونداسیون های تجهیزات ارتعاشی (چرخشی، رفت و برگشتی)ـانگلیسی
فايل پيوست

مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 12500 تومان

دستورالعمل نحوه طراحی وصله ستون با استفاده از ورق جان و بال، بهمراه یک مثال جامع طراحی
فايل پيوست

مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 12500 تومان

دستورالعمل نحوه استفاده از اطلاعات گزارشهای مکانیک خاک جهت پروژه های واقع در خشکی
فايل پيوست

مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 2500 تومان

ناحیه کاربری

فرمت ایمیل صحیح نمی باشد. ایمیل خود را وارد نمایید.

رمز عبور خود را وارد نمایید.

مجله اینترنتی دیتاسرا
کلیه حقوق مادی و معنوی این وبسایت متعلق به گروه نرم افزاری دیتاسرا می باشد.
ایمیل:
support.datasara[AT]gmail[دات]com

Copyright © 2018