مشخصات مربوط به شکل گیری و کارایی سیستم های موازی در مقیاس بزرگ Performance Properties of Large Scale Parallel Systems
Abstract
There are several metrics that characterize the performance of a parallel system, such as, parallel execution time, speedup and eciency. A number of properties of these metrics have been studied. For example, it is a well known fact that given a parallel architecture and a problem of a xed size, the speedup of a parallel algorithm does not continue to increase with increasing number of processors. It usually tends to saturate or peak at a certain limit. Thus it may not be useful to employ more than an optimal number of processors for solving a problem on a parallel computer. This optimal number of processors depends on the problem size, the parallel algorithm and the parallel architecture. In this paper we study the impact of parallel processing overheads and the degree of concurrency of a parallel algorithm on the optimal number of processors to be used when the criterion for optimality is minimizing the parallel execution time. We then study a more general criterion of optimality and show how operating at the optimal point is equivalent to operating at a unique value of eciency which is characteristic of the criterion of optimality and the properties of the parallel system under study. We put the technical results derived in this paper in perspective with similar results that have appeared in the literature before and show how this paper generalizes and/or extends these earlier results.
چکیده فارسی
چندین متریک و اندازه استاندارد وجود دارد که مشخص کننده کارایی و شکل گیری مربوط به سیستم موازی مانند زمان اجرا شدن موازی، تسریع و کارایی می باشد. تعدادی از مشخصات مربوط به این استانداردهای متریک مورد مطالعه قرار گرفته بود. برای مثال این یک حقیقت شناخته شده می باشد که یک معماری موازی مشخص و یک مساله مربوط به اندازه ثابت شده مورد بحث قرار گرفته است و تسریع مربوط به الگوریتم موازی برای افزایش یافتن با تعداد فزاینده ای از پردازش کننده ها ادامه نیافته است. این معمولا تمایل به اشباع شدن یا حداکثر شدن در یک محدوده معین دارد. بنابراین این برای به کار بردن بیش از یک تعداد بهینه ای از پردازش کننده ها برای حل کردن یک مساله براساس یک کامپیوتر موازی ممکن نیست که مفید باشد. این تعداد بهینه از پردازش کننده ها بستگی به اندازه مساله، الگوریتم موازی و معماری موازی دارد. در این مقاله ما اثر مربوط به بالاسری های پردازش کننده موازی و درجه مربوط به همزمانی الگوریتم موازی را براساس تعداد بهینه ای از پردازش کننده هامورد مطالعه قرار داده ایم که این موارد به صورت ملاکی برای بهینه بودن مورد استفاده قرار می گیرد که زمان اجرا شدن موازی را به حداقل می رساند. ما سپس ملاک بسیار کلی تری از بهینه شدن را مورد مطالعه قرار می دهیم و چگونگی اجرا شدن را در نقطه بهینه نشان می دهیم که معادل با اجرایی شدن در یک مقدار منحصر به فردی از کارایی است که مشخص کننده ملاکی از بهینه شدن و مشخصات مربوط به سیستم موازی تحت مطالعه است. ما نتایج فنی به دست آمده در این مقاله را در دیدگاهی با نتایجی مشابه مورد بررسی قرار داده ایم که در مقاله قبل از این نشان داده شده است و علاوه بر این نتایج کلی شده و نتایج اولیه نیز به صورت گسترده در این مقاله نشان داده شده است.

مشخصات
توسط: Anshul Gupta and Vipin Kumar مجله: Journal of Parallel and Distributed Computing سال انتشار: 1993 میلادی تعداد صفحات متن اصلی: 21 تعداد صفحات متن ترجمه: 26 تاریخ درج: ۱۳۹۵/۸/۲۶ منبع: دیتاسرا

خرید آنلاین فایل ترجمه
عنوان: مشخصات مربوط به شکل گیری و کارایی سیستم های موازی در مقیاس بزرگ حجم: 314.11 کیلوبایت فرمت فایل: pdf قیمت: 129500 تومان رمز فایل (در صورت نیاز): www.datasara.com نرم افزارهای مورد نیاز: winrar - adobe acrobat - office
تنها با ارسال یک ایمیل وجه خود را دریافت نمایید

دانلود فایل اصلی
عنوان: Performance Properties of Large Scale Parallel Systems


1- مقدمه
بی پرده کامپیوترهای موازی صدها تا هزارها پردازشگر را به کار گرفته اند که به صورت تجاری امروزه در دسترس هستند و اساسا قدرت محاسبه کردن خام بالاتری را در مقایسه با سوپر کامپیوترهای مداوما سریع دارند. دسترسی مربوط به چنین سیستم هایی در ارزیابی مربوط به کارایی کامپیوترهای موازی موجود می باشد که حاوی تعداد زیادی از پردازش کننده ها می باشد.
کارایی مربوط به الگوریتم موازی نمی تواند در جداسازی کردن از معماری موازی مورد اجرا تحت مطالعه قرار گیرد. برای هدف مربوط به ارزیابی کردن کارایی ما یک سیستم موازی را به عنوان ترکیبی از الگوریتم موازی معرفی کرده ایم و معماری موازی در آن براساس اجرایی شدن آن تعریف شده است. چندین استاندارد متریک وجود دارد که مشخص کننده کارایی سیستم موازی مانند زمان اجرایی شدن موازی، تسریع و کارایی می باشد. تعدادی از مشخصات مربوط به این متریک ها مورد مطالعه قرار گرفته است. این حقیقت به خوبی شناخته شده است که معماری موازی و مساله مربوط به اندازه ثابت شده مشخص می باشد و تسریع مربوط به الگوریتم موازی برای افزایش یافتن با تعداد فزاینده ای از پردازش کننده ها ادامه نیافته است. این معمولا تمایل به اشباع شدن یا حداکثر شدن در یک محدوده معین دارد. چنان چه در اوایل سال 1967، Amdahl مشاهده ای را ایجاد کرد که در آن اگر s به عنوان بخش سریالی در یک الگوریتم باشد، سپس تسریع آن برای یک مساله با اندازه ثابت شده توسط 1/s محدود می گردد و هیچ گونه موضوعی در مورد چگونگی و تعداد پردازش کننده های مورد استفاده وجود ندارد. Gastafason, Montry و Benner به صورت آزمایشی نشان دادند که حد بالا براساس تسریع و سرعت می تواند توسط افزایش یافتن اندازه مساله غالب گردد چنان چه تعداد پردازش کننده افزایش می یابد. Worley نشان داد که برای کلاس مربوط به الگوریتم های موازی، اگر زمان اجرا شدن موازی ثابت گردد در این صورت یک اندازه مساله ای وجود دارد که نمی تواند در زمان ثابت شده با توجه به تعداد پردازش کننده های مورد استفاده حل گردد. Flatt و Kennedy برخی از حدهای بالا را مرتبط با کارایی مربوط به کامپیوترهای موازی در حضور بالاسری های هم زمان و ارتباطی به دست آوردند. آن ها نشان دادند که اگر بالاسری پردازش کننده موازی برای یک محاسبه معین دارای مشخصه های ملاکی موفقیت آمیزی باشد سپس یک مقدار منحصر به فرد از p0 برای تعدادی از پردازش کننده ها وجود دارد که در آن ها زمان اجرا شدن موازی برای یک اندازه مساله معین حداقل می باشد. به هر حال، از این نقطه نظر، کارایی مربوط به اجرا شدن موازی نسبتا ضعیف می باشد. بنابراین آن ها پیشنهاد می کنند که تعداد پردازش کننده ها باید برای حداکثر کردن محصول کارایی و سرعت انتخاب گردد. Flatt و Kennedy و Tang و li همچنین حداکثر شدن متوسط هندسه وزنی کارایی و سرعت را پیشنهاد می کنند. Eager و همکاران پیشنهاد کردند که یک نقطه اجرا شدن بهینه باید مانند کارایی اجرا شدن انتخاب گردد که به صورت گرد شده 5/0 می باشد.
بیشتر نتایج نشان داده شده در این مقاله به صورت گسترده و وسیع می باشند و در برخی از موارد نتایج کلی شده در بالا توسط نویسندگان مورد اشاره قرار گرفته است. هر سیستم موازی دارای یک تابع بالاسری منحصر به فرد می باشد که مقدار آن بستگی به اندازه مساله دارد که مورد بررسی قرار گرفته است و علاوه بر این به تعداد پردازش کننده های به کار رفته نیز بستگی دارد. به هر حال، هر الگوریتم موازی دارای یک درجه ذاتی همزمانی است که تعیین کننده حداکثر تعداد پردازش کننده هایی است که می تواند به صورت هم زمان در هر زمان مشخصی اشغال گردد در حالی که مساله برای یک اندازه مشخصی حل شده است. در این مقاله ما اثرات مربوط به تابع بالاسری و درجه هم زمان بودن را براساس اندازه های کارایی مانند سرعت، زمان اجرا شدن و کارایی مورد مطالعه قرار داده ایم و تعداد بهینه ای از پردازش کننده ها را که تحت ملاک های مختلف و بهینه شده ای قرار دارند را مورد استفاده قرار داده است.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
سازمان دهی مربوط به مقاله به صورت زیر می باشد. در بخش دوم ما عبارت های استفاده شده در این مقاله را تعریف کرده ایم. در بخش سوم و چهارم ما نتایج فنی را به دست آورده ایم. در بخش پنجم ما این نتایج را در دیدگاهی مشابه با نتایجی قرار داده ایم که در ابتدا در مقاله ظاهر شده بود و نشان دهنده تعداد نتایج به دست آمده در این جا می باشد که به صورت کلی شده درآمده است و یا به صورت گستره هایی از نتایج اولیه می باشد. با استفاده از این مقاله، مثال های استفاده شده در این مقاله نشان دهنده این نتایج در مفهوم الگوریتم های موازی برای مساله های عملی مانند FFT، ضرب ماتریس، کوتاه ترین مسیرها و غیره می باشد. اگر چه برای راحت ارائه شدن این موارد، مثال ها به صورت مساله های ساده و منظم محدود شده است و مشخصات مربوط به سیستم های موازی که در این جا مورد مطالعه قرار گرفته است برای سیستم های موازی به خوبی اعمال شده است.
یک نسخه اولیه از این مقاله در منبع 13 وجود دارد.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
در این بخش ما به صورت رسمی عبارت های مورد استفاده در بقیه این مقاله را توصیف کرده ایم.
سیستم موازی: ترکیبی از معماری موازی و الگوریتم موازی براساس آن اجرایی شده است. ما فرض کرده ایم که کامپیوتر موازی مورد استفاده یک پردازش کننده موازی می باشد برای مثال همه پردازش کننده ها و کانال های ارتباطی از نظر سرعت برابر می باشند.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
برطبق تعریف ما، پیچیدگی مربوط به زمان متوالی برای الگوریتم شناخته شده سریع مساله ای را حل می کند که تعیین کننده اندازه مساله است. اگر زمان گرفته شده توسط یک الگوریتم متوالی بهینه یک مساله را در مورد اندازه مساله W براساس پردازش کننده مجزا حل نماید آن به صورت Ts است و سپس (نیاز به دانلود ترجمه) و (نیاز به دانلود ترجمه) است که (نیاز به دانلود ترجمه) یک ثابت وابسته ماشینی است.
زمان اجرا شدن موازی Tp: زمان آزاد شده از گشتاور مربوط به محاسبه موازی آغاز کننده نسبت به گشتاور مربوط به اجرایی شدن نهایی آخرین پردازش کننده است. برای یک سیستم موازی مشخص ، Tp به صورت طبیعی تابعی از اندازه مساله یا W و تعداد پردازش کننده ها یا P است و ما آگاهی اوقات آن را به صورت (نیاز به دانلود ترجمه) خواهیم نوشت.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
سرعت S: نسبت مربوط به سریال زمان اجرایی شدن برای الگوریتم های سریالی شناخته شده سریع یا Ts با توجه به زمان اجرایی شدن موازی برای الگوریتم انتخاب شده یا Tp است.
کل بالاسری موازی T0: جمع کل همه بالاسری های پرداخت شده ناشی از پردازش کردن موازی توسط همه پردازش کننده ها. این شامل هزینه های ارتباطی، کار غیر ضروری و زمان ایده آل ناشی از هم زمان بودن و اجزای سریالی الگوریتم است. به صورت ریاضی (نیاز به دانلود ترجمه) است.
به منظور ساده سازی کردن آنالیز، ما فرض کرده ایم که T0 به صورت یک کمیت غیر منفی است. این اشاره به سرعتی دارد که معمولا توسط P محدود شده است. برای مثال سرعت می تواند به صورت خطی سوپر باشد و T0 می تواند منفی باشد در صورتی که حافظه به صورت سلسله وار باشد و دسترسی های زمانی در مراحل مجزا افزایش یابند چنان چه حافظه توسط افزایش ها در برنامه مورد استفاده قرار می گیرد. در این مورد، سرعت محاسبه کردن موثر برای یک برنامه بزرگ براساس پردازش کننده سریالی در مقایسه با به کار بردن پردازش کننده های مشابه در کامپیوتر موازی آهسته تر خواهد بود. دلیل این امر این است که یک الگوریتم مداوم با استفاده از بیت های حافظه ای M تنها به صورت بیت های M/P براساس هر پردازش گر مربوط به پردازشگر P کتمپیوتر موازی مورد استفاده قرار خواهد گرفت. نتایج اصلی مربوط به این مقاله هنوز با حافظه سلسله وار موجود می باشد به جز این که قابلیت مقیاس پذیری و استانداردهای متریک برای کارایی به صورت ناپیوسته خواهد بود و عبارت های مربوط به آن ها در محدوده های مختلف مربوط به اندازه های مساله متفاوت خواهد بود. فرضیه مربوط به حافظه فلت به ما کمک می کند تا بر روی مشخصات الگوریتم و معماری موازی بدون توجه کردن به جزئیات ماشینی خاص متمرکز گردیم.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
کارایی E: نسبت سرعت S به تعداد پردازش کننده ها P. بنابراین (نیاز به دانلود ترجمه) .
درجه هم زمانی C(W): حداکثر تعداد وظایفی که می تواند به صورت هم زمان در هر زمان مشخصی در الگوریتم موازی اجرایی شود. به صورت مشخصی، برای یک W مشخص، الگوریتم موازی نمی تواند برای بیش از C(W) پردازش کننده مورد استفاده قرار گیرد. C(W) تنها بستگی به الگوریتم موازی دارد و مستقل از معماری می باشد. برای مثال برای ضرب کردن دو ماتریس N*N با استفاده از الگوریتم ضرب کماتریس موازی Fox (نیاز به دانلود ترجمه) و (نیاز به دانلود ترجمه) است. این به آسانی مشاهده می گردد که اگر محصول پردازشگر زمانی به صورت (نیاز به دانلود ترجمه) باشد سپس است.
حداکثر تعداد پردازش کننده های قابل استفاده : تعداد پردازش کننده هایی که دارای عملکرد حداکثری سرعت (نیاز به دانلود ترجمه) برای یک W مشخص است. این حداکثر تعداد پردازش کننده هایی می باشد که ممکن است مورد استفاده قرار گیرد زیرا با استفاده از پردازش کننده های بیشتر، سرعت افزایش نخواهد یافت.
3-- حداکثر زمان اجرا شدن موازی
در این بخش ما رفتار مربوط به Tp را در مقابل منحنی p به ماهیت تابع بالاسری T0 ربط داده ایم. چنان چه تعداد پردازش کننده ها افزایش می یابد Tp برای هر یک از روش های مجانب به صورت مقدار حداقلی یا دست یافتن حداقلی خواهد بود و مجددا به صو.رت افزایشی آغاز می گردد. ما تابع های بالاسری را معرفی کرده ایم که منجر به یک مورد و یا دیگر موارد می شود. ما نشان داده ایم که در هر موردی، مساله می تواند در زمان حداقلی با استفاده از تعداد معینی از پردازش کننده ها حل گردد که ما آن ها را (نیاز به دانلود ترجمه) می نامیم. با استفاده از پردازش کننده های بیشتر در مقایسه با (نیاز به دانلود ترجمه) هر یک دارای هیچ گونه اثری نخواهند بود و یا این که کارایی مربوط به سیستم موازی برحسب زمان اجرا شدن موازی کاهش خواهد یافت.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
ما اکنون رفتار Tp را تحت دو شرایط متفاوت را مورد مطالعه قرار می دهیم.
1-3- مورد I:
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
سیستم موازی و طبیعی بسیار مهمی برای تابع بالاسری وجود دارد که سریع تر از (نیاز به دانلود ترجمه) رشد نمی یابد. یکی از این سیستم ها در مثال 1 در زیر توصیف شده است. چنین سیستم هایی به صورت معمولی ارتقا می یابند در حالی که با استفاده از حافظه مشترک یا ماشین های SIMD دارای یک پیام برای آغاز کردن داده های ارتباطی نمی باشند.
شکل 1- یک Tp معمول در مقابل منحنی p برای
مثال 1: FFT موازی براساس هایپر مکعب SIMD
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
مورد II:
زمانی که (نیاز به دانلود ترجمه) سریع تر از (نیاز به دانلود ترجمه) رشد می یابد، یک نظر اجمالی در معادله 1 نشان خواهد داد که عبارت w/p به صورت کاهشی با افزایش یافتن p حفظ خواهد شد در حالی که عبارت (نیاز به دانلود ترجمه) افزایش خواهد یافت. بنابراین کل Tpدر ابتدا کاهش خواهد یافت و سپس با افزایش یافتن p افزایش می یابد که ناشی از حداقل شدن مجزا می باشد. اکنون ما رابطه بین W و p را چنان به دست می آوریم که Tp حداقل می گردد. به ما اجازه دهید تا p0 به صورت مقداری از p باشد که عبارت ریاضی براساس معادله 1 R.H.S برای Tp به صورت مقدار حداقلی آن باشد.
در ، Tp حداقل می باشد و بنابراین (نیاز به دانلود ترجمه) است.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
به دلیل ساده شدن آنالیز زیر، ما فرض کرده ایم که (نیاز به دانلود ترجمه) است و برای همه iها است. آنالیزهایی مشابه با شکل زیر می تواند حتی بدون فرض کردن شکل بگیرد و نتایج مشابه در این زمینه می تواند به دست بیاید (ضمیمه الف). با جانشین کردن (نیاز به دانلود ترجمه) برای (نیاز به دانلود ترجمه) در معادله 2 ما می توانیم معادله زیر را به دست آوریم:
برای تابع بالاسری توصیف شده در بالا معادله 3 تعیین کننده رابطه بین W و P برای حداقل کردن Tp فراهم شده ای می باشد که در آن T0 سریع تر از (نیاز به دانلود ترجمه) رشد می یابد. به دلیل ماهیت مربوط به معادله 3، این ممکن نیست که معمولا برای بیان کردن PP به عنوان تابعی از W در شکلی بسته ممکن باشد. بنابراین معادله 3 حل می شود و در نتیجه یک عبارت R.H.S در یک زمان در نظر گرفته می شود و بقیه نادیده گرفته می شود. اگر عبارت iام در نظر گرفته شود، رابطه (نیاز به دانلود ترجمه) دارای عملکرد (نیاز به دانلود ترجمه) است. این می تواند نشان دهنده این باشد که (ضمیمه ب) که در بین همه راه حل های i برای p به دست آمده در این روش، سرعت برای هر w مشخصی حداکثر می باشد در زمانی که (نیاز به دانلود ترجمه) است و (نیاز به دانلود ترجمه) برای همه iها مطرح می باشد. ما عبارت jام مربوط به T0 را تحت عنوان عبارت غالب می شناسیم در صورتی که مقدار (نیاز به دانلود ترجمه) در بین همه مقدارهای (نیاز به دانلود ترجمه) حداقل می باشد زیرا این عبارتی می باشد که تعیین کننده رتبه P0 برای حل کردن معادله 2 برای مقادیر بزرگ W و p است. اگر عبارت jام به صورت عبارت غالب T0 باشد سپس معادله حل شده 3 با توجه به عبارت jام براساس عملکردهای R.H.S به صورت عبارت تخمینی زیر برای p0 برای مقادیر بزرگ w است:
مقدار p0 بنابراین به دست می آید که می تواند در عبارتی برای TP برای تعیین کردن حداقل زمان اجرا شدن موازی برای W مشخص مورد استفاده قرار گیرد. مقدار p0 در زمان به کار بردن کارایی دارای عملکردی به صورت زیر است:
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
معادله های 4 و 5 به ترتیب دارای عملکردهای ریاضی P0 و E0 هستند. اما مقدار به دست آمده P0 ممکن است از C(W) تجاوز نماید. بنابراین در عمل، در نقظه کارایی حداکثری، تعداد پردازش کننده های (نیاز به دانلود ترجمه) توسط (نیاز به دانلود ترجمه) برای یک W مشخص تعیین می گردد. بنابراین این ممکن می باشد که C(W) برای یک الگوریتم موازی ممکن است تعیین کننده زمان اجرا شدن حداقلی در مقایسه با شرایط ریاضی به دست آمده باشد. مثال زیر نشان دهنده این مورد می باشد:
مثال 2: الگوریتم مربوط به کوتاه ترین مسیر نواری Floyd براساس Mesh
تعدادی از الگوریتم های مربوط به کوتاه ترین مسیر موازی در منبع 25 بحث شده است. اجرا شدن الگوریتم Floyd را در نظر بگیرید که ماتریس مجاور نمودار N*N در بین پردازش کننده های P نواری می باشد چنان چه هر پردازش کننده ردیف های کامل N/P مربوط به ماتریس را ذخیره می کند. اندازه مساله W در این جا توسط N به توان 3 برای یافتن همه مسیرهای کوتاه براساس یک نمودار N گره ای مشخص می گردد. در هر یک از فواصل زمانی N برای این الگوریتم، یک پردازش کننده یک ردیف با طول N را برای ماتریس مجاور نمودار برای هر پردازش کننده ای را ارتقا می دهد. چنان چه در منبع 25 نشان داده شده است، اگر پردازش کننده P در ارتباط با یک مش شکل گیری با مسیریابی از طریق سرنخ باشد در این صورت کل بالاسری ناشی از این ارتباط توسط (نیاز به دانلود ترجمه) مشخص می گردد. در این جا ts و tw ثابت های مرتبط با زمان آغاز شدن پیام و سرعت پیام انتقالی به ترتیب می باشند. از آن جایی که tw اغلب در مقایسه با ts بسیار کوچک است از این رو، (نیاز به دانلود ترجمه) است. از معادله 3 p0 معادل با (نیاز به دانلود ترجمه) است. اما از آن جایی که در بیشتر پردازش کننده های N می توان این الگوریتم را استفاده کرد، است. حداقل زمان اجرا شدن برای این سیستم موازی بنابراین به صورت (نیاز به دانلود ترجمه) برای (نیاز به دانلود ترجمه) است.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
این همچنین برای دو سیستم موازی دارای T0 مشابه ممکن خواهد بود. در چنین مواردی یک آنالیز از تابع بالاسری ممکن است نسبت به اعتقاد مربوط به دو سیستم موازی معادل برحسب حداکثر سرعت و حداقل زمان اجرا شدن غلط و ناممکن باشد. مثال 3 در زیر نشان دهنده موردی در زمانی می باشد که سرعت در p=p0 حداکثر است. الگوریتم مربوط در مثال 2 دارای T0 دقیقا مشابهی می باشد و بنابراین P0 مشابه می باشد اما سرعت در p= C(W) به دلیل (نیاز به دانلود ترجمه) حداکثر می باشد. بنابراین دو سیستم موازی توصیف شده در مثال های 2 و 3 برحسب حداکثر کارایی آن ها متفاوت می باشند اگر چه توابع بالاسری مشابه می باشند.
شکل 2- Tp در مقابل منحنی p برای (نیاز به دانلود ترجمه) و برای نشان دادن (نیاز به دانلود ترجمه) در زمانی که (نیاز به دانلود ترجمه) است.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
در این مثال ما یک سیستم موازی متفاوت را شامل دیگر تغییرات الگوریتم Floyd بحث شده در منبع 25 را در نظر گرفته ایم و یک مش تقریبا پیچیده با مسیریابی ذخیره ای و رو به جلو را مطرح کرده ایم. در این الگوریتم، ماتریس مجاور N*N نسبت به بلوک های زیر مجموعه ای با اندازه هر یک (نیاز به دانلود ترجمه) مجزا شده است و این زیر بلوک ها براساس مش مربوط به پردازش کننده P تصویرسازی شده است. در این نسخه از الگوریتم Floyd یک پردازش کننده مربوط به عناصر (نیاز به دانلود ترجمه) در بین پردازش کننده های (نیاز به دانلود ترجمه) در هر فاصله زمانی N پخش شده است. چنان چه در منبع 25 نشان داده شده است، این نتایج در کل بالاسری است. از آن جایی که عبارت T0 مشابه با مثال 2 می باشد، مجددا (نیاز به دانلود ترجمه) است. اما C(W) برای نسخه کنترل کردن حیطه الگوریتم به صورت (نیاز به دانلود ترجمه) است. بنابراین (نیاز به دانلود ترجمه) در این مورد به صورت است.
برای (نیاز به دانلود ترجمه) و ، معادله 3 دارای مقدار عملکرد p0=738 برای یک نمودار با 100 گره است. سرعت با 738 پردازش کننده در مقدار 246 حداکثر می گردد اما کارایی در این سرعت حداکثری تنها 33/0 است.
شکل های 2 و 3 به صورت نموداری Tp را به عنوان تابعی از p منطبق با مثال های 2 و 3 به ترتیب نشان می دهد.
شکل 3: Tp در مقابل منحنی p برای نشان دهنده (نیاز به دانلود ترجمه) در زمانی است که (نیاز به دانلود ترجمه) است.
3-3- حداقل کردن Tp و تابع هم کارایی
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
ما اکنون نشان می دهیم که به غیر از (نیاز به دانلود ترجمه) برای سیستم موازی، یک کارایی منحصر به فرد در نقطه ای از کارایی حداکثری به دست می آید. این مقدار E تنها بستگی به مشخصات سیستم موازی دارد و مستقل از W یا Tp است. برای نوعی از تابع بالاسری فرض شده در بخش 2-3، رابطه زیر تعیین کننده تابع هم کارایی برای کارایی E است.
به صورت مشخصی این معادله دارای شکل یکسانی مانند معادله 3 است اما دارای ثابت های متفاوتی می باشد. عبارت غالب براساس R.H.S دارای رابطه عملکردی بین W و P در یک شکل بسته شده در هر دو معادله می باشد. اگر این به صورت عبارت jام باشد سپس هر دو معادله دارای مجانب های معادلی خواهد بود در صورتی که عبارت های jام آن ها یکسان باشد. این مقادیر برای اجرایی شدن در یک کارایی مناسب می باشد که توسط رابطه زیر مشخص شده است و توسط معادل یابی ضریب های مربوط به عبارت های jام معادله های 3 و 6 به دست آمده است.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
چنان چه در منبع 22 و 10 بحث شد، رابطه بین اندازه مساله و حداکثر تعداد پردازش کننده ها می تواند در حالت هزینه بهینه برای حل کردن مساله مورد استفاده قرار گیرد که توسط تابع هم کارایی مشخص می گردد. اغلب با استفاده از بیشتر پردازش کننده ها تا جایی که ممکن می باشد نتایج به صورت سیستم هزینه غیر بهینه مطرح می گردد. برای مثال، با اضافه کردن اعداد n براساس وظایف هایپر مکعب مربوط به n پردازشگر می توان زمان اجرا شدن حقیقی را برای این مساله به حداقل رساند. این به صورت یک سیستم موازی با هزینه بهینه نمی باشد زیرا (نیاز به دانلود ترجمه) است. استنباط مهم مربوط به این نتیجه در این بخش نشان داده شده است که در مورد سیستم های موازی مطرح شده است که رابطه بین اندازه مساله و تعداد پردازش کننده ها برای سرعت حداکثری توسط تابه هم کارایی مشخص شده است، زمان اجرا شدن حداقلی مجانب می تواند در یک حالت هزینه بهینه به دست بیاید. برای مثال اگر پردازش کننده های (نیاز به دانلود ترجمه) برای اضافه کردن اعداد n براساس هایپر مکعب مورد استفاده قرار گیرند، سیستم موازی به صورت هزینه بهینه خواهد بود و زمان اجرا شدن موازی هنوز به صورت (نیاز به دانلود ترجمه) خواهد بود.
توجه گردد که تطابق بین تابع هم کارایی و رابطه بین W و p برای اجرا شدن در Tp حداقلی شکست خواهد خورد در صورتی که (نیاز به دانلود ترجمه) در عبارت غالب کمتر و یا معادل با 1 باشد. در این مورد، یک عبارت در مقایسه با بقیه تعیین کننده تابع هم کارایی خواهد بود که شرایط را برای Tp حداقلی تعیین خواهد کرد.
4-3- خلاصه ای از نتایج
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
•- برای الگوریتم های موازی با ، سرعت حداکثری در p=C(W) به دست می آید و برای الگوریتم هایی با (نیاز به دانلود ترجمه) حداکثر سرعت در (نیاز به دانلود ترجمه) به دست می آید که P0 برای یک W مشخص توسط حل کردن معادله 3 تعیین می گردد.
•- برای الگوریتم های موازی با T0 به شکل توصیف شده در بخش 2-3 اگر عبارت Jام به صورت عبارت غالب در عبارت برای T0 باشد و (نیاز به دانلود ترجمه) باشد، سپس کارایی در نقطه سرعت حداکثری معمولا صرف نظر از اندازه مساله یکسان باقی می ماند و توسط (نیاز به دانلود ترجمه) مشخص می گردد.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
4-- حداقل کردن
با استفاده از بخش های قبلی، این مشخص می باشد که اجرا شدن در یک نقطه که Tp در ؟آن حداقل می باشد ممکن نیست که یک ایده خوب باشد زیرا برای برخی از سیستم های موازی کارایی در این نقطه ممکن است کم باشد. از سوی دیگر، حداکثر کارایی معمولا در p=1 به دست می آید که به صورت مشخصی نقطه سرعت حداقلی می باشد. بنابراین به منظور دست یافتن به یک تعادل بین سرعت و کارایی، چندین محقق اجرا شدن را در یک نقطه پیشنهاد داده اند که در آن مقدار (نیاز به دانلود ترجمه) برای برخی از ثابت ها و برای اندازه مساله مشخص w حداقل می گردد. این امر را می توان در منبع 33 مشاهده کرد که این منطبق با نقطه ای است که در آن (نیاز به دانلود ترجمه) برای اندازه مساله مشخصی حداکثر می گردد.
بنابراین (نیاز به دانلود ترجمه) حداقل خواهد بود در زمانی که (نیاز به دانلود ترجمه) برای یک w مشخص حداکثر می باشد و توسط حداقل کردن ، ما یک نقطه اجرایی را با توجه به هم سرعت و هم کارایی انتخاب می کنیم که وزن های نسبی آن ها توسط مقدار r تعیین می گردد.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
مجددا، مانند بخش قبلی، دو مورد در این زمینه به صورت زیر بیان می گردد:
1-4: مورد I-
از آن جایی که (نیاز به دانلود ترجمه) است در صورتی که (نیاز به دانلود ترجمه) باشد سپس کل قدرت P در عبارتی برای (نیاز به دانلود ترجمه) منفی خواهد بود و بنابراین مقدار آن از نظر ریاضی کمتر از حد پایین و به صورت (نیاز به دانلود ترجمه) خواهد بود. بنابراین با استفاده از بیشتر پردازش کننده این امر شدنی خواهد بود و منجر به حداقل شدن (نیاز به دانلود ترجمه) خواهد شد. به عبارت دیگر، برای این مورد (نیاز به دانلود ترجمه) حداقل است در زمانی که P=C(W) است.
جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.
Performance Properties of Large Scale Parallel Systems
مشخصات مربوط به شکل گیری و کارایی سیستم های موازی در مقیاس بزرگ
ISI
Paper
مشخصات
Papers
Article
Articles
مقاله ISI
مقیاس بزرگ
دانلود ISI
ترجمه مقاله
دریافت مقاله
ISI کامپیوتر
Persian Paper
مقاله انگلیسی
خرید ترجمه ISI
Persian Article
ترجمه مقاله ISI
دانلود مقاله ISI
مقاله رایگان ISI
دانلود ترجمه ISI
خرید ترجمه مقاله
دانلود مقاله جدید
دریافت مقالات ISI
مقالات رایگان ISI
مقاله ISI کامپیوتر
خرید ترجمه انگلیسی
فروش ترجمه انگلیسی
مقاله انگلیسی جدید
مقاله ISI با ترجمه
دانلود مقاله انگیسی
دانلود ISI کامپیوتر
ترجمه مقاله انگلیسی
ترجمه مقاله کامپیوتر
دریافت مقاله انگلیسی
ترجمه مقالات انگلیسی
مقالات معتبر انگلیسی
دانلود مقاله جدید ISI
دریافت مقاله کامپیوتر
مقاله انگلیسی کامپیوتر
مقاله انگلیسی با ترجمه
خرید ترجمه ISI کامپیوتر
دانلود رایگان مقاله ISI
Translate English Paper
دانلود مقالات رایگان ISI
ترجمه مقاله ISI کامپیوتر
دانلود ترجمه ISI کامپیوتر
مقاله رایگان ISI کامپیوتر
دانلود مقاله ISI کامپیوتر
دانلود مقاله انگلیسی جدید
دانلود مقاله ISI با ترجمه
دریافت مقاله انگلیسی جدید
خرید ترجمه مقاله کامپیوتر
Translate English Article
دانلود مقاله جدید کامپیوتر
مقالات رایگان ISI کامپیوتر
ترجمه مقالات معتبر انگلیسی
دریافت مقالات ISI کامپیوتر
Translate Paper in English
فروش ترجمه انگلیسی کامپیوتر
خرید ترجمه انگلیسی کامپیوتر
مقاله انگلیسی جدید کامپیوتر
دانلود مقاله انگلیسی رایگان
دانلود رایگان مقاله انگلیسی
مقاله ISI با ترجمه کامپیوتر
دانلود مقاله انگلیسی رایگان
دریافت مقاله انگلیسی رایگان
ترجمه مقاله انگلیسی کامپیوتر
Translate Article in English
دانلود مقاله انگیسی کامپیوتر
دریافت مقاله انگلیسی با ترجمه
مقالات معتبر انگلیسی کامپیوتر
ترجمه مقالات انگلیسی کامپیوتر
دریافت مقاله انگلیسی کامپیوتر
دانلود مقاله انگلیسی با ترجمه
دانلود مقاله جدید ISI کامپیوتر
مقاله انگلیسی با ترجمه کامپیوتر
Translation of Paper in English
دانلود رایگان مقاله ISI کامپیوتر
دانلود مقالات رایگان ISI کامپیوتر
شکل گیری و کارایی سیستم های موازی
Translation of Article in English
دریافت مقاله انگلیسی جدید کامپیوتر
دانلود مقاله انگلیسی جدید کامپیوتر
دانلود مقاله ISI با ترجمه کامپیوتر
ترجمه مقالات معتبر انگلیسی کامپیوتر
دریافت مقاله انگلیسی رایگان کامپیوتر
دانلود مقاله انگلیسی رایگان کامپیوتر
دانلود رایگان مقاله انگلیسی کامپیوتر
دانلود مقاله انگلیسی رایگان کامپیوتر
دانلود مقاله انگلیسی با ترجمه کامپیوتر
دریافت مقاله انگلیسی با ترجمه کامپیوتر
به سوی پایگاه داده چندگانه (اشتراکی) انعطاف پذیر و مستقل
.png)
Abstract The success of cloud computing as a platform for deploying webapplications has led to a deluge of applications characterized by small data footprints with unpredictable access patterns. A scalable multitenant ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 119500 تومان


رویکردی در ارتباط با معماری خط تولید سرویسگرا
.png)
Abstract Service-Oriented Architecture (SOA) has appeared as an emergent approach for developing distributed applications as a set of self-contained and business-aligned services. SOA aids solving integration and interoperability problems and provides ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 119500 تومان


ظرفیت شبکه های بی سیم
.png)
Abstract When n identical randomly located nodes, each capable of transmitting at W bits per second and using a fixed range, form a wireless network, the throughput (formula) obtainable by each ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 139500 تومان


سیستم های صف بندی زمان گسسته با تعطیلی های انحصاری مارکوفب
.png)
Abstract In this contribution we investigate discrete-time queueing systems with vacations. A framework is constructed that allows for studying numerous different vacation systems, including a.o. classical vacation systems like the exhaustive ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 129500 تومان


عوامل تعیینکننده در انتخاب نرمافزار وبمحور معنایی در قالب یک سرویس:
چارچوبی یکپارچه در شرایط خرید الکترونیکی و برنامه ریزی منابع سرمایه ای
.png)
Abstract The ever increasing Internet bandwidth and the fast changing needs of businesses for effectiveness with the partners in the procurement chain and is leading organizations to adopt information systems infrastructures ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 119500 تومان


طراحی و تحلیل یک مدل وقفه (تعطیلی) برای سیستم صف بندی دو فازه با خدمات ورودی
.png)
Abstract This paper mainly deals with a two phase service queueing model with gated service vacation. In this gated service vacation model, only those customers who are present in the queue ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 129500 تومان


به اشتراک گذاری طیف مشارکتی بین شبکه های تلفن همراه و اد هاک
.png)
Abstract Spectrum sharing between cellular and ad-hoc networks is studied in this work. Weak signals and strong interferences at the cell-edge area usually cause severe performance degradation. To improve the cell-edge ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 139500 تومان


مقایسه پروتکل های مسیر یابی تک مسیره در مقابل پروتکل های مسیر یابی چندگانه برای انتقال تصویر در شبکه های حسگر بی سیم چند رسانه ای
.png)
Abstract Wireless multimedia sensor network (WMSN) applications require strong multimedia communication competence. Therefore, in WMSN applications, it is necessary to use specific mechanisms in order to handle multimedia communication challenges and ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 129500 تومان


هوش کسب و کار به روش محاسبه ابری
.png)
Abstract Business Intelligence (BI) deals with integrated approaches to management support. Currently, there are constraints to BI adoption and a new era of analytic data management for business intelligence these constraints ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 119500 تومان


مدل احتمال جدید برای ضمانت کردن مشکل مسیر بحرانی با الگوریتم اکتشافی
.png)
Abstract In order to obtain an adequate description of risk aversion for insuring critical path problem, this paper develops a new class of two-stage minimum risk problems. The first-stage objective function ... [ ادامه مطلب ]
انتشارات: ACM
قیمت: 129500 تومان


دستورالعمل طراحی و محاسبه سیستم روشنایی
.png)
مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]
قیمت: 119500 تومان
مشخصات کلی:
صفحات متن اصلی: 30
گروه:
دستورالعمل طراحی

صفحات متن اصلی: 30
گروه: دستورالعمل طراحی

فایل اکسل طراحی مخزن فلزی هوایی بر اساس آیین نامه AISC با در نظر گرفتن نیروی باد و زلرله
.png)
فایل پیش رو اکسل طراحی مخزن فلزی هوایی می باشد که بر اساس آیین نامه AISC و با در نظر گرفتن نیروی باد و زلرله محاسبات را انجام داده و ... [ ادامه مطلب ]
قیمت: 79500 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی

فایل اکسل تحلیل اتصال برشی دارای خروج از مرکزیت برای گروه پیچ
.png)
این برنامه ظرفیت برشی اتصال پیچ و مهره ای دارای خروج از مرکزیت برای گروه پیچ را محاسبه می کند، ابزاری مناسب برای طراحی صفحات gusset و اتصالات پیچ و ... [ ادامه مطلب ]
قیمت: 79500 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی

فایل اکسل طراحی روسازی آسفالتی بر مبنای آیین نامه آشتو و استفاده از آزمایش ظرفیت باربری کالیفرنیا
.png)
فایل پیش رو اکسل طراحی روسازی آسفالتی بر مبنای آیین نامه آشتو می باشد که با استفاده از نتایج آزمایش ظرفیت باربری کالیفرنیا CBR اطلاعات ورودی را تحلیل و نتایج را ... [ ادامه مطلب ]
قیمت: 79500 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی

طراحی ابعاد و سازه شالوده های عمیق (شمع ها و پایه های عمیق) در خشکی
.png)
مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]
قیمت: 119500 تومان
مشخصات کلی:
صفحات متن اصلی: 27
گروه:
دستورالعمل طراحی

صفحات متن اصلی: 27
گروه: دستورالعمل طراحی

تحلیل غیرخطی و مدل سازی عددی تیر بتن مسلح تقویت شده با FRP توسط Finite Element Method
.png)
"پایان نامه مهندسی عمران مقطع کارشناسی ارشد - گرایش سازه" تحلیل غیرخطی و مدل سازی عددی تیر بتن مسلح تقویت شده با FRP توسط Finite Element Method مشخصات کلی: شامل فایلهای word و ... [ ادامه مطلب ]
قیمت: 129500 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی

بررسی پارامترهای هندسی مهاربند زانویی
.png)
"پروژه دانشجویی مهندسی عمران" بررسی پارامترهای هندسی مهاربند زانویی مشخصات کلی: شامل فایلهای word و pdf بالغ بر 146 صفحه (4 فصل) فهرست مطالب فصل اول 1-1- مقدمه 1-2- شکل پذیری سازه ها 1-3- مفصل و لنگر پلاستیک 1-4- منحنی ... [ ادامه مطلب ]
قیمت: 129500 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی

تحلیل و طراحی سیستم گرمایشی ساختمان مسکونی با استفاده از ذخیره کننده های حرارتی PCM
.png)
"پایان نامه مهندسی مکانیک مقطع کارشناسی ارشد - گرایش تبدیل انرژی" تحلیل و طراحی سیستم گرمایشی ساختمان مسکونی با استفاده از ذخیره کننده های حرارتی PCM تهیه شده بصورت کاملا انحصاری توسط ... [ ادامه مطلب ]
قیمت: 449000 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی

شناسایی و رتبه بندی دلایل انحراف از هزینه پیش بینی شده و ارائه راهکارهای کاهش آن: مطالعه موردی پروژه های "پتروشیمی الف"
.png)
"پایان نامه مهندسی عمران مقطع کارشناسی ارشد - گرایش مهندسی و مدیریت ساخت" شناسایی و رتبه بندی دلایل انحراف از هزینه پیش بینی شده و ارائه راهکارهای کاهش آن: مطالعه ... [ ادامه مطلب ]
قیمت: 259500 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی

مکانیک شکست (Fracture Mechanics)
.png)
مقدمه : یکی از عمده ترین مسائلی که انسان از زمان ساختن سادهترین ابزارها با آن مواجه بوده است پدیده شکست در اجسام میباشد و درواقع برای استفاده از مواد ... [ ادامه مطلب ]
قیمت: 99500 تومان
مشخصات کلی:
گروه:
دستورالعمل طراحی

گروه: دستورالعمل طراحی
