مجله اینترنتی دیتاسرا
امروز جمعه ۱۰ مرداد ۱۴۰۴

تعیین هویت گوینده مستقل از متن، توسط مدل های مخلوط گاوس ساختاری و شبکه های عصبی Efficient text-independent speaker verification with structural Gaussian mixture models and neural network

Abstract



We present an integrated system with structural Gaussian mixture models (SGMMs) and a neural network for purposes of achieving both computational efficiency and high accuracy in text-independent speaker verification. A structural background model (SBM) is constructed first by hierarchically clustering all Gaussian mixture components in a universal background model (UBM). In this way the acoustic space is partitioned into multiple regions in different levels of resolution. For each target speaker, a SGMM can be generated through multilevel maximum a posteriori (MAP) adaptation from the SBM. During test, only a small subset of Gaussian mixture components are scored for each feature vector in order to reduce the computational cost significantly. Furthermore, the scores obtained in different layers of the tree-structured models are combined via a neural network for final decision. Different configurations are compared in the experiments conducted on the telephony speech data used in the NIST speaker verification evaluation. The experimental results show that computational reduction by a factor of 17 can be achieved with 5% relative reduction in equal error rate (EER) compared with the baseline. The SGMM-SBM also shows some advantages over the recently proposed hash GMM, including higher speed and better verification performance.



چکیده فارسی



چکیده – ما سیستم یکپارچه ای  را در ارتباط با مدل های مخلوط  گاوس ساختاری (SGMM) و شبکه های عصبی به منظور دستیابی به راندمان محاسباتی و دقت بالا در ارتباط با تعیین هویت گوینده ارائه می دهیم. مدل پس زمینه ساختاری (SBM) در ابتدا از طریق خوشه بندی زنجیره ای تمام موئلفه های مخلوط گاوس در ارتباط با مدل پس زمینه ساختاری ایجاد می گردد. به این ترتیب، یک فضای اکوستیک به بخش های چندگانه ای در سطوح مختلف قدرت تشخیص، جزء بندی می گردد. برای هر یک از گوینده های مورد نظر، مدل مدل مخلوط  گاوس ساختاری (SGMM) از طریق استدلال حداکثری (MAP) سازگار با مدل پس زمینه ساختاری (SBM) ایجاد می گردد. در هنگام تست، تنها زیرمجموعه کمی از موئلفه های مخلوط گاوس برای هر بردار مختصات محاسبه می گردد تا هزینه محاسبه را به طور قابل توجهی کاهش دهد. علاوه بر این، امتیازات حاصل شده در لایه های مدل های درخت ساختار، برای تصمیم گیری نهایی از طریق شبکه عصبی ادغام می گردند. وضعیت های مختلفی در بررسی های انجام شده بر روی داده های حاصل از گفتگوهای تلفنی مورد استفاده در ارزیابی هویت گوینده NIST ، مقایسه شد. نتایج تجربی نشان می دهد که کاهش محاسبه توسط فاکتور 17 از طریق 5% کاهش نسبی در میزان خطای هم ارز (EER) در مقایسه با خطو مبنا، حاصل می گردد. روش SGMM-SBM (مدل مخلوط  گاوس ساختاری- مدل پس زمینه ساختاری)، مزایایی را نسبت به  مدل اخیرا مطرح شده GMM (مدل مخلوط گاوس) داشته، که شامل سرعت بالاتر و عملکرد تشخیص بهتر، می باشد.



کلیدواژه: خوشه بندی گاوس، شبکه عصبی، تعیین هویت گوینده، مدل مخلوط گاوس ساختاری


مشخصات

مشخصات

توسط: Bing Xiang, and Toby Berger انتشارات: IEEE سال انتشار: 2003 میلادی تعداد صفحات متن اصلی: 10 تعداد صفحات متن ترجمه: 26 تاریخ درج: ۱۳۹۵/۷/۷ منبع: دیتاسرا

خرید آنلاین فایل ترجمه

خرید آنلاین فایل ترجمه

عنوان: تعیین هویت گوینده مستقل از متن، توسط مدل های مخلوط گاوس ساختاری و شبکه های عصبی حجم: 1.04 مگابایت فرمت فایل: pdf قیمت: 129500 تومان رمز فایل (در صورت نیاز): www.datasara.com نرم افزارهای مورد نیاز: winrar - adobe acrobat - office

در صورتی که به هر دلیل از خرید خود رضایت نداشتید
تنها با ارسال یک ایمیل وجه خود را دریافت نمایید
دانلود فایل اصلی

دانلود فایل اصلی

عنوان: Efficient text-independent speaker verification with structural Gaussian mixture models and neural network

رمز فایل
رمز فایل (در صورت نیاز): www.datasara.com
نرم افزار مورد نیاز
نرم افزارهای مورد نیاز: winrar - adobe acrobat - office

نمای مطلب

مقدمه



تحقیقات بر روی تشخیص گوینده که شامل تعیین هویت و تطبیق موارد می باشد به عنوان یک مورد فعال برای چندین دهه به شمار آورده می شود. هدف این می باشد تا تجهیزانت داشته باشیم که به صورت اتوماتیک فرد خاصی را تعیین هویت کرده یا فرد را از طریق صدای او تشخیص دهیم. بنابر روش های زیست سنجی، تشخیص صدای افراد می تواند در بسیاری از موارد همانند، شبکه های امنیتی، تراکنش های تلفنی و دسترسی به بخش ها کاربرد داشته باشد. گوینده ها به دو گروه تقسیم می شوند.گوینده های هدفمند و گوینده های غیرهدفمند. تعیین هویت و تایید آن براساس کاربرد های متنی و غیر متنی افراد با توجه به جملات و کلماتی که بیان می کنند می باشد. هدف اصلی این مقاله بر مبنای تعیین هویت افراد به صورت مستقل می باشد.



مدل مخلوط گاوس (GMMs) اخیرا به عنوان یک روش برتر در تشخیص صدای افراد شناخته شده است. یکی از ویزگی های اصلی این سیستم توانایی آن برای ایجاد روش های تقریبی برای شکل دادن تراکم ها می باشد. اگرچه در ارتباط با کاربردهای متنی، مدل مخفی مارکو، با توجه به ادغام اطلاعات دارای مزایایی می باشد، ولی مدل GMM بهترین عملکرد را برای تشخیص صدای افراد به صورت دقیق نشان داده است. به هر حال، برای جزییات بیشتر در ارتباط با فضاهای صوتی و دریافت عملکردهای مناسبی ، تعداد موئلفه های مربوط به هر مدل، معمولا بزرگ می باشد به ویژه زمانی که ماتریس کوواریانس قطری مورد استفاده قرار می گیرد. در سیستم های GMM مربوط به تشخیص صدا، معمولا یک مدل عمومی ، با توجه به تعداد زیادی از موئلفه های این مدل بر مبنای اطلاعات مربوط به ساعات گفتگو از گفتارهای غیرهدفمند ایجاد می گردد. سپس مدل GMM با توجه به حداکثر رساندن انطباق های UBM ایجاد می گردد. اگرچه، هزینه محاسباتی بر مبنای انطباق بین UBM و GMM نصف می باشد، ولی مورد نظر قرار دادن تمام اجزا بین UBM برای هر یک از این بررسی ها زمان های مورد نظر را در طی مرحله تشخیص  تحت تسلط دارد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید. محاسبات احتمالی به طور قابل توجهی با توجه به فقدان در دقت تشخیص صدا کاهش می یابد. چندین روش که از چندین طرح متفاوت استفاده می کنند این لیست ها را مورد بررسی قرار می دهند که دارای مشترکات قابل توجهی می باشند. در روش هایی که بر مبنای درخت ساختار می باشند، تراکم دارای بازده محاسباتی در تشخیص صداها می باشند. یک درخت ساختار، با توجه به طبقه بندی های از بالا به پایین، در ارتباط با این مدل های متراکم وجود دارد. در این مدل ها، تکنیک هایی مطرح شده است که به پارتیشن بندی این بخش ها به طور زنجیروار می پردازند. هر گره در این مجموعه، یک بخش را مشخص می کند، که بر مبنای به حداکثر رساندن اطلاعات بدست می آیند. این محاسبات که برای ارزیابی این مدل به کار می روند، با استفاده از فاکتور 25 با 4 درصد کاهش در میزان خطا همراه می باشند.



اخیرا، با توجه به فعالیت های گاوس در تشخیص صدا، مدل ترکیب شده ای از GMM در ارتباط با تشخیص صدای افراد مطرح شده است. در این روش، در ابتدا سیستم ترکیبی با توجه به اطلاعات کلی مشخص می شود. سپس مجموعه ای از موئلفه های ترکیبی در UBM های بزرگتر ایجاد می گردد که بر مبنای ایجاد فرکانس در بخش های مناسب مدل GMM و UBM می باشد. برای هر یک از این بخش ها، تنها موئلفه هایی که در بخش های بالاتر قرار دارند مورد ارزیابی قرار می گیرند. کاهش محاسباتی با توجه به فاکتور شماره 10 با کاهش رتبه در عملکرد تشخیص همراه می باشد. روش های دیگر برای کاهش هزینه محاسباتی در سیستم تشخیص صدا نیز مد نظر قرار می گیرد. این موضوع نیز نشان داده شده است که با کاهش رتبه این مدل ها یا کاهش میزان فریم ها، هزینه محاسباتی نیز با توجه به فاکتور شماره 4، با کاهش عملکرد تشخیص کمتر می شود. الگوریتم کارآمدی نیز در ارتباط با تشخیص صدای گوینده وجود دارد. تنظیم سریع این مدل ها از طریق مرتب کردن توالی بردارها ایجاد می گردد. سرعت نیز با توجه به فاکتورهای شش در مقایسه با توالی سنتی تر بهبود می یابد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید. در طی فرایند آموزشی پایین تر می آید. علاوه بر این، عملکردهایی که با استفاده از شبکه های عصبی حاصل می گردد، بسیار پایین تر از مدل های GMM می باشد. بعضی از هیبرید های مربوط به شبکه عصبی و HMM ها، قبل از تشخیص صدا با فعالیت شبکه های عصبی، که به عنوان پردازنده ها عمل می کنند مشخص می گردند. اخیرا، یک شبکه عصبی در تعیین هویت افراد   به عنوان یک پردازنده در سطوح مورد استفاده قرار گرفته است تا علائم را از سه سیستم دیگر با توجه به ویژگی های متفاوت آن تشخیص دهد. عملکرد فرایندهای چند سیستمی بهتر از سه سیستم دیگر می باشد. همچنین کاربردهای دیگری نیز در تشخیص شبکه های عصبی وجود دارد که شامل، ویژگی های مجزای طراحی شده برای تشخیص صدای افراد برای جبران اختلالات تلفنی می باشد.



به منظور دستیابی به بازده محاسباتی و عملکردهای تطبیقی، ما سیستم یکپارچه ای را با توجه به مدل مخلوط گاوس و شبکه های عصبی چندلایه به کار می بریم. مدل پس زمینه ساختاری (SBM) در ابتدا بر مبنای UBM ها ساخته می شود. در طی فرایند ساخت، تمام موئلفه های مربوط به مدل مخلوط گاوس در UBM به طور زنجیروار متصل می گردد. در این مسیر، فضاهای صوتی به مناطق چندگانه ای در سطوح مختلف تقسیم بندی می شوند. جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید. تخمین های شبه مرکزی و شبکه های عصبی در این مقالات مورد مقایسه قرار می گیرد. این آزمایش ها بر روی اطلاعات در ارزیابی تعیین هویت NIST در سال 1999 مورد استفاده قرار گرفته است. نتایج نشان می دهد که، تقلیل محاسباتی با توجه به فاکتور 17 با توجه به 5% کاهش نسبی در میزان خطاها در مقایسه با مدل GMM-UBM می باشد. مدل SGMM-SBM همچنین مزایایی را در ارتباط با مدل GMM که دارای عملکردهای بهتری می باشد نشان می دهد.



این مقاله به صورت زیر سازمان دهی می گردد. در بخش 2 ما به طور مختصر سیستم تعیین هویت GMM را مرور می کنیم. سپس ما ساختارهای SBM و SGMM را به صورت مفصل در بخش 3 توصیف می کنیم. مراحل تعیین هویت و ترکیب بخش ها از طریق شبکه عای عصبی در بخش 4 مورد بررسی قرار می گیرد. در بخش 5 نتایج مقدماتی ارائه می گردد.در بخش آخر، نتیجه گیری حاصل می گردد.



2- مدل مخلوط گاوس



چون ساختارهای SBM بر مبنای UBM بوده و همچنین GMM-UBM به عنوان یک سیستم اصلی در این مقاله مطرح می گردد، ما به طور مختصر به بررسی سیستم تشخیص صدای  GMM-UBM می پردازیم. مدل UBM با توجه به بخش های M توسط الگوریتم EM مطرح می گردد که از اطلاعات گفتاری برای گوینده غیرهدفمند استفاده می کند. نقش های احتمالی ابعاد K به صورت زیر می باشد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



در این فرمول جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید. به عنوان پارامترهای تنظیم شده GMM مطرح می گردد. با استانه قرار دادن نسبت این احتمالات به طور متوسط، تصمیماتی گرفته می شود که به پذیرش و یا رد این فرضیه ها می پردازند. این موضوع نیز مد نظر قرار می گیرد که تنها تعداد کمی از این ترکیبات با احتمالات موجود سازگار می باشند، البته زمانی که GMM مورد ارزیابی قرار گیرد. بر مبنای چنین حقایقی، و همچنین انطباق بین مدل های GMM و UBM یک روش سریعی مطرح می گردد. برای هر یک از این بردارها، موئلفه های C گاوس در بین موئلفه های M در مدل UBM یافت می شود. سپس، موئلفه های C در مدل GMM مورد ارزیابی قرار می گیرد. بنابراین C فراتر از M می باشد. هزینه محاسباتی نیز تقریبا به نصف کاهش می یابد.



3 -  بخش های مربوط به مدل SBM و SGMM در شکل 1 نشان داده شده است.



بر مبنای مدل UBM، ساختارهای لایه L، SBM همان طور که در شکل 2 نشان داده شده است می تواند ایجاد گردد تا ساختارهای فضایی صوتی را مدل سازی کند. از طریق طبقه بندی زنجیره ای از بالا به پایین،هر گره در لایه L-1، مجموعه ای از موئلفه های مدل گاوس را در UBM تشکیل می دهد. هر یک از این گره ها مطابق با موئلفه های مخلوط گاوس در UBM می باشد. به این ترتیب، SBM، فضاهای صوتی را در سطوح مختلف مدل سازی می کند. زمانی که SBM ایجاد شد، SGMM های مبدا با توجه به ساختارهای درختی مشابه، با استفاده از انطباق چندسطحی SBM ایجاد می گردد. هر لایه در SGMM از طریق انطباق MAP در SBM ایجاد می گردد بنابراین موئلفه های گاوس در SGMM و SBM انطباق نزدیکی با یکدیگر داشته که در طی مرحله شناسایی مفید می باشند.



قبل از ایجاد SBM، یک مسافت قابل اندازه گیری می بایست بین دو گاوس تعریف گردد. در تحقیقات چندین نمونه از این موارد تعریف شده است. دو نمونه از این موارد به نام کولبک و بتاچاریا می باشد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



که به صورت دقیقی بر مبنای طبقه بندی خطای بای قرار دارد. دومین دوره در ارتباط با این مورد به عنوان ماهالانوبیس می باشد که از ماتریس کوواریانس متوسطی استفاده می کند.



B) تخمین های طبقه بندی شده شبه مرکزی:



این نوع از تخمین ها به عنوان موضوع مهم دیگری در ارتباط با طبقه بندی گاوس در ارتباط با ساختارهای درختی می باشد. مختصات مربوط به این نوع مدل با استفاده از فرایند به حداکثر رسانده احتمالات انجام می گیرد. در موارد 6 و 9 این فرضیات وجود دارد که تعداد نمونه های اطلاعاتی در ارتباط با هر یک از موئلفه های ترکیبی یکسان می باشد. به هر حال این موارد ممکن است منجر به سقوط عملکردها گردد زیرا فضاهای صوتی به طور نامناسبی مدل سازی می گردند.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



با در نظر گرفتن بخش های آغازین که توسط روش ML ایجاد می گردد، میانگین و واریانس پایانی بعد از چندین فرایند تکراری با توجه به میانگین ایجاد شده در هر مرحله آغازی به وجود می آید.



به طور مشابه، برای به حداقل رساندن فواصل باتاچاریا، میانگین و واریانس از طریق روش BH به طور مکرربه روز می گردند.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



که در این فرمول R تعداد بخش های موجود در طبقه می باشد.



C. ساختارهای درختی.



در طی فرایند درختی SBM، تعداد لایه های L و ساختارها در لایه L-1 قبل از طبقه بندی تعیین می گردند. الگوهای مورد نظر برای طبقه بندی گاوس به شکل زیر توصیف می گردد.



1) میانگین و واریانس لایه اول. یعنی گره های اصلی توسط فرمول 10 و 11 با توجه به موئلفه های گاوس در UBM محاسبه می گردند.



2) سپس گره ها در لایه بعدی توسط روش های مینی مکس بر مبنای واگرای KL و یا فواصل باتاچاری تعیین می گردند. pdf مربوط به هر یک از گره ها با توجه به تناسب خطی بین پارامترهای اصلی PDF و گره ها مشخص می گردند.



3) روش میانگین K با توجه به موئلفه های مخلوط گاوس در هر گره بکار می رود. در هر تکرار، زمانی که واگرای KL مورد استفاده قرار می گیرد، میانگین و واریانس توسط روش ML یا روش KL به روز می گردند. به طور مشابه، روش های ML یا BH زمانی به کار می روند که فواصل باتاچاری انتخاب گردند.مقادیر اولیه ر ارتباط با روش های KL و BH همان طور که در قبل بیان شد توسط روش ML ایجاد می گردد.مقادیر مربوط به میانگین، واریانس و سنجش ها زمانی که فواصل ادغام می گردند در هر گره قرار می گیرند.



4) روش های مشابه در مرحله 2 و 3 برای لایه های دیگر نیز تکرار می گردد تا زمانی که طبقات در لایه L-1 به کار گرفته شوند.



5) هر یک از این اجزا در هر طبقه در لایه L-1 در لایه خاصی قرار می گیرد.



با توجه به اندازه متغیر این طبقات، تعداد شاخه ها در هر گره در لایه L-1 از یک گره به گره دیگر متفاوت می باشد و این بستگی به روش های ساختارهای درختی مختلف دارد. به هر حال تعداد کل گره ها همیشه مشابه M می باشد.



این موضوع نیز می بایست مد نظر قرار گیرد که ساختارهای درختی در مدل های چندگانه برای تشخیص صداها مورد استفاده قرار می گیرد. هر گره در این فرایندها توسط GMM طراحی شده و که نشان دهنده یک طبقه تلفنی می باشد. بنابراین تمام طلاعات آموزشی می بایست در ابتدا تعیین گردد. بنابراین هیچ نسخه ای برای آموزش SBM مورد نیاز نمی باشد زیرا موئلفه های مخلوط گاوس به صورت غیر قابل شگفت انگیزی طبقه بندی می گردند. این مسئله در فرمول 23 نشان داده شده است که چنین ترکیبات گروه بندی شده ای از نظر آوایی معنا دار می باشند.ما همچنین این موضع را یادآوری کرده ایم که VQ هایی که بر مبنای GMM می باشند در فرمول 27 برای تعیین هویت گوینده به طور مستقل مطرح می شوند. کل فضاهای صوتی از طریق اختصاص مقادیر خاصی به چندین بخش طبقه بندی می گردند. سپس هر یک از این بخش ها توسط مدل GMM مشخص می گردد. به هر حال برای هر یک از این بررسی ها، این مقادیر در برابر تمام GMM ها برای پیدا کردن یک ماکزیمم مورد محاسبه قرار می گیرند. به این ترتیب، هیچ نوع بازده محاسباتی در اینجا وجود خواهد داشت.



D) تطابق چند سطحی :



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



4- تطبیق



شکل 3 دیاگرامی را در ارتباط با سیستم های تایید گفتار ارائه می دهد. زمانی که ویژگی ها از تست گفتار بر گرفته می شود . SBM و SGMM اهداف و پیشینه هایی را ایجاد می کنند . این بخش ها از طریق شبکه های چند لایه ای ترکیب می گردند تا طرح های پایانی را ایجاد کنند.



A- امتیاز بندی SBM و SGMM.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



B. ترکیب فواصل از طریق شبکه های چند لایه :



این موضوع به صورت رک و بی پرده وجود دارد که فواصل چندگانه در ارتباط با SGMM و SBM از طریق ترکیب خطوط بوده و نسبت های احتمالی چندگانه ای را مد نظر قرار می دهند. به هر حال این روش ها همان طور که در بخش های نتیجه گیری نشان داده شده است، بهبودی آشکاری را در ارتباط با عملکرد لایه ها ایجاد نمی کنند. به این ترتیب عملکردهای تطبیقی که از لایه های پایین تر حاصل می گردد بهتر از همتای آن ها در لایه های بالاتر می باشد از این رو این موارد فضاهای صوتی را با وضوح بالاتری رصد می کنند. همچنین این عقیده نیز وجود دارد که فواصل در طبقات بالاتر اطلاعات کارامدی را در مورد تشخیص گوینده خواهن داشت . به ویژه در مواقعی که اطلاعات به صورت پراکنده وجود دارد، لایه های بالاتر با تعداد کمتری از مدل های گاوس به طور کاراتری از لایه های پایین تر مورد بررسی قرار می گیرند.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



بای بازتاب دادن استقلال غیر خطی در میان فواصل از سطوح مختلف، استفاده از شبکه های عصبی برای ترکیب این فواصل مناسب می باشد.نظریات نشان داده است که استانداردهای چند لایه با یک لایه پنهانی و نقش های عملکردی غیر خطی می تواند مرزهای تصمیم گیری غیر خطی را تشخیص دهد.سه لایه LMP این فواصل را در لایه های مختلف SBM و SGMM برای دستیابی به فواصل نهایی برای هر بخش ایجاد می کند. همان طور که در شکل 4 نشان داده شده است، این فواصل به عنوان درون داد MLP فعالیت می کنند.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



نتیجه گیری پایانی بر مبنای ارزش MLP ایجاد می گردد.



MLP با استفاده از یک الگوریتم گسترده انتشار می یابد که شامل روش های شیب دار می باشد.با توجه به فواصل موجود در ارتباط با اهداف شناخته شده، نتایج مورد نظر به صورت 1  برای اهداف شناخته شده و صفر برای بخش های متظاهر می باشد.تنظیم می گردد. از طریق چنین آموزش هایی، MLP باعث افزایش توانایی اهداف متفاوت و گوینده ها می گردد. در هنگام آزمایش، مجموعه مشابهی از این فواصل از مدل های SGMM-SBM ایجاد می گردد و در بخش های درونی MLP قرار می گیرد و به این ترتیب بعضی از خطاها تصحیح می گردد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.



یعنی، نسبت احتمالی پایین را به بخش های بالاتری و بلعکس از بخش های بالاتر به بخش های پایین تری تبدیل می کند. عملکردهای تطبیقی بالاتر می تواند در سیستم های یکپارچه به کار گرفته شود. همچنین، زمانی که ابعاد ورودی به عنوان یک دورنما پایین تر از ابعاد بردارهای حامل می باشد، ادغام این موارد آسان بوده و به این ترتیب آموزش سریع می باشد. اندازه های متفاوتی از لایه های پنهانی در بخش های آزمایشی مورد امتحان قرار می گیرد.



5. آزمایشات.



پایگاه های اطلاعاتی .مدل SGMM-SBM در ارتباط با ارزیابی اطلاعات تلفنی بوده و در 1999 NIST برای تشخیص صدای گوینده مورد استفاده قرار می گرفته است.به اندازه 4 ساعت مکالمه از 240 مرد و زن در NIST 1998 مورد ارزیابی قرار گرفت  و این موارد برای تعیین استقلال جنس افراد در مدل SBM کاربرد دارد. هر یک از 230 مرد و 309 زن دارای 2 دقیقه زمان برای مکالمه بوده اند. در میان آن ها 60 مرد و 60 زن برای امتحان در این مدل آماده شده بودند. 170 مرد دیگر و 249 زن دیگر نیز برای این تست مورد استفاده قرار گرفتند. بنابراین هیچ گوینده ای دارای اشتراک در این مدل بر مبنای آموزش و تست اطلاعات نبوده است. مدت هر یک از این تست ها از چند ثانیه تا 1 دقیقه بوده است. که اکثر این تست ها در محدوده 15 تا 45 ثانیه بوده است. 87 مر و 114 زن در ارزیابی NIST  1997 از اطلاعات مکمل برای تنظیم ساختارهای MLP استفاده کرده اند. نسبت بین اهداف و وانمود کننده ها در هر دو ارزیابی به صورت 1:10 بوده است. جزییات بیشتر در ارتباط با ارزیابی NIST در فرمول 30 نشان داده شده است.



پردازش نرم افزار نهایی.



میزان فریم ها برابر با 16 میلی ثانیه می باشد.19 بعد از ضریب فرکانس از طریق اطلاعات اولیه پهنای باند محدود دریافت می شود. سپس تاثیر کانال ها از طریق انتقال MFCC با توجه به ویژگی های خاص آن انجام می گیرد. که اخیرا در یک چارچوب زمانی کوتاه مدت قرار گرفته است. ضریب دلتا 19 بر مبنای MFCC محاسبه شده و برای شکل دهی بردار حامل با 38 بعد که در تمام آزمایشات مورد استفاده قرار گرفتبه آن الحاق می گردد.



جهت مشاهده متن کامل، فایل ترجمه را دانلود نمایید.


 برچسب ها: 

Efficient textindependent speaker verification with structural Gaussian mixture models and neural network

تعیین هویت گوینده مستقل از متن، توسط مدل های مخلوط گاوس ساختاری و شبکه های عصبی

ISI

Paper

Papers

Article

Articles

شبکه عصبی

مقاله ISI

دانلود ISI

ترجمه مقاله

دریافت مقاله

ISI کامپیوتر

مقاله انگلیسی

Persian Paper

خوشه بندی گاوس

خرید ترجمه ISI

Persian Article

ترجمه مقاله ISI

مقاله رایگان ISI

دانلود مقاله ISI

خرید ترجمه مقاله

دانلود ترجمه ISI

دریافت مقالات ISI

تعیین هویت گوینده

مقالات رایگان ISI

دانلود مقاله جدید

فروش ترجمه انگلیسی

خرید ترجمه انگلیسی

مقاله انگلیسی جدید

مقاله ISI کامپیوتر

مقاله ISI با ترجمه

دانلود ISI کامپیوتر

ترجمه مقاله انگلیسی

دانلود مقاله انگیسی

مقالات معتبر انگلیسی

ترجمه مقاله کامپیوتر

ترجمه مقالات انگلیسی

دریافت مقاله انگلیسی

دانلود مقاله جدید ISI

دریافت مقاله کامپیوتر

مقاله انگلیسی با ترجمه

مقاله انگلیسی کامپیوتر

مدل مخلوط گاوس ساختاری

Translate English Paper

دانلود رایگان مقاله ISI

خرید ترجمه ISI کامپیوتر

دانلود مقالات رایگان ISI

ترجمه مقاله ISI کامپیوتر

دانلود مقاله ISI با ترجمه

دانلود ترجمه ISI کامپیوتر

Translate English Article

دانلود مقاله انگلیسی جدید

خرید ترجمه مقاله کامپیوتر

دانلود مقاله ISI کامپیوتر

مقاله رایگان ISI کامپیوتر

دریافت مقاله انگلیسی جدید

Translate Paper in English

دانلود مقاله جدید کامپیوتر

دریافت مقالات ISI کامپیوتر

ترجمه مقالات معتبر انگلیسی

مقالات رایگان ISI کامپیوتر

دانلود مقاله انگلیسی رایگان

دانلود رایگان مقاله انگلیسی

دانلود مقاله انگلیسی رایگان

دریافت مقاله انگلیسی رایگان

مقاله انگلیسی جدید کامپیوتر

خرید ترجمه انگلیسی کامپیوتر

مقاله ISI با ترجمه کامپیوتر

فروش ترجمه انگلیسی کامپیوتر

Translate Article in English

ترجمه مقاله انگلیسی کامپیوتر

دانلود مقاله انگیسی کامپیوتر

دریافت مقاله انگلیسی با ترجمه

دانلود مقاله انگلیسی با ترجمه

دریافت مقاله انگلیسی کامپیوتر

ترجمه مقالات انگلیسی کامپیوتر

مقالات معتبر انگلیسی کامپیوتر

دانلود مقاله جدید ISI کامپیوتر

Translation of Paper in English

مقاله انگلیسی با ترجمه کامپیوتر

دانلود رایگان مقاله ISI کامپیوتر

Translation of Article in English

دانلود مقالات رایگان ISI کامپیوتر

دریافت مقاله انگلیسی جدید کامپیوتر

دانلود مقاله انگلیسی جدید کامپیوتر

دانلود مقاله ISI با ترجمه کامپیوتر

ترجمه مقالات معتبر انگلیسی کامپیوتر

دریافت مقاله انگلیسی رایگان کامپیوتر

دانلود مقاله انگلیسی رایگان کامپیوتر

دانلود مقاله انگلیسی رایگان کامپیوتر

دانلود رایگان مقاله انگلیسی کامپیوتر

دانلود مقاله انگلیسی با ترجمه کامپیوتر

دریافت مقاله انگلیسی با ترجمه کامپیوتر

به سوی پایگاه داده چندگانه (اشتراکی) انعطاف پذیر و مستقل
فايل پيوست

Abstract The success of cloud computing as a platform for deploying webapplications has led to a deluge of applications characterized by small data footprints with unpredictable access patterns. A scalable multitenant ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 119500 تومان

رویکردی در ارتباط با معماری خط تولید سرویسگرا
فايل پيوست

Abstract Service-Oriented Architecture (SOA) has appeared as an emergent approach for developing distributed applications as a set of self-contained and business-aligned services. SOA aids solving integration and interoperability problems and provides ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 119500 تومان

ظرفیت شبکه های بی سیم
فايل پيوست

Abstract When n identical randomly located nodes, each capable of transmitting at W bits per second and using a fixed range, form a wireless network, the throughput (formula) obtainable by each ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 139500 تومان

سیستم های صف بندی زمان گسسته با تعطیلی های انحصاری مارکوفب
فايل پيوست

Abstract In this contribution we investigate discrete-time queueing systems with vacations. A framework is constructed that allows for studying numerous different vacation systems, including a.o. classical vacation systems like the exhaustive ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 129500 تومان

طراحی و تحلیل یک مدل وقفه (تعطیلی) برای سیستم صف بندی دو فازه با خدمات ورودی
فايل پيوست

Abstract This paper mainly deals with a two phase service queueing model with gated service vacation. In this gated service vacation model, only those customers who are present in the queue ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 129500 تومان

به اشتراک گذاری طیف مشارکتی بین شبکه های تلفن همراه و اد هاک
فايل پيوست

Abstract Spectrum sharing between cellular and ad-hoc networks is studied in this work. Weak signals and strong interferences at the cell-edge area usually cause severe performance degradation. To improve the cell-edge ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 139500 تومان

مقایسه پروتکل های مسیر یابی تک مسیره در مقابل پروتکل های مسیر یابی چندگانه برای انتقال تصویر در شبکه های حسگر بی سیم چند رسانه ای
فايل پيوست

Abstract Wireless multimedia sensor network (WMSN) applications require strong multimedia communication competence. Therefore, in WMSN applications, it is necessary to use specific mechanisms in order to handle multimedia communication challenges and ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 129500 تومان

هوش کسب و کار به روش محاسبه ابری
فايل پيوست

Abstract Business Intelligence (BI) deals with integrated approaches to management support. Currently, there are constraints to BI adoption and a new era of analytic data management for business intelligence these constraints ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 119500 تومان

مدل احتمال جدید برای ضمانت کردن مشکل مسیر بحرانی با الگوریتم اکتشافی
فايل پيوست

Abstract In order to obtain an adequate description of risk aversion for insuring critical path problem, this paper develops a new class of two-stage minimum risk problems. The first-stage objective function ... [ ادامه مطلب ]

انتشارات: ACM
پرداخت و دانلود قیمت: 129500 تومان

دستورالعمل طراحی و محاسبه سیستم روشنایی
فايل پيوست

 مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 119500 تومان

فایل اکسل طراحی مخزن فلزی هوایی بر اساس آیین نامه AISC با در نظر گرفتن نیروی باد و زلرله
فايل پيوست

 فایل پیش رو اکسل طراحی مخزن فلزی هوایی می باشد که بر اساس آیین نامه AISC و با در نظر گرفتن نیروی باد و زلرله محاسبات را انجام داده و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 79500 تومان

فایل اکسل تحلیل اتصال برشی دارای خروج از مرکزیت برای گروه پیچ
فايل پيوست

 این برنامه ظرفیت برشی اتصال پیچ و مهره ای دارای خروج از مرکزیت برای گروه پیچ را محاسبه می کند، ابزاری مناسب برای طراحی صفحات gusset و اتصالات پیچ و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 79500 تومان

فایل اکسل طراحی روسازی آسفالتی بر مبنای آیین نامه آشتو و استفاده از آزمایش ظرفیت باربری کالیفرنیا
فايل پيوست

 فایل پیش رو اکسل طراحی روسازی آسفالتی بر مبنای آیین نامه آشتو می باشد که با استفاده از نتایج آزمایش ظرفیت باربری کالیفرنیا CBR اطلاعات ورودی را تحلیل و نتایج را ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 79500 تومان

طراحی ابعاد و سازه شالوده های عمیق (شمع ها و پایه های عمیق) در خشکی
فايل پيوست

 مجموعه دستورالعمل های ارائه شده در دیتاسرا شامل ضوابط و مراحل تحلیل و طراحی سازه های گوناگون صنعتی و بر اساس الزامات مندرج در آیین نامه های معتبر داخلی و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 119500 تومان

تحلیل غیرخطی و مدل سازی عددی تیر بتن مسلح تقویت شده با FRP توسط Finite Element Method
فايل پيوست

 "پایان نامه مهندسی عمران مقطع کارشناسی ارشد - گرایش سازه" تحلیل غیرخطی و مدل سازی عددی تیر بتن مسلح تقویت شده با FRP توسط Finite Element Method   مشخصات کلی: شامل فایلهای word و ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 129500 تومان

بررسی پارامترهای هندسی مهاربند زانویی
فايل پيوست

 "پروژه دانشجویی مهندسی عمران" بررسی پارامترهای هندسی مهاربند زانویی   مشخصات کلی: شامل فایلهای word و pdf بالغ بر 146 صفحه (4 فصل) فهرست مطالب فصل اول 1-1- مقدمه 1-2- شکل پذیری سازه ها 1-3- مفصل و لنگر پلاستیک 1-4- منحنی ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 129500 تومان

تحلیل و طراحی سیستم گرمایشی ساختمان مسکونی با استفاده از ذخیره کننده های حرارتی PCM
فايل پيوست

 "پایان نامه مهندسی مکانیک مقطع کارشناسی ارشد - گرایش تبدیل انرژی" تحلیل و طراحی سیستم گرمایشی ساختمان مسکونی با استفاده از ذخیره­ کننده ­های حرارتی PCM   تهیه شده بصورت کاملا انحصاری توسط ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 449000 تومان

شناسایی و رتبه بندی دلایل انحراف از هزینه پیش بینی شده و ارائه راهکارهای کاهش آن: مطالعه موردی پروژه های "پتروشیمی الف"
فايل پيوست

  "پایان نامه مهندسی عمران مقطع کارشناسی ارشد - گرایش مهندسی و مدیریت ساخت"   شناسایی و رتبه بندی دلایل انحراف از هزینه پیش بینی شده و ارائه راهکارهای کاهش آن: مطالعه ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 259500 تومان

مکانیک شکست (Fracture Mechanics)
فايل پيوست

مقدمه : یکی از عمده ‌ترین مسائلی که انسان از زمان ساختن ساده‌ترین ابزارها با آن مواجه بوده است پدیده شکست در اجسام می‌باشد و درواقع برای استفاده از مواد ... [ ادامه مطلب ]

پرداخت و دانلود قیمت: 99500 تومان

ناحیه کاربری

فرمت ایمیل صحیح نمی باشد. ایمیل خود را وارد نمایید.

رمز عبور خود را وارد نمایید.

مجله اینترنتی دیتاسرا
کلیه حقوق مادی و معنوی این وبسایت متعلق به گروه نرم افزاری دیتاسرا می باشد.
ایمیل:
support.datasara[AT]gmail[دات]com

Copyright © 2025