محققان چینی و مایکروسافت یک سیستم هوش مصنوعی برای تبدیل متن به صوت ابداع کرده اند که با کمک ۲۰۰ نمونه یک فایل صوتی بسیار طبیعی تولید کند.
به گزارش خبرگزاری مهر به نقل از انگجت، فناوری تبدیل متن به صوت هر روز هوشمندتر میشود اما هنوز مشکلی در مسیر پیشرفت آن وجود دارد. این فناوری هنوز هم نیازمند مدت زمان آموزش و منابع زیادی است تا بتواند بازدهی طبیعیتر ارائه کند.
در همین راستا به نظر میرسد محققان چینی و مایکروسافت راه حلی ایده آل برای این امر یافته اند. آنها یک سیستم هوش مصنوعی تبدیل متن به صوت ابداع کرده اند که میتواند فقط با کمک ۲۰۰ نمونه صوتی (معادل ۲۰ دقیقه)، فایل صوتی طبیعی تولید کند.
این سیستم به شبکههای عصبی عمیقی تکیه دارد که عملکرد نورونهای مغز را تقلید میکنند. این شبکه عصبی عمیق هر اطلاعات ورودی و خروجی را روی لینکهای سیناپسی میسنجد و به این ترتیب به آنها کمک میکند هر توالی طولانی (مانند جملههای پیچیده) را فراوری کند. این روند در کنار بخشی از سیستم که سروصدای اضافی را حذف میکند، قابلیتهای هوش مصنوعی را بیشتر میکنند.
نتیجه آزمایشها با این سیستم، فقط یک صوت رباتیک نیست. این سیستم هوش مصنوعی بسیار دقیق است و میتواند هر کلمه را به طور ۹۹.۸۴ درصد قابل درک ادا کند.
از آن مهمتر با کمک این سیستم فناوری تبدیل متن به صوت قابل دسترسی تر میشود و دیگر نیازی نیست فرد مدت زیادی تلاش کند تا صدایی طبیعی در چنین سیستمی بسازد.