مدل جدید هوش مصنوعی انویدیا با توانایی تغییر صدا و لهجه معرفی شد

انویدیا از مدل مولد صدای جدید خود با نام Fugatto رونمایی کرد که توانایی تبدیل متن به صوت و تغییر صدا و لهجه افراد را دارد. این مدل می‌تواند نواهای تازه‌ای خلق کند، اما فعلاً برای عموم منتشر نمی‌شود.

انویدیا مدل زبانی بزرگی را توسعه داده است که می‌تواند صدا یا لهجه‌ی افراد را تغییر دهد.

انویدیا مدل جدید هوش مصنوعی را برای تولید موسیقی و صدا معرفی کرد که می‌تواند صداها را تغییر دهد و نواهای جدیدی بسازد. تیم سبز، بزرگ‌ترین تأمین‌کننده‌ی تراشه‌‌ برای سرورهای هوش مصنوعی جهان، مدل مولد صدای خود را Fugatto نامیده و اعلام کرده است که فعلاً برنامه‌ای برای انتشار عمومی آن ندارد.

Fugatto می‌تواند توصیف متنی را به صوت و موسیقی تبدیل و حتی صداهای شنیده‌نشده‌ای خلق کند؛ از جمله صداهای جدیدی مانند صدای یک ترامپت به‌شکلی که مانند یک سگ پارس کند.

آنچه Fugatto را از سایر مدل‌های هوش مصنوعی متمایز می‌کند، توانایی آن در تغییر یا اصلاح صداهای موجود است. به‌عنوان مثال، می‌تواند قطعه‌ی نواخته‌شده‌ای روی پیانو را به آواز انسان‌گونه تبدیل کند یا صدای یک فرد را اصلاح کند و لهجه و حالت بیان آن را تغییر دهد.

به‌گزارش رویترز، برایان کاتنزارو، معاون تحقیق‌وتوسعه‌ی یادگیری عمیق کاربردی در انویدیا می‌گوید: «من فکر می‌کنم که هوش مصنوعی مولد قابلیت‌های جدیدی به موسیقی، بازی‌های ویدئویی و افراد عادی که می‌خواهند چیزهایی بسازند، هدیه می‌دهد.»

مدل جدید انویدیا روی داده‌های منبع‌باز آموزش دیده است و زمان انتشار آن هنوز در ابهام قرار دارد. کاتنزارو گفت: «هر فناوری مولدی همیشه برخی خطرات را به‌همراه دارد؛ زیرا شاید افراد از آن برای تولید محتواهایی استفاده کنند که مناسب نیست. ما باید در این مورد محتاط باشیم، به‌ همین دلیل، برنامه‌ای فوری برای در دسترس قراردادن Fugatto نداریم.»

سازندگان مدل‌های هوش مصنوعی مولد هنوز نتوانسته‌اند راهی برای جلوگیری از سوءاستفاده از این فناوری، مانند دیپ فیک یا نقض حق کپی‌رایت پیدا کنند. OpenAI و متا نیز همچنان نگفته‌اند که چه زمانی قصد دارند مدل‌های تولید صوت یا تصویر خود را به‌صورت عمومی منتشر کنند.

منبع
زومیت
دکمه بازگشت به بالا