مدل هوش مصنوعی مترجم گوگل از ۱۰۰۰ زبان مختلف پشتیبانی میکند
گوگل درحال توسعهی یک مدل مترجم زبان است که با بهره گرفتن از هوش مصنوعی، از ۱۰۰۰ زبان رایج دنیا پشتیبانی میکند. اگرچه این پروژه در مراحل اولیه قرار دارد اما گوگل معتقد است از مزایای آن در اکوسیستم محصولات خود بهره خواهد گرفت.
موبنا – گوگل از پروژهی بلندپروازانهی جدید خود برای توسعهی یک مدل مترجم زبان مبتنیبر هوش مصنوعی که از ۱۰۰۰ زبان پرمخاطب در سرتاسر جهان پشتیبانی میکند، خبر داده است. این شرکت بهعنوان اولین گام خود در مسیر ساخت مدل مذکور، یک مدل هوش مصنوعی را با بیشاز ۴۰۰ زبان آموزش داده است و آن را بهعنوان بزرگترین پوشش زبانی که امروزه در یک مدل گفتاری دیده میشود، توصیف میکند.
زبان و هوش مصنوعی، همیشه در قلب محصولات گوگل قرار داشتهاند، اما پیشرفتهای اخیر در یادگیری ماشینی، بهخصوص توسعهی مدلهای زبان بزرگ یا LLM قدرتمند و چندمنظوره، تأکید جدیدی روی این حوزهها دارد.
گوگل از مدتی قبل، ادغام مدلهای زبانی را در محصولاتی مثل سرویس جستجوی خود آغاز کرده است و مشکلات مربوط به عملکرد سیستمها را نیز برطرف میکند. مدلهای زبانی، نقصهایی دارند که ازجمله میتوان به تمایل به بازگرداندن سوگیریهای مضر اجتماعی مثل نژادپرستی و بیگانههراسی و ناتوانی در تجزیهی زبان براساس حساسیتهای انسانی اشاره کرد. شایانذکر است این شرکت محققان خود را پساز انتشار مقالاتی درمورد مشکلات مذکور، اخراج کرد.
اگرچه مدلهای هوش مصنوعی، قادر به انجام کارهای مختلفی مثل تولید زبان (مثل GPT-3 OpenAI) تا ترجمه (مثل پروژهی No Language Left Behind متا) هستند، اما ابتکار گوگل برای پشتیبانی از ۱۰۰۰ زبان مختلف، روی عملکرد خاصی تمرکز ندارد و درعوض بر ایجاد یک سیستم واحد با وسعت زیاد برای زبانهای سرتاسر جهان، متمرکز است.
زوبین قهرمانی، معاون ایرانی واحد تحقیقات هوش مصنوعی گوگل در گفتوگو با ورج اعلام کرد که این شرکت معتقد است ایجاد مدلی با این ابعاد بزرگ، باعث خواهد شد کارکردهای مختلف هوش مصنوعی، برای زبانهایی که در فضاهای آنلاین و مجموعه دادههای آموزشی هوش مصنوعی، حضور ضعیفی ندارند، آسانتر شود. او همچنین به زبانهایی که منابع زیادی از آنها وجود ندارد اشاره کرد.
قهرمانی میگوید:
یک مدل واحد که بسیاری از زبانهای مختلف را پوشش میدهد و روی آنها آموزش داده میشود، عملکرد بسیار بهتری برای زبانهایی که منابع کمی از آنها وجود دارد، ارائه خواهد داد. روش ما برای پشتیبانی از ۱۰۰۰ زبان مختلف، ساختن ۱۰۰۰ مدل مجزا نیست. زبانها مثل موجودات زنده هستند و از روی یکدیگر تکامل پیدا کردهاند؛ درنتیجه شباهتهایی میان آنها وجود دارد. بههرحال، زمانیکه دادههای یک زبان جدید را در مدل ۱۰۰۰ زبانی خود بگنجانیم و توانایی ترجمه از زبانهای مطرح به زبانی که منابع کمی از آن دردسترس است را داشته باشیم، قادر خواهیم بود به پیشرفتهای بسیار شگفتانگیزی دست یابیم.
تحقیقات گذشته، اثربخشی این رویکرد را نشان داده است و مقیاس مدل برنامهریزیشدهی گوگل میتواند دستاوردهای درخورتوجهی نسبت به تلاشهای گذشته داشته باشد. چنین پروژههایی درمقیاس بزرگ، بهنوعی جاهطلبی شرکتهای فناوری برای تسلط بر تحقیقات هوش مصنوعی و استفاده از مزیتهای منحصربهفرد این شرکتها ازنظر دسترسی به حجم عظیمی از قدرت محاسباتی و دادههای آموزشی را نشان میدهند. متا نیز در این زمینه پروژهی مشابهی را برای ساخت یک مترجم جهانی گفتاری آغاز کرده است.
بااینحال، دسترسی به دادهها هنگام آموزش مدلها برای بسیاری از زبانها، یک مشکل است و گوگل میگوید بهمنظور پشتیبانی از کار روی مدل ۱۰۰۰ زبانی، جمعآوری دادهها را برای زبانهای کممنبع، از ضبط صدا و متون نوشتاری، تأمین میکند.
غول جستجوی اینترنت میگوید که هیچ برنامهی مستقیمی درمورد مکان استفاده از عملکرد مدل ۱۰۰۰ زبانی خود ندارد و فقط انتظار میرود در طیف وسیعی از محصولات این شرکت از سرویس مترجم متن گرفته تا زیرنویسهای یوتیوب و موارد دیگر، کاربرد داشته باشد.
قهرمانی در بخش دیگری از توضیحات خود گفت:
یکی از نکات واقعاً جالب درمورد مدلهای زبانی بزرگ و بهطور کلی، تحقیقات زبانی این است که آنها میتوانند بسیاری از وظایف مختلف را انجام دهند. همان مدل زبان میتواند دستورهای یک ربات را به کد تبدیل کند، میتواند مسائل ریاضی را حل یا زبانهای مختلف را ترجمه کند. ویژگیهای جالب درمورد مدلهای زبان این است که درحال تبدیلشدن به مخزن عظیمی از دانش هستند و با بررسی آنها به روشهای مختلف میتوانید بهبخشهای مختلف عملکردهای مفید، دست پیدا کنید.
گوگل مدل ۱۰۰۰ زبانهی خود را برای محصولات جدید مبتنیبر هوش مصنوعی خود معرفی کرده است. این شرکت همچنین تحقیقات جدیدی را درمورد مدلهای تبدیل متن به ویدیو، نمونهی اولیهی دستیار داستاننویسی هوش مصنوعی بهنام Wordcraft و بهروزرسانی برنامهی AI Test Kitchen خود بهاشتراک گذاشت؛ برنامهای که امکان دسترسی محدود به مدلهای هوش مصنوعی این شرکت ازجمله موتور تبدیل متن به تصویر Imagen را برای کاربران فراهم میکند.
منبع: زومیت