گوگل در حال ساخت مترجم جهانی است

گوگل در حال آزمایش یک سرویس دوبله بلادرنگ برای یوتیوب و باقی سرویس های ویدیویی است

ادغام یکپارچه قابلیت‌های هوش مصنوعی از PalM 2 در سراسر اکوسیستم Google، از جمله Bard، موضوع اصلی رویداد Google I/O 2023 بوده است. اگرچه گوگل معتقد است برخی از ویژگی ها وجود دارد که نباید فوراً منتشر شوند.

شما می توانید گوگل گزینه های سفارشی سازی بیشتری ارائه می شود را در اینجا مطالعه کنید.

ساخت نرده محافظ توسط گوگل

در طول سخنرانی Google I/O، معاون ارشد فناوری و جامعه این شرکت، جیمز مانیکا، نگرانی‌های خود را در مورد تنش‌های احتمالی بین اطلاعات نادرست و برخی قابلیت‌های هوش مصنوعی، یعنی فناوری‌ای که پشت اسناد جعلی‌های عمیق است، مطرح کرد.

مطالب مرتبط

گوشی اینفینیکس GT 20 Pro با نمایشگر 144 هرتز

ساعت هوآوی Watch Fit 3 با رابط کاربری متحول شده

آنچه او به آن اشاره می کند، مدل های زبانی است که دیپ فیک ها برای دوبله صداها در ویدیوها استفاده می کنند. می دانید که در آن مونولوگ یک بازیگر مشهور از یکی از بهترین برنامه های تلویزیونی یا بهترین فیلم ها ناگهان با صدای مصنوعی جایگزین می شود که صدای اصلی را تغییر می دهد.

از آنجایی که گوگل پتانسیل استفاده نادرست از این فناوری توسط افراد نادرست را می بیند، اقداماتی را برای راه اندازی چیزی که از آن به عنوان «نرده محافظ» یاد می شود انجام می دهد. به منظور جلوگیری از سوء استفاده از برخی از این ویژگی های جدید، این شرکت در حال ادغام مصنوعات در عکس ها و فیلم ها، مانند واترمارک و ابرداده است.

یکی از ابزارهای جدید که بسیار مفید و سودمند خواهد بود، اما به راحتی می تواند مورد سوء استفاده قرار گیرد، نمونه اولیه ای است که گوگل در حال ارائه به تعدادی شریک به نام “مترجم جهانی” است.

شما می توانید گوگل تجربه Maps را فراگیر می کند را در اینجا مطالعه کنید.

مترجم جهانی

مترجم جهانی گوگل یک سرویس آزمایشی دوبله ویدیو با هوش مصنوعی است که گفتار را در زمان واقعی ترجمه می‌کند و به شما امکان می‌دهد در حین تماشای یک ویدیو، فوراً ببینید آنچه را که فردی به زبان دیگری می‌گوید بخوانید.

نمونه اولیه در طول این رویداد از طریق ویدئوهای آزمایشی که بخشی از یک دوره کالج آنلاین بود که با مشارکت دانشگاه ایالتی آریزونا ایجاد شده بود، به نمایش گذاشته شد. گوگل می گوید که نتایج اولیه امیدوارکننده بوده است. به طوری که دانشجویان دانشگاه از این مطالعه تعداد بالاتری از اتمام دوره ها را نشان می دهند.

این مدل در چهار مرحله کار می کند. در مرحله اول، مدل حرکات لب را در یک ویدیو با کلماتی که تشخیص می دهد مطابقت می دهد. مرحله دوم الگوریتمی را راه اندازی می کند که تولید گفتار فوری را فراهم می کند. مرحله سوم این مدل از لحن صدا استفاده می کند که افزایش و کاهش سرعت طبیعی صحبت کردن کسی را اندازه می گیرد تا به ترجمه کمک کند. در نهایت، هنگامی که سبک را تکرار کرد و با لحن حرکات لب گوینده مطابقت داشت، همه آن را برای ایجاد ترجمه گرد هم می‌آورد.

شما می توانید گوگل از هوش مصنوعی استفاده می کند را در اینجا مطالعه کنید.

کاربرد مترجم جهانی

در حالی که ویژگی مترجم جهانی هنوز در خارج از یک گروه آزمایشی کوچک در دسترس نیست، ممکن است زمانی که Google اقدامات حفاظتی متعددی را آزمایش کرد، آن را به عنوان مثال در سرویس‌هایی مانند YouTube و سرویس کنفرانس ویدیویی Google Meet عرضه کند.

از این گذشته، توانایی ترجمه ویدیوهای زنده در زمان واقعی به چندین زبان می تواند ابزار فوق العاده مفیدی باشد. یک مترجم جهانی نه تنها می‌تواند بینندگان جهانی یک کانال YouTube را افزایش دهد، بلکه می‌تواند امکان پروژه‌های مشارکتی بیشتری را در سراسر کشورها فراهم کند.

ما مطمئناً منتظر خواهیم بود تا اطلاعات بیشتری در مورد این ویژگی و مکان هایی که می توان از آن در اکوسیستم گوگل استفاده کرد بشنویم.

شما می توانید گوگل Bard را در دسترس عموم قرار داد را در اینجا مطالعه کنید.