ادغام یکپارچه قابلیتهای هوش مصنوعی از PalM 2 در سراسر اکوسیستم Google، از جمله Bard، موضوع اصلی رویداد Google I/O 2023 بوده است. اگرچه گوگل معتقد است برخی از ویژگی ها وجود دارد که نباید فوراً منتشر شوند.
شما می توانید گوگل گزینه های سفارشی سازی بیشتری ارائه می شود را در اینجا مطالعه کنید.
ساخت نرده محافظ توسط گوگل
در طول سخنرانی Google I/O، معاون ارشد فناوری و جامعه این شرکت، جیمز مانیکا، نگرانیهای خود را در مورد تنشهای احتمالی بین اطلاعات نادرست و برخی قابلیتهای هوش مصنوعی، یعنی فناوریای که پشت اسناد جعلیهای عمیق است، مطرح کرد.
آنچه او به آن اشاره می کند، مدل های زبانی است که دیپ فیک ها برای دوبله صداها در ویدیوها استفاده می کنند. می دانید که در آن مونولوگ یک بازیگر مشهور از یکی از بهترین برنامه های تلویزیونی یا بهترین فیلم ها ناگهان با صدای مصنوعی جایگزین می شود که صدای اصلی را تغییر می دهد.
از آنجایی که گوگل پتانسیل استفاده نادرست از این فناوری توسط افراد نادرست را می بیند، اقداماتی را برای راه اندازی چیزی که از آن به عنوان «نرده محافظ» یاد می شود انجام می دهد. به منظور جلوگیری از سوء استفاده از برخی از این ویژگی های جدید، این شرکت در حال ادغام مصنوعات در عکس ها و فیلم ها، مانند واترمارک و ابرداده است.
یکی از ابزارهای جدید که بسیار مفید و سودمند خواهد بود، اما به راحتی می تواند مورد سوء استفاده قرار گیرد، نمونه اولیه ای است که گوگل در حال ارائه به تعدادی شریک به نام “مترجم جهانی” است.
شما می توانید گوگل تجربه Maps را فراگیر می کند را در اینجا مطالعه کنید.
مترجم جهانی
مترجم جهانی گوگل یک سرویس آزمایشی دوبله ویدیو با هوش مصنوعی است که گفتار را در زمان واقعی ترجمه میکند و به شما امکان میدهد در حین تماشای یک ویدیو، فوراً ببینید آنچه را که فردی به زبان دیگری میگوید بخوانید.
نمونه اولیه در طول این رویداد از طریق ویدئوهای آزمایشی که بخشی از یک دوره کالج آنلاین بود که با مشارکت دانشگاه ایالتی آریزونا ایجاد شده بود، به نمایش گذاشته شد. گوگل می گوید که نتایج اولیه امیدوارکننده بوده است. به طوری که دانشجویان دانشگاه از این مطالعه تعداد بالاتری از اتمام دوره ها را نشان می دهند.
این مدل در چهار مرحله کار می کند. در مرحله اول، مدل حرکات لب را در یک ویدیو با کلماتی که تشخیص می دهد مطابقت می دهد. مرحله دوم الگوریتمی را راه اندازی می کند که تولید گفتار فوری را فراهم می کند. مرحله سوم این مدل از لحن صدا استفاده می کند که افزایش و کاهش سرعت طبیعی صحبت کردن کسی را اندازه می گیرد تا به ترجمه کمک کند. در نهایت، هنگامی که سبک را تکرار کرد و با لحن حرکات لب گوینده مطابقت داشت، همه آن را برای ایجاد ترجمه گرد هم میآورد.
شما می توانید گوگل از هوش مصنوعی استفاده می کند را در اینجا مطالعه کنید.
کاربرد مترجم جهانی
در حالی که ویژگی مترجم جهانی هنوز در خارج از یک گروه آزمایشی کوچک در دسترس نیست، ممکن است زمانی که Google اقدامات حفاظتی متعددی را آزمایش کرد، آن را به عنوان مثال در سرویسهایی مانند YouTube و سرویس کنفرانس ویدیویی Google Meet عرضه کند.
از این گذشته، توانایی ترجمه ویدیوهای زنده در زمان واقعی به چندین زبان می تواند ابزار فوق العاده مفیدی باشد. یک مترجم جهانی نه تنها میتواند بینندگان جهانی یک کانال YouTube را افزایش دهد، بلکه میتواند امکان پروژههای مشارکتی بیشتری را در سراسر کشورها فراهم کند.
ما مطمئناً منتظر خواهیم بود تا اطلاعات بیشتری در مورد این ویژگی و مکان هایی که می توان از آن در اکوسیستم گوگل استفاده کرد بشنویم.
شما می توانید گوگل Bard را در دسترس عموم قرار داد را در اینجا مطالعه کنید.