ChatGPT عالی است. اما در حال حاضر، فقط به متن محدود شده است. متن در داخل. متن خارج. قرار بود GPT-4 با افزودن پردازش تصویر به آن امکان تولید متن بر اساس تصاویر را بسط دهد. با این حال، OpenAI هنوز این ویژگی را منتشر نکرده است. جایی که MiniGPT-4 وارد می شود. این پروژه منبع باز پیش نمایشی از نحوه پردازش تصویر در GPT-4 را به ما می دهد. و بسیار تمیز است.
MiniGPT-4 چیست؟
MiniGPT-4 یک پروژه متن باز است که در GitHub برای نشان دادن قابلیت های زبان بینایی در یک سیستم هوش مصنوعی پست شده است. برخی از نمونههایی از کارهایی که میتواند انجام دهد عبارتند از ایجاد توضیحات تصاویر، نوشتن داستان بر اساس تصاویر، یا حتی ایجاد وبسایت فقط از روی نقاشی.
علیرغم آنچه از نام آن پیداست، MiniGPT-4 به طور رسمی به OpenAI یا GPT-4 متصل نیست.دانشجویان مستقر در عربستان سعودی در دانشگاه علم و صنعت ملک عبدالله آن را ساخته اند. همچنین بر اساس یک مدل زبان بزرگ متفاوت (LLM) به نام Vicuna است که خود بر اساس منبع باز Large Language Model Meta AI (LLaMA) ساخته شده است. این کاملاً به اندازه ChatGPT قدرتمند نیست. اما همانطور که توسط خود GPT-4 درجه بندی شده است، Vicuna به 90٪ عملکرد می رسد.
نحوه استفاده
MiniGPT-4 فقط یک نسخه آزمایشی است و هنوز در اولین نسخه آن است. در حال حاضر، در وب سایت رسمی گروه به صورت رایگان قابل دسترسی است. برای استفاده از آن، کافی است یک تصویر را به داخل بکشید یا روی «Drop Image Here» کلیک کنید. پس از آپلود، درخواست خود را در کادر جستجو تایپ کنید.
چه نوع چیزهایی را باید امتحان کنید؟ خوب، درخواست از MiniGPT-4 برای توصیف یک تصویر به اندازه کافی ساده است. اما شاید برای پست اینستاگرام شرکت خود به مقداری کپی نیاز داشته باشید. یا شاید بخواهید مواد مورد نیاز برای یک غذای جالب و حتی دستور پخت آن را بپزید. MiniGPT-4 می تواند این وظایف را به طرز شگفت انگیزی به خوبی انجام دهد.
جنبه های کدگذاری در اطراف لبه ها کمی خشن تر است. تبدیل یک نقاشی ساده با دستمال به یک وب سایت کارآمد ترفندی بود که توسط OpenAI در اولین معرفی GPT-4 نشان داده شد. اما به نظر می رسد MiniGPT-4 هنوز نمی تواند به خوبی از پس آن برآید. ChatGPT کد دقیق تری را ارائه می دهد. در واقع، اجرای هر کدی که MiniGPT-4 از طریق ChatGPT یا GPT-4 باشد، نتایج بهتری برای شما به همراه خواهد داشت.
نکته ای که باید به آن توجه کنید این است که MiniGPT-4 از GPU سیستم محلی شما استفاده می کند. بنابراین ممکن است تجربه نسبتاً کندی داشته باشید. مگر اینکه یک GPU مجزا نسبتاً قدرتمند داشته باشید.
محدودیت های MiniGPT-4
سرعت MiniGPT-4 مطمئناً یک محدودیت دارد. اگر میخواهید بدون گرافیک مناسب به آن دسترسی پیدا کنید، برای اینکه احساس کنید پاسخگو هست، خیلی کند است. اگر به سرعت ChatGPT مبتنی بر ابر یا حتی Bing Image Creator عادت دارید، MiniGPT-4 به طرز دردناکی کند می شود.
فراتر از آن، MiniGPT-4 دارای همان محدودیتهایی است که ChatGPT یا Google Bard یا هر چت ربات هوش مصنوعی دیگری دارد. زیرا میتواند اطلاعاتی را توهم یا ساختن اطلاعات ایجاد شده در نظر بگیرد.
شما می توانید بررسی ChatGPT را در اینجا مطالعه کنید.