TheInformation повідомляє, що OpenAI веде розробку мультимодальних функцій до GPT-4, під загальною назвою GPT-Vision, які будуть аналогом моделі Gemini від Google. Мультимодальність забезпечує можливість моделі працювати з різними видами інформації, тобто як у текстовому, так і у візуальному форматі