Apple в партнерстве с Калифорнийским университетом представила революционный проект в сфере искусственного интеллекта – MGIE. Этот инструмент может трансформировать способ редактирования фотографий, предоставляя пользователям способность управлять изображениями с помощью простых текстовых инструкций.
Основой MGIE являются расширенные мультимодальные языковые модели (MLLM), которые анализируют и интерпретируют запросы пользователей, превращая их в ответные действия на изображении. Это открывает безграничные возможности для модификации фото: от простых коррекций, как изменение яркости или контрастности до сложных операций, таких как применение художественных эффектов или трансформация отдельных элементов изображения.
Пользователи MGIE не только могут корректировать общий вид фотографии, но и тонко настраивать отдельные аспекты — форму, размер и текстуру объектов. Кроме стандартных опций редактирования, таких как обрезка или регулировка размера, MGIE предлагает инструменты для более креативных задач: изменение фона, добавление или удаление элементов со сцены, что делает этот инструмент незаменимым для фотохудожников, дизайнеров и других специалистов в области графического контента.
Благодаря публикации открытого кода и обученным моделям на платформе GitHub, MGIE становится доступным для широкого круга пользователей, заинтересованных в экспериментах с искусственным интеллектом в фотографии. Для желающих ознакомиться с инструментом без необходимости загрузки и настройки существует возможность опробовать MGIE онлайн через вебсайт Hugging Face Spaces.
Такое инновационное решение, как MGIE, указывает на новый уровень взаимодействия между человеком и искусственным интеллектом в области обработки изображений, предлагая удобные и интуитивно понятные инструменты для творчества и дизайна. Расширение доступности таких технологий, безусловно, повлияет на будущее цифрового искусства и фотографии, открывая новые горизонты для экспериментов и инноваций.