Компания Apple, совместно с учеными Корнеллского университета, представила мультимодальную языковую модель под названием Ferret. Этот проект, выпущенный в открытый доступ на GitHub в октябре, стал важным шагом в области искусственного интеллекта. Отличительной особенностью Ferret есть ее способность обрабатывать фрагменты изображений как часть запроса.
Ferret расширяет возможности традиционных речевых моделей, позволяя пользователям использовать изображения как часть своих запросов. Модель анализирует выбранный фрагмент изображения, идентифицирует объекты и отвечает текстовой информации. Например, оно может распознать животное на фотографии и предоставить подробную информацию о нем.
Новинка открывает новые перспективы использования AI, особенно в областях, где важно сочетание визуального контента с текстовым анализом. Эта модель может быть полезна в образовании, науке, медиа и других областях, где нужно быстро обрабатывать и интерпретировать большие массивы визуальных данных.
Выход Ferret в открытый доступ является частью стратегии Apple по укреплению своей позиции на рынке искусственного интеллекта. Этот шаг, возможно, был обусловлен необходимостью конкурировать с такими гигантами как Microsoft и Google в разработке инновационных AI-решений. Выпуск Ferret в открытом формате также демонстрирует изменение в политике компании, традиционно славившейся своей закрытостью.
Выпуск нейросети может стать катализатором для дальнейших инноваций в области AI. Доступность мощных инструментов для широкого круга исследователей и разработчиков будет способствовать развитию новых применений AI и повышению уровня интерактивности между человеком и компьютером.
С учетом роста важности искусственного интеллекта Apple, вероятно, продолжит развивать подобные проекты. Заинтересованность компании в широком использовании AI технологий может побуждать ее к созданию новых инновационных продуктов и услуг, что открывает интересные перспективы для потребителей и рынка технологий в целом.