В последнее время появились слухи о том, что компания Apple разрабатывает свой чатбот на базе искусственного интеллекта под названием Apple GPT, направленный на имитацию функциональности ChatGPT от OpenAI. В этот период рынок заполонили продукты из ИИ.
В то время, как от Apple поступали лишь неоднозначные заявления, ее генеральный директор Тим Кук пообещал инвесторам, что будущий ИИ компании откроет новые перспективы до конца года. Казалось, что для реализации этих амбиций Apple может потребоваться поддержка Google или даже OpenAI.
Согласно информации от Bloomberg, Apple находится в процессе переговоров с Google о лицензировании искусственного интеллекта Gemini для использования в iPhone, аналогично подходу Samsung для их серии Galaxy S24. Сроки соглашения еще не определены, поскольку переговоры продолжаются. Сообщается, что Apple также ведет диалог с OpenAI. Заметим, что основные технологии OpenAI, такие как GPT-4 и Dall-E, уже используются в продуктах Microsoft, а также в различных приложениях и сервисах, включая ChatGPT Plus. Это развитие событий в амбициях Apple в сфере ИИ вызывает как заинтересованность, так и беспокойство.
Исследования ИИ от Apple: обзор последних разработок
В последние месяцы 2023 года Apple представила коллекцию библиотек моделей и фреймворков под условным названием MLX, разработанную для использования на собственных чипах компании. Цель этой цели – предоставить компьютерам Mac возможности, сравнимые с функционалом, который Qualcomm внедряет через платформу Snapdragon X Elite, в частности в области искусственного интеллекта.
В начале года исследовательская группа Apple опубликовала документ об инструменте ИИ под названием Keyframer, предназначенный для создания анимационного контента. Основой этого инструмента является модель GPT-4 от OpenAI, но с добавлением возможности обработки статических изображений с помощью векторной графики.
Кроме того, специалисты Apple обнародовали научную работу, где описан инструмент ИИ, упрощающий процесс редактирования изображений, используя простые словесные указания. Этот инструмент напоминает мультимедийный редактор с голосовым управлением, который анонсирован в новых чипах Snapdragon от Qualcomm.
Согласно отчету Bloomberg, Apple активно расширяет свою команду, специализирующуюся на исследовании возможностей генеративного ИИ. Главной целью является сделать эти инструменты доступными широкому кругу разработчиков до 2024 года.
По информации, первые функции ИИ от Apple должны быть представлены в iOS 18, премьера которой запланирована на июнь. Однако, как сообщает Bloomberg, новые функции будут интегрированы в системы устройств компании, а не будут зависеть от облачных вычислений, как это обычно делают генеративные модели ИИ, подобные ChatGPT, Gemini или Perplexity.
В сентябре The Information сообщило, что Apple работает над базовыми моделями, которые должны улучшить функционал Siri. Эта инициатива может быть сопоставима с тем, как Google использует модель Gemini для повышения возможностей Google Assistant.
Функциональность Gemini на iPhone: новые возможности
Gemini предоставляет пользователям iPhone широкий спектр функций, работающих как локально, так и при подключении к Интернету. Используя Gemini на устройстве, программа может обобщать разговоры в Recorder даже в отсутствии сетевого соединения.
Пользователи клавиатуры Gboard имеют доступ к функции Smart Reply в таких приложениях, как WhatsApp, благодаря Gemini Nano. Эта функция анализирует тексты разговоров и предлагает ответы на основе контекста. К тому же ИИ на устройстве поддерживает автономные переводы, которые уже доступны на телефонах Samsung Galaxy S24 с поддержкой Gemini.
Вот некоторые из основных возможностей, которые Gemini предлагает пользователям iPhone:
- Естественный диалог с Gemini. Подобно взаимодействию с Google Assistant или ChatGPT, пользователи могут общаться с Gemini на обычном языке для получения помощи в написании текстов, генерации идей и т.д.
- Расширение Workspace. При активации этой функции пользователи могут быстро обобщать информацию в письмах или файлах, используя различные форматы представления, такие как списки, диаграммы и таблицы.
- Генерация изображений с подсказками. Функция, подобная Dall-E от OpenAI, позволяет создавать изображения, используя текстовые команды.
- Инновации в использовании камеры. Благодаря Gemini пользователи могут навести камеру на сцену и запросить подробную информацию об объектах в кадре.
- Понимание экрана. Командуя "Hey Google", Gemini может выполнять задачи, связанные с контентом на экране, например, обобщать просматриваемые пользователем статьи.
- Планирование поездок с Google Maps и Google Flights. Gemini позволяет пользователям планировать поездки и создавать индивидуальные маршруты с использованием этих приложений.
Перспективы соглашения между Apple и Google в области искусственного интеллекта
Ранее Google сотрудничала с Samsung для интеграции модели искусственного интеллекта Gemini Nano в флагманские телефоны Samsung. Такое сотрудничество не ограничивалось только верхним сегментом рынка; MediaTek объявила, что ее чипсеты среднего класса Dimensity 8300 теперь оптимизировано для работы с Gemini наряду с флагманским Dimensity 9300.
Такое сотрудничество можно реализовать и для продуктов Apple. Если прямая лицензия не удастся, существует альтернатива через приложения. Стратегия, которую выберет Apple в случае реализации сделки, остается неопределенной.
Основной вопрос состоит в том, как такое соглашение может повлиять на взаимодействие пользователей с iPhone и, возможно, на Siri. Необходимо много улучшений для Siri, чтобы она могла конкурировать с Google Assistant.
Пока неизвестно, как Gemini и Google Assistant будут сосуществовать на одном устройстве. Установка Gemini на Android телефон заменяет Google Assistant, хотя и не полностью.
В настоящее время Google Assistant продолжает выполнять множество повседневных задач на телефонах пользователей, таких как установка будильников, отправка сообщений, управление "умным домом" и планирование в календаре. Также Google Assistant остается основным ИИ для навигации, голосового ввода и использования в Android Auto.
Google Assistant продолжает быть ключевым помощником в смартдисплеях и часах Wear OS. Учитывая прочную интеграцию программного обеспечения и аппаратной части в экосистеме Apple, особенно между iPhone и Apple Watch, возможное разделение функционала между Gemini, Google Assistant и Siri может запутать пользователей.
В качестве альтернативы Apple может наладить тесное сотрудничество с Google для создания эксклюзивной интеграции Gemini с функциями Apple, такими как Siri, Mail и другие. Однако ввиду нынешней политики хранения данных Gemini, большой интеграции на уровне системы ожидать не стоит.
Потенциальные риски использования Gemini в продуктах Apple
Недавно Apple пыталась догнать другие компании в сфере искусственного интеллекта, но соглашение с Gemini может помешать разработке собственного ИИ в рамках проекта "Аякс" Apple. Это может привести к тому, что потенциал Apple в сфере ИИ будет использован частично, поскольку основные задачи искусственного интеллекта в iPhone будут выполняться с помощью Gemini.
Gemini уже обнаружил некоторые ошибки, которые вызвали споры среди пользователей, в частности, неточности в воспроизведении цвета кожи, этнической принадлежности и исторической вероятности. Эти инциденты побудили Google приостановить некоторые функции Gemini, что подчеркивает риски, связанные с интеграцией несовершенной технологии в продукты Apple.
Кроме того, Gemini втянулась в полемику из-за своих неудачных комментариев относительно политических фигур, что вызвало недовольство и рассмотрение вопросов регулирования искусственного интеллекта. Это может оказаться проблемой для Apple, которая осторожно относится к государственному регулированию.
Лицензирование Gemini для большого количества устройств Apple во всем мире представляет существенный риск, особенно учитывая предупреждение Google о потенциальных ошибках, которые может совершить Gemini. Это требует дополнительных проверок и может усложнить взаимодействие пользователей с новыми функциями Apple.