
Компания xAI открыла бета-доступ к своему новому продукту — Grok Imagine. Это нейросетевая платформа, которая по описанию пользователя может создавать короткие видео длиной шесть секунд, при этом добавляя звук. Одна из функций сервиса — так называемый «острый» режим — сразу вызвала волну обсуждений. Всё из-за того, что он позволяет создавать контент, который явно не предназначен для просмотра на работе.
Что такое Grok Imagine и зачем он нужен?
Если коротко — это часть всей экосистемы вокруг чат-бота Grok, который уже использует искусственный интеллект для генерации текстов. Теперь — и визуалов. Grok Imagine может из простой текстовой команды или даже фотографии «сложить» полноценное короткое видео, которое будет двигаться и говорить. Это похоже на оживление картинки — как в фильмах про Гарри Поттера. Но тут — уже реальность.
Режимов несколько: «обычный», «весёлый» и «острый». Последний как раз и позволяет генерировать материалы, которые могут быть отнесены к взрослому контенту — в англоязычной среде это обозначается как NSFW (not safe for work). Такая возможность резко выделяет продукт среди других генераторов видео, но одновременно вызывает массу вопросов.
Пока только по приглашению
Публичного доступа пока нет — система работает в формате бета-теста, попасть в неё можно только по приглашению. В будущем планируется расширение до платных подписчиков Grok Heavy, а потом — возможно — и до более широкой аудитории. Это часть общей стратегии xAI: запускать новые продукты дозированно, учитывая обратную связь.
Почему все так спорят?
«Острый» режим сразу стал поводом для бурных дискуссий. Кто-то считает, что это даёт невероятную свободу художникам, кто-то — что открывает ящик Пандоры. В компании стараются балансировать: например, был персонаж Rudy, который мог отвечать без цензуры, но его функциональность частично ограничили после волны критики.
Илон Маск называет Grok Imagine «новым Vine» — платформой для коротких вирусных видео, которая в своё время дала старт многим блогерам. Но времена изменились, и теперь всё, что связано с ИИ и этикой, рассматривается под лупой.
Как это работает?
Технически за всем стоит модель под названием Aurora. Она преобразует текст или фото в видеоконтент, при этом добавляя аудио. Можно, например, загрузить обычную фотографию — и получить движущийся ролик. Или надиктовать фразу голосом — и нейросеть создаст анимацию. Всё происходит в течение пары секунд.
Важно, что инструмент пока создаёт только короткие — шестисекундные — ролики. Возможно, это ограничение введено как мера предосторожности на начальном этапе.
«Искусственный интеллект открывает двери в творческие миры, но вопрос в том, кто будет следить за тем, что за ними», — замечает один из аналитиков, комментируя запуск нового режима.
На сегодняшний день xAI делает шаг в сторону «гуманизированного» контента. Это значит, что ИИ не просто рисует абстрактные картинки, а оживляет персонажей, двигает их, даёт им голос. Причём — в том числе, в довольно пикантных форматах. Вопрос только в том, насколько далеко зайдёт эта технология — и кто поставит ей границы.