Higgsfield продолжает развивать экосистему вокруг SOUL 2 и добавил ещё два инструмента для быстрых персонализированных генераций. Первый — Photodump: функция создаёт сразу набор изображений с вашим лицом. Пользователь выбирает пресет вроде Male Archive или Cool Girl Dump, подключает Soul ID или создаёт новый, после чего получает 15 фотографий за одну генерацию. По описанию результат выглядит сильным уже с первого раза, хотя местами встречаются артефакты; повторный прогон помогает исправить часть таких ошибок.
Вторая функция — Soul Moodboards, инструмент для создания собственного визуального стиля для будущих генераций. По сути это персональный стиль или лора, который можно использовать в проектах, где важны единая атмосфера и повторяемая эстетика. Для обучения нужно загрузить не меньше 20 качественных и разнообразных референсов. В описанном тесте обучение на 20 фото заняло 10–15 минут, после чего стиль уже можно было применять в генерации. Стиль держится стабильно, а вот персонаж может немного «плавать», хотя после нескольких попыток удаётся получить хороший результат. Упоминается и высокий лимит генераций, что снижает проблему перебора вариантов.
#ai #generativeai #Higgsfield #SOUL2 #SoulID #Photodump #Moodboard #aiphotography #imagegeneration #digitalidentity #stylereference #creativeai
В соцсетях завирусился трек «Бит лютый вообще…» от Toxi$, и под этот фрагмент пользователи массово делают короткие ролики — от мемов до абсурдных скетчей. Сам формат оказался удобным для быстрых AI-анимаций: достаточно взять готовую фотографию и превратить её в короткое движение под трендовый звук. В результате получается ролик, который визуально попадает в текущий мемный шаблон и не требует сложного монтажа.
Повторяется это довольно просто: в Syntx выбирается Kling, включается режим Motion Control, затем загружается референсное видео с нужным аудио и добавляется фотография, которую нужно анимировать. По словам автора, даже отдельный промпт здесь не обязателен — модель сама переносит движение и собирает короткий вирусный клип. Такой подход позволяет быстро адаптировать статичное изображение под трендовый формат и собрать контент буквально за несколько шагов.
#ai #generativeai #aivideo #Kling #SyntxAI #MotionControl #Toxi$ #viralvideo #memecontent #shortvideo #imageanimation
Google внедрила в свой маркетинговый сервис Pomelli функцию AI-фотосъёмки, которая помогает автоматизировать создание визуального контента. Инструмент анализирует сайт и материалы компании, формируя «ДНК бренда» — фирменные цвета, шрифты и стиль, на основе чего генерирует изображения в едином визуальном ключе.
Функция Photoshoot позволяет загрузить обычное фото товара и с помощью модели Nano Banana получить студийный или лайфстайл кадр без водяных знаков. Можно менять фон текстом, редактировать детали и использовать референс-стили. Далее Pomelli помогает собрать рекламную кампанию: пишет тексты, создаёт обложки и креативы с учётом бренд-профиля, при этом все элементы можно донастроить вручную.
Сервис Pomelli был представлен в октябре 2025 года и сейчас доступен в бесплатной бета-версии только в США, Канаде, Австралии и Новой Зеландии; в других регионах он пока недоступен. Это шаг Google к тому, чтобы встроить продакшн контента как функцию маркетинговой платформы, а не как отдельную услугу.
#ai #generativeai #GooglePomelli #AIphotography #marketingai #branddna #NanoBanana #contentcreation #ecommerce #digitalmarketing #aidesign
Higgsfield выпустила Soul 2.0 — обновлённый AI-инструмент для генерации персональных фото. Несмотря на обсуждения проблем на платформе, сервис продолжает развиваться и добавлять функции. Soul 2.0 создаёт реалистичные изображения с лицом конкретного человека: модель обучается на 40–50 фотографиях одного человека с разными ракурсами и хорошо видимым лицом.
Обучение одной LoRA-модели стоит 25 токенов. После создания на тарифе Creator доступно 5000 генераций, далее работа идёт через текстовые промпты. Можно выбрать формат и качество 1.5K или 2K, включить улучшение промпта и добавить референс-фото для большего сходства с текущей внешностью. Доступны пресеты настроения, стиля и типа камеры; консистентность персонажа сохраняется за счёт LoRA.
Также появился инструмент Color Transfer: система извлекает палитру из загруженного изображения в HEX-кодах и формирует цветовую карточку. Эти карточки можно переключать и использовать при генерации, фиксируя визуальный стиль через заданную цветовую гамму.
#ai #generativeai #aiphoto #Higgsfield #Soul2 #loramodel #photogeneration #colortransfer #creatortools #contentcreation
Higgsfield выпустила Soul 2.0 — обновлённый AI-инструмент для генерации персональных фото. Несмотря на обсуждения проблем на платформе, сервис продолжает развиваться и добавлять функции. Soul 2.0 создаёт реалистичные изображения с лицом конкретного человека: модель обучается на 40–50 фотографиях одного человека с разными ракурсами и хорошо видимым лицом.
Обучение одной LoRA-модели стоит 25 токенов. После создания на тарифе Creator доступно 5000 генераций, далее работа идёт через текстовые промпты. Можно выбрать формат и качество 1.5K или 2K, включить улучшение промпта и добавить референс-фото для большего сходства с текущей внешностью. Доступны пресеты настроения, стиля и типа камеры; консистентность персонажа сохраняется за счёт LoRA.
Также появился инструмент Color Transfer: система извлекает палитру из загруженного изображения в HEX-кодах и формирует цветовую карточку. Эти карточки можно переключать и использовать при генерации, фиксируя визуальный стиль через заданную цветовую гамму.
#ai #generativeai #aiphoto #Higgsfield #Soul2 #loramodel #photogeneration #colortransfer #creatortools #contentcreation
Runway и LTX Studio, похоже, переходят к стратегии хаба моделей. Runway начал интегрировать сторонние решения — Kling, Wan, GPT-4.2 Pro и другие, а LTX Studio подключает Kling 3.0 Pro внутри своей платформы. Это не просто расширение функций, а смена подхода: вместо конкуренции «модель против модели» сервисы дают доступ к разным движкам из одного интерфейса.
Интегрируемые модели считаются одними из самых сильных на рынке, особенно китайские видеогенераторы, которые часто отмечают за качество и динамику сцен. В такой конфигурации пользователю не нужно оформлять отдельные подписки — запуск разных моделей происходит внутри одного продакшн-контура. Вероятно, ставка делается на удержание текущей аудитории и контроль над рабочим процессом, а не только на развитие собственной нейросети.
Если стратегия сработает, конкуренция сместится с уровня «чья модель мощнее» к уровню экосистем и ежедневного workflow. Побеждать будет не отдельная технология, а платформа, через которую выстроен весь производственный цикл.
#ai #aivideo #generativeai #Runway #LTXStudio #Kling #Wan #GPT4 #videogeneration #workflow #creativeai #mltools
Google добавила в Gemini раздел генерации музыки на базе модели Lyria 3. Инструмент работает в бета-режиме и позволяет создавать 30-секундные треки по текстовому описанию или на основе загруженного изображения как референса. Модель формирует структуру композиции, текст и вокал. Поддерживаются английский, немецкий, испанский, французский, хинди, японский, корейский и португальский языки; русского языка пока нет.
Каждый трек автоматически получает обложку, сгенерированную Nano Banana, и маркируется цифровым водяным знаком SynthID. Также добавлен детектор AI-музыки: можно загрузить аудиофайл и проверить, был ли он создан в Gemini. Lyria 3 стала доступна пользователям YouTube в разделе Dream Track — ранее тестирование проходило только в США.
Генерация музыки становится частью единого производственного контура: текст, изображение, видео и звук создаются внутри одного интерфейса, что упрощает сборку контента под конкретную сцену и настроение.
#ai #generativeai #Gemini #Lyria3 #aimusic #SynthID #NanoBanana #YouTube #DreamTrack #audiogeneration #musicai
Beeble представила SwitchX — video-to-video инструмент, который меняет окружение в ролике, сохраняя внешность и мимику героя. Система автоматически отделяет персонажа от фона, показывает маску и позволяет при необходимости доработать её вручную. После этого можно задать новую среду: освещение, атмосферу, локацию. При простых задачах, например смене света в помещении, результат выглядит цельно — без эффекта наложенного фильтра, с корректным взаимодействием света с кожей и одеждой.
При более сложных изменениях, таких как замена одежды или динамичная сцена, стабильность может снижаться, и итог не всегда совпадает с ожиданиями даже при аккуратном референсе. По стоимости три попытки по 7 секунд обходятся примерно в 14 долларов; 28 секунд фактически исчерпывают подписку за 19 долларов. Это дороже, чем Kling Motion Control при сопоставимой длине, но подход отличается: SwitchX работает как инструмент постпродакшн-композитинга, а не полной перегенерации сцены.
Также доступна локальная версия по подписке с расширенными VFX-функциями и более сложным пайплайном. Запрос на сохранение лица и микроэмоций актёра при смене окружения очевиден, и дальнейшая конкуренция будет зависеть от качества, скорости и модели ценообразования.
#ai #aivideo #generativeai #SwitchX #Beeble #videotovideo #vfx #motioncontrol #Kling #contentproduction #postproduction
Seedream 5.0 Lite официально вышла и уже интегрирована в агрегаторы вроде FLORA, Syntx, Higgsfield и Freepik. Разработчики заявляют стабильную работу с множественными референсами — до 10–14 изображений в одном окне, сохранение лиц, корректные логотипы и аккуратный текст. Модель активно сравнивают с Nano Banana, которая также используется в тех же экосистемах.
В тесте через Syntx изображения генерировались по одинаковым промптам, подготовленным в ChatGPT, с фокусом на рекламную эстетику под iPhone 15 Pro. Сравнивались Seedream 4.5, новая 5.0 Lite и Nano Banana. Seedream 4.5 выдала более глянцевую и драматизированную картинку, тогда как 5.0 Lite показалась более синтетичной по визуалу. Nano Banana в тех же условиях дала более сдержанный и естественный результат, без выраженной гиперэстетики.
Итог зависит от задачи и точности промпта, однако в текущем сравнении более «живой» коммерческий визуал получился у Nano Banana. Разница особенно заметна в работе с тоном кожи, светом и общей пластикой сцены.
#ai #generativeai #Seedream5 #NanoBanana #aiphoto #imagegeneration #Syntx #Higgsfield #Freepik #FLORA #visualai #contentcreation
HeyGen представила обновление для кастомизации аватаров: теперь можно менять одежду, фон и добавлять объекты прямо в кадр. Пользователь выбирает своего аватара, открывает шаблоны сцен — офисные, lifestyle и другие — или вводит ключевые слова для генерации новых вариантов окружения и внешнего вида. Образ редактируется через готовые пресеты или текстовое описание, после чего система предлагает несколько вариантов на выбор.
Можно детально задать элементы одежды и аксессуары, изменить фон и добавить предмет через кнопку «элемент» — объект интегрируется в сцену с учётом света и перспективы. Новый образ поддерживается в Studio и совместим с Avatar IV и Avatar III (безлимитная модель). Также доступно управление подачей речи — от экспертного формата до спокойной беседы — и выбор движка генерации, включая Kling и Runway. На каждый запрос предлагается три варианта.
Из ограничений: 30 fps пока не поддерживается, а при серии генераций возможны небольшие изменения в чертах лица. Тем не менее инструмент расширяет контроль над образом и сценой без отдельной съёмки и продакшна.
#ai #generativeai #HeyGen #AIavatar #avatargeneration #Kling #Runway #videocreation #contentproduction #digitalavatar #aivideo
CapCut на короткое время открыл доступ к Seedance 2 в Dreamina, после чего функция так же быстро исчезла без официальных комментариев. Пользователи сообщали, что успели увидеть активную вкладку и запустить генерации, однако процесс останавливался примерно на 19% с ошибкой. По их словам, кредиты затем возвращались. Ни CapCut, ни Seedance 2, ни ByteDance публичных разъяснений не дали.
Параллельно в X распространялись сообщения о «сливе весов» Seedance 2 на торрентах, однако пользователи утверждают, что это фейк: рабочей версии для локального запуска в открытом доступе нет. Те, кто получил доступ через сервисы Jimeng или Mitte, пишут об очередях до четырёх часов на одну генерацию. Интерес к модели объясняют высоким качеством результата и потенциальными юридическими рисками, связанными с авторскими правами и узнаваемыми персонажами.
Ситуация показывает высокий спрос на технологию при отсутствии прозрачных условий релиза и масштабирования доступа.
#ai #aivideo #generativeai #Seedance2 #CapCut #Dreamina #ByteDance #videogeneration #aimodels #digitalcontent #creativeai
На рынке появился QuiverAI — стартап, который предлагает генерировать не пиксельные изображения, а сразу векторный код. Компания привлекла $8,3 млн в сид-раунде под лидерством a16z, а её продукт Arrow-1.0 уже доступен в бете. Модель создаёт SVG по текстовому описанию или на основе изображения, формируя структуру из слоёв, групп и контуров.
Ключевая идея в том, что результат — это редактируемый визуальный код. Цвета, толщины линий и отдельные элементы можно менять напрямую в SVG, без необходимости пересобирать картинку с нуля. В тесте генерация четырёх вариантов заняла около семи минут: итог не идеален, но файлы пригодны для доработки вручную. Такой подход сближает дизайн-процесс с логикой работы LLM, где правка происходит на уровне структуры, а не поверх готового изображения.
#ai #generativeai #QuiverAI #Arrow1 #svg #vectordesign #a16z #designai #codegeneration #creativetools
Google представила Nano Banana 2 — модель Gemini 3.1 Flash Image Preview, которая быстро вышла в лидеры Artificial Analysis Image Arena, обогнав GPT-Image-1.5 и собственную Pro-версию. Компания сделала ставку не на максимальную мощность, а на скорость при качестве, близком к Pro. В интерфейсе поддерживается генерация до 2K, через API заявлено до 4K. При этом модель работает заметно быстрее, чем Nano Banana Pro.
Стоимость составляет около $0,067 за изображение — почти вдвое дешевле Pro. При больших объёмах генерации разница становится ощутимой. В модели улучшены анатомия и работа со сложными сценами, стало меньше фоновых артефактов. Текст внутри изображения воспроизводится стабильнее, включая длинные фразы, что делает её пригодной для обложек и инфографики.
В практических тестах через Higgsfield новая версия показала преимущество в скорости, при этом различия в качестве заметны только при детальном сравнении. На фоне конкурентов Google усиливает позиции в сегменте генерации изображений за счёт сочетания цены, скорости и стабильности.
#ai #generativeai #Gemini #NanoBanana2 #FlashImage #GPTImage #ArtificialAnalysis #aiphoto #imagegeneration #Higgsfield #Seedream5 #creativeai
Freepik добавили инструмент List Nodes в разделе Spaces: он позволяет из одного исходного дизайна быстро получить десятки и сотни версий под разные рынки и форматы. По задумке это упрощает массовую локализацию кампаний и выпуск креативов без ручного пересобирания каждого варианта.
На практике берётся один макет, после чего система автоматически переводит текст, подстраивает визуал под аудиторию, меняет цветовую палитру под локальные предпочтения и сразу делает ресайзы под нужные размещения — от Stories и баннеров до обложек и performance-креативов. Также заявлена вариативная адаптация внешности модели под конкретные рынки (например, европейский или азиатский): лицо и причёска досоздаются под задачу, а остальной шаблон остаётся неизменным. За счёт List Nodes процесс локализации описывается как генерация «пакетов» вариаций из одного визуала, когда вместо таблиц с правками настраивается повторяемая схема производства.
#ai #generativeai #design #creativeautomation #localization #marketingdesign #adcreative #creatives #Freepik #FreepikSpaces #ListNodes #multiformat #branding #performancecreative #contentproduction
The Dor Brothers опубликовали короткометражку «Apex», которую в публикациях и по их словам позиционируют как «блокбастерный» ролик, собранный полностью с помощью ИИ примерно за сутки. В обсуждениях часть зрителей сомневается в сроках, но общий тезис понятен: большой по ощущению продакшн сделан без съёмочной группы и длинного производственного цикла.
Ролик связывают с Seedance 2.0 — видеомоделью ByteDance, официально представленной в феврале 2026 года. В кадрах отмечают кинематографичный свет, динамику камеры и более стабильных персонажей, хотя заметны типичные артефакты: местами странная физика разрушений и скачки фона при склейках между внешним планом и салоном автомобиля. Даже с этими огрехами кейс показывает, что генеративный пайплайн уже может быстро собирать «дорогую» картинку малыми командами — вопрос упирается в режиссуру, контроль стиля и консистентность.
#ai #aivideo #generativeai #Seedance2_0 #ByteDance #TheDorBrothers #Apex #filmmaking #cinematic #videogeneration #creativeworkflow #postproduction #vfx #consistency #aiartifacts
Krea объявила о покупке iPad-приложения для рисования Wand и выпустила обновлённую версию с ключевой функцией Realtime Edit — режимом, где изображение пересчитывается почти мгновенно по мере того, как вы рисуете, меняете промпт или стиль.
Идея в том, чтобы убрать «перепрыжки» между наброском и финальной генерацией: вместо связки «скетч → отдельная генерация → правки → экспорт/импорт» появляется единый интерактивный холст, где результат обновляется в реальном времени и проще держать контроль над деталями на лету. Это не “новая модель” сама по себе, но меняет ощущение скорости итераций и делает iPad + Apple Pencil более естественной точкой входа в генеративный рабочий процесс.
#ai #generativeai #imagegeneration #realtime #digitalart #ipad #applepencil #Krea #Wand #RealtimeEdit #creativeworkflow #sketch2image #aidesign
ElevenLabs провели саммит в Лондоне и показали Flow — новый инструмент с нодовым интерфейсом, который, по их словам, станет доступен всем в ближайшее время. Это единый холст, где в одном процессе можно комбинировать текст, звук, голос и изображения, собирая продакшн-цепочки и подключая несколько моделей одновременно.
Отдельно представили “Expressive Mode” для голосовых агентов: в демо агент меняет интонацию и стиль речи, чтобы звучать более «по-человечески» и снижать напряжение в конфликтных звонках. В примере с отменённым рейсом агент не читает заготовленный скрипт, а аккуратно ведёт диалог, предлагает варианты и оформляет новый билет, уточняя, что доплаты не потребуется. Демонстрационный ролик в X, как утверждается, набрал более 11 млн просмотров, что заметно выше обычных показателей аккаунта.
#ai #generativeai #voiceai #voiceagents #conversationalai #customerexperience #contactcenter #workflowautomation #ElevenLabs #Flow #ExpressiveMode #X #speechsynthesis #multimodal #nocode
Higgsfield выпустили Cinema Studio 2.0, и в тесте упор был на новые функции: 3D-режим управления сценой, контроль скорости и эмоций. При сборке видео через несколько сцен удалось выбрать персонажа, стартовый кадр и промпт, задать движение камеры и скорость (пресеты, авто и ручная кривая по 5 точкам), а также применить общий пресет на весь ролик — в тесте выбран “action”.
По результатам камера отрабатывает уверенно: пролёты в целом получаются, и ограничения пайплайна понятны. При этом боёвка в первой сцене вышла слабой, а сцена с мотоциклом «сломалась». В 3D-режиме возникли проблемы с доступностью: при генерации сеткой 3×3 режим оказался недоступен, а при одиночной генерации 3D собирался отдельно и давал низкое качество — смена угла была быстрой, но персонажи почти не менялись, а детали окружения выглядели как попытка дорисовки. Эмоции тоже не проявились: в трёх сценах с разными состояниями (радость, шок, грусть) при выборе силы эмоции визуально почти не менялись, промпт слушался слабо, а повторные попытки и Single Shot с увеличением времени генерации ситуацию не улучшили.
Итог теста: из заявленных новинок стабильно работает только управление камерой, а скорость, эмоции и 3D-режим пока выглядят сырыми и дают непредсказуемый результат.
#ai #aivideo #generativeai #Higgsfield #CinemaStudio #CinemaStudio2_0 #videogeneration #cameracontrol #3dmode #emotioncontrol #speedcontrol #singleshot #prompting #aiartifacts #workflow
LTX Studio добавили Brand Kit — enterprise-функцию для централизованного управления бренд-элементами прямо внутри пайплайна генерации. В один набор собираются логотипы, типографика, персонажи, продукты и стили, чтобы команда получала более консистентный результат от кадра к кадру и не расходилась по «версии не те / цвет не тот» на этапе правок.
Кит создаёт Creative Admin: загружает и управляет элементами, публикует набор для команды, а участники проекта подключают его в работе и вызывают элементы в промптах через символ @. В LTX Studio подчёркивают, что изменения синхронизируются сразу для всех и могут использоваться в нескольких проектах, а также допускается работа с несколькими наборами в одном проекте — удобно для агентств и команд с несколькими брендами.
Вопрос про «случайный креатив» тут скорее упирается в настройки: Brand Kit фиксирует разрешённые ассеты и правила, но не запрещает экспериментировать в рамках этих ограничений — просто делает отклонения заметнее и управляемее на уровне системы.
#ai #generativeai #aivideo #LTXStudio #BrandKit #enterprise #brandgovernance #brandconsistency #designsystems #typography #logos #visualidentity #creativeworkflow #collaboration #prompting
В соцсетях вирусится эффект, где размываются персонаж и окружение, и этот ролик показывает, как быстро повторить приём через Syntx AI: сначала берётся первый кадр из референса и адаптируется под формат 16:9. Параллельно тот же кадр прогоняется через Seedream 4.5 и Nano Banana Pro, обе модели с задачей справились.
Дальше в сцену аккуратно подставляется персонаж: загружается качественное фото, задаётся промпт на перенос внешности, и лучший результат в тесте даёт Nano Banana Pro, поэтому его используют как базовый стартовый кадр. Затем это изображение загружается в видеогенерацию, добавляется текстовое описание происходящего и нужных эффектов, после нескольких попыток на разных моделях итоговый клип получается собрать в Kling 3.0 Pro. Логику можно повторять для любых подобных роликов внутри Syntx AI.
#ai #aivideo #generativeai #SyntxAI #Kling3_0Pro #NanoBananaPro #Seedream4_5 #image2video #videogeneration #startframe #reference #motionblur #blurfx #prompting #contentcreation
