Задача — не «нарисовать сцену», а поместить персонажа в пространство так, чтобы мир вокруг него рассказывал историю.
Персонаж раскрывается через контекст — не через описание.
🎯 Character Sheet готов. LoRA работает. Сегодня — вселенная.
Что входит · What we bring in
Из Дня 1–2
Character Sheet
LoRA-модель, набор 20–30 кадров персонажа в разных ракурсах и эмоциях.
Сегодня строим
Сцены + Видеоклипы
3 сцены в Imagen 3, 3 клипа Kling, b-roll Veo. Всё из одного персонажа.
На выходе
Финальный ролик 15–30 сек
Production Asset: смонтированная история с единым цветом и звуком.
Pipeline Дня 3
📋 Character Sheet
→
🔵 Imagen 3 Сцены
→
🎬 Kling AI I2V
→
🌊 Veo 2/3 B-roll
→
✂️ CapCut Финал
← кликни на блок для подсказки
📌 Ключевая идея: мы не генерируем случайные кадры — мы строим систему: один персонаж, три плана, единый свет, единый цвет. Зритель чувствует историю, не зная откуда.
Практика 1 · Inpainting и сцены: Vertex AI / Imagen 3 · 40 мин
🎯 Задача: создать 3 разных сцены с персонажем. Использовать inpainting для деталей среды. Reference image сохраняет черты лица при смене локации.
Workflow в Vertex AI / AI Studio
1
AI Studio → Imagen 3 → загрузи reference image
Google Cloud Console → Vertex AI → Imagen 3 или AI Studio. Лучший close-up из Character Sheet в поле subject_ref. Imagen 3 сохранит черты лица при смене сцены.
2
Reference image consistency
Imagen 3 принимает reference image и сохраняет черты лица при смене сцены. Загружай лучший кадр — не самый красивый, а самый чёткий по чертам лица (анфас или ¾).
3
Промпт-структура — адаптированная Nano-Banana для Imagen 3
6 обязательных полей: subject_ref / scene / action / camera / lighting / style. Используй конструктор ниже.
4
Inpainting деталей среды
Выдели фон/область → допиши детали (сломанные кресла, плакаты на стенах, текстуры) через inpainting. Добавляет texture без пересоздания кадра целиком.
5
Генерируй 3 плана: Close-up / Medium / Wide
Меняй только поле camera (85mm → 50mm → 28mm), остальное — константа. Так 3 кадра читаются как одна сцена.
Конструктор JSON-промпта · Imagen 3
Imagen 3 JSON Prompt Builder
scene (локация)
action (действие)
camera (план)
lighting (свет)
style (стиль)
negative (запреты)
Готовый JSON-промпт
3 сцены — выбери архетип (кликни)
🪑
Ожидание
Пустая платформа · Аэропорт · Коридор
scene:"empty metro platform at 3am, single flickering fluorescent light"action:"standing still, facing away, hands in pockets"camera:"wide shot, 28mm, low angle, full body"mood:напряжение, время остановилось
🌆
Конфликт
Оживлённая улица · Кадр в упор
scene:"crowded night market, blurred pedestrians, neon signs"action:"frozen, staring directly at camera, crowd flowing past"camera:"medium shot, 50mm, eye-level, subject sharp, crowd blurred"mood:один против всех, момент решения
⚠️ Частая ошибка: reference image слишком сильный → Imagen 3 копирует позу, а не лицо. Решение: подавай reference только на inpainting фона, маску на персонаже оставляй пустой. Текстура лица сохранится.
Камера как нарратив · Кинопланы
🎥 Золотое правило: план = смысл. Не меняй план бездумно. Каждый переход от 85mm к 28mm — это смена отношения зрителя к персонажу.
Plan
Lens
Что передаёт
Nano-Banana camera prompt
Крупный (лицо)
85–135mm
Эмоция, интимность, вопрос
close-up portrait, 85mm, eye-level, shallow DOF
Средний (пояс)
50mm
Действие, взаимодействие
medium shot, 50mm, eye-level, full figure
Общий (рост+среда)
24–28mm
Одиночество, масштаб
wide shot, 28mm, full body in scene
Нидерперспектива
15–24mm снизу
Сила, угроза, монументальность
low angle, 20mm, looking up
Верхний угол
50mm сверху
Уязвимость, наблюдение
high angle, overhead, 50mm
← кликни строку — подсказка по нарративному смыслу
Правило 3 планов — как строить сцену
Шаг 1
85mm Close-up
Открываем историю с лица. Зритель задаёт вопрос: кто это? что чувствует?
Шаг 2
50mm Medium
Видим тело + немного среды. Узнаём что происходит. Действие.
Шаг 3
28mm Wide
Персонаж в мире. Одиночество или принадлежность. Финальная мысль.
Пример одной сцены — Советское кино
Пример из курса · Заброшенный советский кинотеатр
subject_ref:"[reference из Character Sheet]",scene:"abandoned Soviet cinema lobby, peeling Soviet murals on wall",action:"standing with back to camera, looking at projection screen",camera:"wide shot, 28mm lens, low angle",lighting:"single projector beam from upper right, dust particles in light",style:"cinematic still, desaturated teal-orange grade, 35mm grain",negative:"modern elements, bright colors, multiple people"
💡 Inpainting деталей: после генерации базового кадра — выдели конкретные зоны фона (стена, пол, потолок) и допиши детали через inpainting: сломанные кресла, афиши, трещины. Текстура персонажа не трогается.
Практика 2 · Kling AI — Image-to-Video с Identity Lock
🎬 Задача: взять лучшие кадры из Imagen 3 и оживить в Kling AI. Identity Lock + Element Reference удерживают внешность персонажа во всех кадрах клипа. Без этого через 3 сек — drift гарантирован.
Алгоритм работы · 5 шагов
1
Image-to-Video → загрузи 1 reference image
Лучший кадр из Imagen 3 как стартовый фрейм. Kling оживляет его.
2
Включи Element Reference → Identity Lock
Удерживает лицо и силуэт от frame до frame. Без этого через 3 сек — персонаж начинает меняться.
3
Motion Prompt по формуле ниже
Минимальное движение + направление камеры + hold финального кадра. Чем меньше движения — тем стабильнее лицо.
4
Duration: 4–5 сек · Motion Level: Low–Medium
High = drift гарантирован. Low — слишком статично для основных кадров. Medium — золото.
5
Генерируй 3 варианта → выбирай лучший
Никогда не оставляй первый вариант. Из 3 всегда найдётся один с минимальным drift лица.
Motion Prompt Builder · Kling AI
🎬 Kling AI Motion Prompt
Поворот головы5°
Camera push-in3%
Hold финального кадра4 sec
Motion LevelMedium
Medium — рекомендуется
Motion Prompt
Veo 2/3 · B-roll Insert-кадры
🌊 Veo = среда, не персонаж. Никогда не используй Veo для кадров с человеком. Вставляй между Kling-клипами — убирает jump cut и скрывает drift.
✓ Используй Veo для
Dust particles in projector beam
Rain drops on window glass, slow mo 120fps
Empty corridor, wide establishing
Fabric texture, candle flame, smoke
Cityscape, architecture, nature
✗ Не используй Veo для
Лица или тела персонажа
Эмоций и диалога
Основных сюжетных кадров
Если нужна консистентность лица
Пример Veo B-roll промпта
Атмосферный insert · Soviet Cinema
Cinematic b-roll:dust particles floating in projector beam inside Soviet cinema, no people, slow motion 120fps, warm tungsten light cutting through darkness, volumetric hazeDuration: 2–3 sec · No faces · Atmosphere only
Дождь · Текстура
Macro b-roll:extreme close-up rain drops on cold window glass, city lights blurred behind, slow motion 240fps, blue hour, no peopleDuration: 2 sec · Macro texture · After Kling shot 1
Практика 3 · CapCut — финальный монтаж
✂️ Цель: собрать 15–30-секундную историю. Три акта, Teal-Orange grade, ambient, экспорт 4K. История должна быть понятна БЕЗ звука.
Структура 3 актов
Акт I · Вопрос
Close-up
Kling 85mm. Лицо, взгляд. Зритель задаёт вопрос — не получает ответ.
0–8 сек
Акт II · Действие
Medium shot
Kling 50mm + Veo insert. Конфликт или движение нарастает.
8–20 сек
Акт III · Открытый финал
Wide shot
Kling 28mm. Персонаж в мире. Ответа нет — есть пространство для мысли.
20–30 сек
Монтажный pipeline · 5 шагов
1
Импорт: kling/ + veo/ + audio/
Организуй папки сразу. Раздельные корзины для Kling-клипов, Veo b-roll и аудио.
2
Черновая раскладка 3 актов (без звука)
Только Kling-клипы. Проверяй: история понятна без звука? Если нет — перемонтируй до понятности.