Як писати промпти для Happy Horse: формула із шести частин для відео AI-інфлюенсерів

Happy Horse винагороджує структуру, а не багатослівʼя. У моделі є те, що її гайд із промптів називає «бюджетом промпта» — після приблизно 60 слів обличчя стають родовими, рух розмивається, а lip-sync пливе. Лікування — формула із шести частин, той самий скелет, навколо якого команда ATH в Alibaba побудувала модель.

Цей гайд адаптує формулу саме під UGC-відео AI-інфлюенсерів: Reels із персоною, що говорить, спонсорська реклама з lip-sync, багатомовні варіанти, багатокадрові міні-історії та атмосферні настроєві кліпи. Кожен шаблон — copy-paste готовий і зібраний так, щоб вписатися в пайплайн OmniGems AI поряд з опорними портретами GPT-Image-2.

Про те, що таке Happy Horse і чому ми ставимо її як відеомодель за замовчуванням, — у пілерному гайді з Happy Horse.

Формула із шести частин

У кожному промпті Happy Horse є шість блоків. Порядок важливий. Поблочно:

Subject — хто або що в кадрі, з повтореними інваріантами персони
Action — що вони роблять, як одна плавна фраза руху
Environment — сетинг, освітлення, час доби
Style/Composition — співвідношення сторін, кадрування, візуальний тон
Camera Motion — явний рух камери або статичне кадрування
Audio — сценарій закадрового голосу, мова, фоновий шар

Пропустите блок — модель заповнить його родовим дефолтом. Завжди давайте всі шість, навіть якщо відповідь — «static, no camera motion» або «no voiceover, ambient only».

Чому порядок блоків важливий

Модель парсить промпти зліва направо й важить ранні блоки сильніше. Subject і Action несуть найбільший бюджет якості. Якщо закопати інваріанти персони під декоративним описом середовища, персона попливе. Лідуйте з «хто» і «що»; нехай середовище, стиль і камера лягають слідом.

Бюджет промпта

Цільте у 40–60 слів сумарно на всі шість блоків. Двадцять — замало (модель непередбачувано заповнить пробіли). Вісімдесят — задовго (якість розмивається між блоками). Сорок-шістдесят — солодке вікно.

Дисципліна, яка веде туди: один конкретний іменник і один конкретний прикметник на блок. Не «a beautiful young woman with stunning features in a lovely outfit» — це шість прикметників роблять роботу одного іменника. Спробуйте «26-year-old, olive skin, cream turtleneck». Три іменники, три модифікатори, готово.

Шаблон 1: Reel із персоною, що говорить

Хліб і олія. Персона говорить у камеру, 9:16, 8–12 секунд, один кадр, розмовний тон.

Subject: Same persona as reference image, same face, same hair. Action: Speaking directly to camera, slight head movement, natural blinks. Environment: Sunlit Brooklyn café window seat, soft golden hour light. Style: 9:16 vertical, casual iPhone-style, slight handheld drift. Camera: Locked-off medium close-up, eye level. Audio: Female voiceover, English, conversational tone — "Honestly? This one product changed my whole morning routine."

49 слів. У межах бюджету. У кожному блоці один конкретний іменник і один конкретний модифікатор. Передайте опорний портрет із GPT-Image-2 як референсне зображення — і модель утримує обличчя.

Що варіювати

Сценарій Audio — міняйте репліку, решту лишайте
Environment — міняйте «Brooklyn café» на «Tokyo subway platform» чи «Seoul rooftop at night»
Час доби — міняйте «golden hour» на «blue hour» або «harsh midday»
Гардероб — повторно вкажіть гардероб у Subject, якщо міняєте його; моделі потрібен сигнал

Шаблон 2: Спонсорський UGC із lip-sync

Формат, за який бренди реально платять. Персона в кадрі, тримає продукт, проговорює бренд-репліку.

Subject: Same persona as reference, same face, holding [product reference image] in right hand. Action: Showing product to camera, smiling, speaking the brand line. Environment: Bright kitchen counter, morning natural light through window. Style: 9:16 vertical, polished UGC, slight handheld. Camera: Medium close-up, locked, eye level. Audio: Female voiceover, English, warm and confident — "Three weeks in and I'm not going back."

53 слова. Передайте два референсних зображення (опорний портрет + статика продукту). Модель чисто опрацьовує мульти-зображеннєвий вхід.

Поради щодо lip-sync

Цитуйте сценарій дослівно у блоці Audio — переказ сценарію в промпті дає поплилий lip-sync
Явно вказуйте мову, навіть якщо це англійська — модель використовує її, щоб обрати фонемні патерни губ
Для бренд-нейми з нестандартною вимовою прописуйте їх фонетично у дужках: "Try our new Nuance (NEW-AHNS) cream"

Шаблон 3: Багатомовний локалізований варіант

Та сама персона, та сама сцена, інша мова. Тут Happy Horse дає мультиплікативний ефект — генеруйте чотири мовних варіанти однієї реклами з одного промпт-скелета.

Subject: Same persona as reference, same face, same wardrobe. Action: Speaking directly to camera, holding product, light smile. Environment: Same kitchen counter as English variant, morning light. Style: 9:16 vertical, polished UGC. Camera: Medium close-up, locked. Audio: Female voiceover, Japanese, warm and confident — "三週間使って、もう戻れない。"

Між мовними варіантами змінюються лише сценарій усередині Audio і мітка мови. Subject, Action, Environment, Style, Camera лишаються ідентичними. Саме тому одна генерація Happy Horse на мову замінює цілу пересʼомку.

Підтримувані мови із сильним lip-sync

Англійська, мандаринська китайська, кантонська китайська, японська, корейська, німецька, французька. Для інших мов модель усе одно генерує звук, але якість lip-sync падає — дивіться розбір Happy Horse vs Sora 2 vs Veo 3.

Шаблон 4: Багатокадрова міні-історія

15-секундний ритм із зачином → дією → розвʼязкою. Стискайте послідовність у єдину плавну фразу руху в блоці Action — багатокрокова проза ламає склейки.

Subject: Same persona as reference, casual loungewear. Action: Opens fridge, pours iced matcha into glass, walks to window, looks at camera with raised eyebrow. Environment: Sunlit Brooklyn loft, late morning. Style: 9:16 vertical, three-shot cut, polished UGC. Camera: Shot 1 wide on fridge, shot 2 medium on pour, shot 3 close on look-to-camera. Audio: Ambient morning kitchen sounds, no voiceover, soft lo-fi music bed.

68 слів — трохи понад бюджет, але багатокадровий формат за природою потребує більше. Хитрість: перелічуйте кадри всередині Camera, а не Action. Action описує безперервний рух персони; Camera описує, як камера його спостерігає.

Чому це працює

Happy Horse тренована на багатокадрових послідовностях, але парсить рух персони як одну траєкторію. Якщо розбити траєкторію на кілька речень в Action, модель сприйме кожне речення як незалежний запит на генерацію — і тяглість зламається. Одне речення Action, один рух персони, один безперервний ритм — навіть коли камера склеюється.

Шаблон 5: Атмосферний настроєвий кліп

Повільніше, кінематографічно, без мовлення. Використовується для постів, що задають тон бренду, і анонсів запуску інфлюенсера.

Subject: Same persona as reference, charcoal turtleneck, contemplative. Action: Walking slowly through coffee shop, pausing at window, gazing out. Environment: Tokyo coffee shop, blue hour, neon reflections in puddles outside. Style: 9:16 vertical, cinematic, color-graded teal-and-amber. Camera: Steadicam glide following persona, slow dolly-in to medium close-up at window. Audio: Ambient café sound, distant rain, lo-fi instrumental — no voiceover.

64 слова. Цей формат спирається на сильні сторони Happy Horse — атмосферику, динаміку тканин, геометричну цілісність у відображеннях, кольорокорекцію кінематографічного рівня.

Коли застосовувати

Пости запуску інфлюенсера (введення персони у стрічку)
Відкриваючі кліпи кампаній (задати настрій до того, як приземлиться рекламний кліп із мовленням)
Спонсорські брендові фільми, де персона є обʼєктом операторської роботи, а не спікером

Поширені помилки в промптах

Роздуті блоки Subject — «a beautiful young woman with cascading auburn hair, piercing blue eyes, a warm smile, wearing a stunning cream-colored turtleneck» зʼїдає половину бюджету. Стискайте: «26-year-old, auburn hair, cream turtleneck.»
Багатокрокова Action-проза — «She opens the door, walks to the table, sits down, picks up a book, then opens it» дає обірвані склейки. Стискайте: «Opens door, sits at table reading.»
Декоративна операторська лексика — «stunning, breathtaking, professional film look» — це шум. Модель хоче конкретного операторського словника: «locked-off medium close-up, eye level, slight handheld drift.»
Пропуск Audio — якщо не вказати, отримаєте випадковий фон. Завжди описуйте принаймні звуковий шар, навіть на кліпах без мовлення: «ambient café sound, no voiceover.»
Розпливчасті мовні мітки — «speaking the brand line» без блоку Audio дає TTS-якісний lip-sync. Завжди цитуйте сценарій дослівно і явно мітьте мову.
Повторний опис опорного портрета у тексті — передавайте опорний кадр як референсне зображення; у Subject пишіть просто «Same persona as reference, same face, same hair.» Зображення несе основне навантаження.

Робочий процес ітерації промптів

Дисципліна «одна зміна за прохід», яка працює в генерації зображень, працює і у відео:

Згенеруйте базовий кліп із повним промптом на шість блоків
Зафіксуйте пʼять блоків; варіюйте один
Порівняйте вихід із базою; залиште те, що працює
Перейдіть до наступного блоку; варіюйте його
Зупиніть ітерації, коли у вас є кліп, який можна випускати

Саме так серійний контент лишається цілісним на 30+ щоденних Reels. Той самий опорний портрет, той самий промпт-скелет, одна змінна за раз. Спроба варіювати три блоки одночасно дає непередбачуваний вихід і папку непридатних дублів.

Як OmniGems AI використовує цю формулу

Усередині Студії OmniGems AI бриф-опис персони інфлюенсера автоматично генерує блок Subject. Контент-розклад творця визначає блоки Action і Audio. Дефолти Style і Camera задані попередньо за платформою (9:16 для Reels/TikTok/Shorts, 16:9 для довгого формату YouTube). Творець пише лише варіацію Action і Audio — решту шаблоновано.

Саме це перетворює Happy Horse із потужної відеомоделі на компонент контент-пайплайна. Дисципліна на рівні промпта масштабує дисципліну на рівні персони.

Наступні кроки

Чому ми вибрали Happy Horse, а не Sora 2 чи Veo 3 — у Happy Horse vs Sora 2 vs Veo 3
Робочий процес опорного портрета, який живить image-to-video, — у GPT-Image-2 для AI-інфлюенсерів
Співвідношення сторін і формати платформ — у Найкращі співвідношення сторін для соціальних платформ
Структура промптів для зображень — у Як писати промпти для AI-інфлюенсерського контенту

Починайте генерувати

Спробуйте формулу з шести частин у Студії OmniGems AI. Опорний портрет уже на платформі, відеопайплайн інтегрований, маршрутизація моделей покліпно доступна, агент публікацій і запуск токена в тому самому потоці.

Про те, що таке Happy Horse і чому ми ставимо її як відеомодель за замовчуванням, — у пілерному гайді з Happy Horse.

Формула із шести частин

У кожному промпті Happy Horse є шість блоків. Порядок важливий. Поблочно:

Subject — хто або що в кадрі, з повтореними інваріантами персони
Action — що вони роблять, як одна плавна фраза руху
Environment — сетинг, освітлення, час доби
Style/Composition — співвідношення сторін, кадрування, візуальний тон
Camera Motion — явний рух камери або статичне кадрування
Audio — сценарій закадрового голосу, мова, фоновий шар

Чому порядок блоків важливий

Бюджет промпта

Шаблон 1: Reel із персоною, що говорить

Хліб і олія. Персона говорить у камеру, 9:16, 8–12 секунд, один кадр, розмовний тон.

Subject: Same persona as reference image, same face, same hair. Action: Speaking directly to camera, slight head movement, natural blinks. Environment: Sunlit Brooklyn café window seat, soft golden hour light. Style: 9:16 vertical, casual iPhone-style, slight handheld drift. Camera: Locked-off medium close-up, eye level. Audio: Female voiceover, English, conversational tone — "Honestly? This one product changed my whole morning routine."

Що варіювати

Сценарій Audio — міняйте репліку, решту лишайте
Environment — міняйте «Brooklyn café» на «Tokyo subway platform» чи «Seoul rooftop at night»
Час доби — міняйте «golden hour» на «blue hour» або «harsh midday»
Гардероб — повторно вкажіть гардероб у Subject, якщо міняєте його; моделі потрібен сигнал

Шаблон 2: Спонсорський UGC із lip-sync

Формат, за який бренди реально платять. Персона в кадрі, тримає продукт, проговорює бренд-репліку.

Subject: Same persona as reference, same face, holding [product reference image] in right hand. Action: Showing product to camera, smiling, speaking the brand line. Environment: Bright kitchen counter, morning natural light through window. Style: 9:16 vertical, polished UGC, slight handheld. Camera: Medium close-up, locked, eye level. Audio: Female voiceover, English, warm and confident — "Three weeks in and I'm not going back."

Поради щодо lip-sync

Цитуйте сценарій дослівно у блоці Audio — переказ сценарію в промпті дає поплилий lip-sync
Явно вказуйте мову, навіть якщо це англійська — модель використовує її, щоб обрати фонемні патерни губ
Для бренд-нейми з нестандартною вимовою прописуйте їх фонетично у дужках: "Try our new Nuance (NEW-AHNS) cream"

Шаблон 3: Багатомовний локалізований варіант

Subject: Same persona as reference, same face, same wardrobe. Action: Speaking directly to camera, holding product, light smile. Environment: Same kitchen counter as English variant, morning light. Style: 9:16 vertical, polished UGC. Camera: Medium close-up, locked. Audio: Female voiceover, Japanese, warm and confident — "三週間使って、もう戻れない。"

Підтримувані мови із сильним lip-sync

Шаблон 4: Багатокадрова міні-історія

Subject: Same persona as reference, casual loungewear. Action: Opens fridge, pours iced matcha into glass, walks to window, looks at camera with raised eyebrow. Environment: Sunlit Brooklyn loft, late morning. Style: 9:16 vertical, three-shot cut, polished UGC. Camera: Shot 1 wide on fridge, shot 2 medium on pour, shot 3 close on look-to-camera. Audio: Ambient morning kitchen sounds, no voiceover, soft lo-fi music bed.

Чому це працює

Шаблон 5: Атмосферний настроєвий кліп

Subject: Same persona as reference, charcoal turtleneck, contemplative. Action: Walking slowly through coffee shop, pausing at window, gazing out. Environment: Tokyo coffee shop, blue hour, neon reflections in puddles outside. Style: 9:16 vertical, cinematic, color-graded teal-and-amber. Camera: Steadicam glide following persona, slow dolly-in to medium close-up at window. Audio: Ambient café sound, distant rain, lo-fi instrumental — no voiceover.

Коли застосовувати

Пости запуску інфлюенсера (введення персони у стрічку)
Відкриваючі кліпи кампаній (задати настрій до того, як приземлиться рекламний кліп із мовленням)
Спонсорські брендові фільми, де персона є обʼєктом операторської роботи, а не спікером

Поширені помилки в промптах

Роздуті блоки Subject — «a beautiful young woman with cascading auburn hair, piercing blue eyes, a warm smile, wearing a stunning cream-colored turtleneck» зʼїдає половину бюджету. Стискайте: «26-year-old, auburn hair, cream turtleneck.»
Багатокрокова Action-проза — «She opens the door, walks to the table, sits down, picks up a book, then opens it» дає обірвані склейки. Стискайте: «Opens door, sits at table reading.»
Декоративна операторська лексика — «stunning, breathtaking, professional film look» — це шум. Модель хоче конкретного операторського словника: «locked-off medium close-up, eye level, slight handheld drift.»
Пропуск Audio — якщо не вказати, отримаєте випадковий фон. Завжди описуйте принаймні звуковий шар, навіть на кліпах без мовлення: «ambient café sound, no voiceover.»
Розпливчасті мовні мітки — «speaking the brand line» без блоку Audio дає TTS-якісний lip-sync. Завжди цитуйте сценарій дослівно і явно мітьте мову.
Повторний опис опорного портрета у тексті — передавайте опорний кадр як референсне зображення; у Subject пишіть просто «Same persona as reference, same face, same hair.» Зображення несе основне навантаження.

Робочий процес ітерації промптів

Дисципліна «одна зміна за прохід», яка працює в генерації зображень, працює і у відео:

Згенеруйте базовий кліп із повним промптом на шість блоків
Зафіксуйте пʼять блоків; варіюйте один
Порівняйте вихід із базою; залиште те, що працює
Перейдіть до наступного блоку; варіюйте його
Зупиніть ітерації, коли у вас є кліп, який можна випускати

Як OmniGems AI використовує цю формулу

Наступні кроки

Чому ми вибрали Happy Horse, а не Sora 2 чи Veo 3 — у Happy Horse vs Sora 2 vs Veo 3
Робочий процес опорного портрета, який живить image-to-video, — у GPT-Image-2 для AI-інфлюенсерів
Співвідношення сторін і формати платформ — у Найкращі співвідношення сторін для соціальних платформ
Структура промптів для зображень — у Як писати промпти для AI-інфлюенсерського контенту

Формула із шести частин

Чому порядок блоків важливий

Бюджет промпта

Шаблон 1: Reel із персоною, що говорить

Що варіювати

Шаблон 2: Спонсорський UGC із lip-sync

Поради щодо lip-sync

Шаблон 3: Багатомовний локалізований варіант

Підтримувані мови із сильним lip-sync

Шаблон 4: Багатокадрова міні-історія

Чому це працює

Шаблон 5: Атмосферний настроєвий кліп

Коли застосовувати

Поширені помилки в промптах

Робочий процес ітерації промптів

Як OmniGems AI використовує цю формулу

Наступні кроки

Починайте генерувати

Happy Horse для AI-інфлюенсерів: гайд із UGC-відеопайплайна 2026

Happy Horse vs Sora 2 vs Veo 3 для відео AI-інфлюенсерів

Гайд із розкриття та комплаєнсу для AI-інфлюенсерів 2026

OmniGems

Перетвори ідеї на автономних інфлюенсерів

Формула із шести частин

Чому порядок блоків важливий

Бюджет промпта

Шаблон 1: Reel із персоною, що говорить

Що варіювати

Шаблон 2: Спонсорський UGC із lip-sync

Поради щодо lip-sync

Шаблон 3: Багатомовний локалізований варіант

Підтримувані мови із сильним lip-sync

Шаблон 4: Багатокадрова міні-історія

Чому це працює

Шаблон 5: Атмосферний настроєвий кліп

Коли застосовувати

Поширені помилки в промптах

Робочий процес ітерації промптів

Як OmniGems AI використовує цю формулу

Наступні кроки

Починайте генерувати

Happy Horse для AI-інфлюенсерів: гайд із UGC-відеопайплайна 2026

Happy Horse vs Sora 2 vs Veo 3 для відео AI-інфлюенсерів

Гайд із розкриття та комплаєнсу для AI-інфлюенсерів 2026

OmniGems

Перетвори ідеї на автономних інфлюенсерів