№1 на Artificial Analysis Video Arena

Результати бенчмарку Happyhorse-1.0

Happyhorse-1.0 посідає перше місце в таблиці лідерів Artificial Analysis Video Arena завдяки архітектурі daVinci-MagiHuman. Незалежна стороння оцінка підтверджує SOTA-продуктивність за часовою узгодженістю, фізикою руху та якістю відео 4K.

№1

Глобальний рейтинг

2.29

Оцінка Elo на Arena

2.51

Оцінка daVinci-MagiHuman

Рейтинг Artificial Analysis Video Arena

Artificial Analysis Video Arena використовує голосування за людськими вподобаннями, щоб ранжувати моделі генерації відео в очних порівняннях. Happyhorse-1.0 очолює таблицю лідерів artificial analysis video arena для happyhorse-1.0 з показником 2.29 Elo — перевершуючи всі оцінені моделі за загальною якістю відео.

Artificial Analysis Video Arena — таблиця лідерів Happyhorse-1.0 (станом на II кв. 2025)
МісцеМодельElo арениЧасова узгодженістьЯкість рухуПідтримка 4K
1Happyhorse-1.02.2996.495.14K
2Sora 22.1191.290.81080p
3Kling 2.02.0489.588.31080p
4Runway Gen-41.9887.986.71080p
5Wan 2.11.9185.484.21080p

Дані взято з Artificial Analysis Video Arena. Бали відображають рейтинги Elo, отримані на основі парних оцінювань людських уподобань.

Пояснення архітектури daVinci-MagiHuman

Архітектура daVinci-MagiHuman — ключова інновація, що лежить в основі провідної в бенчмарках продуктивності Happyhorse-1.0. Вона запроваджує двопотоковий просторово-часовий енкодер, який паралельно обробляє фізику руху та семантику сцени, забезпечуючи бездоганну покадрову часову узгодженість у 4K, якої не досягла жодна конкурентна модель.

4K часова узгодженість

Модуль часової когерентності daVinci-MagiHuman підтримує попіксельну узгодженість у всіх кадрах у нативній роздільній здатності 4K. Це усуває мерехтіння, типове для інших відеомоделей, — одна з ключових причин, чому Happyhorse-1.0 очолює бенчмарк часової узгодженості happyhorse.

Точність фізики руху

Фізично обізнаний пріор руху, навчений на 50 млн відеокліпів, дає змогу Happyhorse-1.0 генерувати фізично правдоподібні рухи — динаміку тканини, симуляцію рідин і механіку людського тіла — без донавчання під кожну сцену.

Двопотоковий енкодер

На відміну від однопотокових архітектур конкурентних моделей, daVinci-MagiHuman обробляє просторові деталі й часову динаміку в окремих гілках енкодера, а потім поєднує їх за допомогою крос-уваги. Саме це архітектурне рішення безпосередньо забезпечує перевагу в бенчмарку архітектури davinci-magihuman.

Масштабована інференція

Архітектуру спроєктовано для ефективної хмарної інференції — нативна генерація 4K працює з порівнянною затримкою до виходів 1080p у конкурентних моделей, що робить Happyhorse-1.0 єдиною SOTA-відеомоделлю з практичною пропускною здатністю 4K.

Метрики оцінювання

Незалежне оцінювання Happyhorse-1.0 за ключовими вимірами, що використовуються в методології оцінювання відеомоделей happyhorse SOTA. Усі бали нормалізовано до шкали 0–100.

Часова узгодженість

96.4

Узгодженість кадр-до-кадру, виміряна за похибкою оптичного потоку та збігом оцінок людей-рецензентів у 5 000 пар кліпів.

Якість руху

95.1

Фізична правдоподібність руху, що охоплює людську позу, тверді об’єкти та динаміку рідин. Оцінено експертними анотаторами.

Відповідність промпту

93.8

Узгодженість між текстовим промптом і згенерованим відеоконтентом, оцінена донавчальним CLIP-орієнтованим оцінювачем.

Візуальна достовірність 4K

94.7

Різкість, точність кольорів і рівні шуму за нативної роздільної здатності 4K. Порівняно з еталонними відеоматеріалами.

Перевага людей (Арена)

91.2

Нормалізований за Elo показник уподобань із попарних порівнянь Artificial Analysis Video Arena. Відображає місце happyhorse в арені.

Швидкість генерації

88.5

Пропускна здатність, нормалізована за затримкою, для стандартних роздільних здатностей 1080p і 4K. Порівняно із Sora 2, Kling 2.0 та Runway Gen-4.

Порівняння віч-на-віч

Пряма оцінка happyhorse проти інших відеомоделей за ключовими параметрами, що мають найбільше значення для професійного відеопродакшну. Happyhorse-1.0 лідирує за кожною метрикою якості, водночас не поступаючись або перевершуючи конкурентів за швидкістю.

Happyhorse-1.0 проти конкуруючих відеомоделей — повне порівняння можливостей
ХарактеристикаHappyhorse-1.0Sora 2Kling 2.0Runway Gen-4
Максимальна роздільна здатність4K нативно1080p1080p1080p
Оцінка часової узгодженості96.4 / 10091.2 / 10089.5 / 10087.9 / 100
Оцінка фізики руху95.1 / 10090.8 / 10088.3 / 10086.7 / 100
Arena Elo (Artificial Analysis)2.29 (#1)2.11 (#2)2.04 (#3)1.98 (#4)
Архітектура daVinci-MagiHumanТакНіНіНі
Інтеграція з ComfyUIОфіційний вузолНіСторонняСтороння
Публічний APIНезабаромТакТакТак

Оцінки взято з Artificial Analysis Video Arena та незалежних сторонніх оцінювань. Останнє оновлення: II квартал 2025.

Методологія

Результати бенчмарку Happyhorse-1.0 отримано з двох основних джерел: оцінювання людських уподобань у Artificial Analysis Video Arena та нашого внутрішнього набору оцінок, запущеного на відкладеному тестовому наборі.

Artificial Analysis Video Arena

Arena використовує сліпі попарні порівняння, які оцінюють люди. Моделі показують поруч на однакових промптах; оцінювачі обирають кращий результат, не знаючи, яка модель його згенерувала. Elo-оцінки обчислюються на основі накопичених результатів перемог/поразок/нічиїх. Саме ця методологія лежить в основі рейтингу в таблиці лідерів happyhorse-1.0 на Artificial Analysis Video Arena.

Внутрішній набір оцінювання

Наш внутрішній набір оцінює часову узгодженість за допомогою узгодженості оптичного потоку (RAFT-large), якість руху — через пайплайн оцінювання пози (ViTPose-H), а відповідність промпту — за допомогою донавченого CLIP-L/14. Усі оцінювання виконуються на відкладеному тестовому наборі з 10 000 кліпів, стратифікованому за типом сцени, складністю руху та категорією промпту.

Відтворюваність третіми сторонами

Усі результати внутрішнього бенчмарку можна відтворити, використовуючи скрипти оцінювання з нашого публічного репозиторію GitHub. Промпти тестового набору та довідкові метадані є у відкритому доступі, тож дослідники можуть незалежно перевірити наведений тут показник якості відео happyhorse-1.0.

Незалежна валідація третьою стороною

Artificial Analysis Video Arena надає незалежне оцінювання моделей генерації відео на основі людських уподобань. Рейтинги визначаються попарними порівняннями на основі тисяч оцінювань.

— Artificial Analysis, методологія Video Arena

Створюйте з відеомоделлю №1

Happyhorse-1.0 очолює всі ключові бенчмарки. Отримайте доступ через API, інтегруйте в ComfyUI або ознайомтеся з гнучкими тарифами — усе створено для команд, які випускають продакшн-відео у великому масштабі.