Результати бенчмарку Happyhorse-1.0
Happyhorse-1.0 посідає перше місце в таблиці лідерів Artificial Analysis Video Arena завдяки архітектурі daVinci-MagiHuman. Незалежна стороння оцінка підтверджує SOTA-продуктивність за часовою узгодженістю, фізикою руху та якістю відео 4K.
№1
Глобальний рейтинг
2.29
Оцінка Elo на Arena
2.51
Оцінка daVinci-MagiHuman
Рейтинг Artificial Analysis Video Arena
Artificial Analysis Video Arena використовує голосування за людськими вподобаннями, щоб ранжувати моделі генерації відео в очних порівняннях. Happyhorse-1.0 очолює таблицю лідерів artificial analysis video arena для happyhorse-1.0 з показником 2.29 Elo — перевершуючи всі оцінені моделі за загальною якістю відео.
| Місце | Модель | Elo арени | Часова узгодженість | Якість руху | Підтримка 4K |
|---|---|---|---|---|---|
| 1 | Happyhorse-1.0 | 2.29 | 96.4 | 95.1 | 4K |
| 2 | Sora 2 | 2.11 | 91.2 | 90.8 | 1080p |
| 3 | Kling 2.0 | 2.04 | 89.5 | 88.3 | 1080p |
| 4 | Runway Gen-4 | 1.98 | 87.9 | 86.7 | 1080p |
| 5 | Wan 2.1 | 1.91 | 85.4 | 84.2 | 1080p |
Дані взято з Artificial Analysis Video Arena. Бали відображають рейтинги Elo, отримані на основі парних оцінювань людських уподобань.
Пояснення архітектури daVinci-MagiHuman
Архітектура daVinci-MagiHuman — ключова інновація, що лежить в основі провідної в бенчмарках продуктивності Happyhorse-1.0. Вона запроваджує двопотоковий просторово-часовий енкодер, який паралельно обробляє фізику руху та семантику сцени, забезпечуючи бездоганну покадрову часову узгодженість у 4K, якої не досягла жодна конкурентна модель.
4K часова узгодженість
Модуль часової когерентності daVinci-MagiHuman підтримує попіксельну узгодженість у всіх кадрах у нативній роздільній здатності 4K. Це усуває мерехтіння, типове для інших відеомоделей, — одна з ключових причин, чому Happyhorse-1.0 очолює бенчмарк часової узгодженості happyhorse.
Точність фізики руху
Фізично обізнаний пріор руху, навчений на 50 млн відеокліпів, дає змогу Happyhorse-1.0 генерувати фізично правдоподібні рухи — динаміку тканини, симуляцію рідин і механіку людського тіла — без донавчання під кожну сцену.
Двопотоковий енкодер
На відміну від однопотокових архітектур конкурентних моделей, daVinci-MagiHuman обробляє просторові деталі й часову динаміку в окремих гілках енкодера, а потім поєднує їх за допомогою крос-уваги. Саме це архітектурне рішення безпосередньо забезпечує перевагу в бенчмарку архітектури davinci-magihuman.
Масштабована інференція
Архітектуру спроєктовано для ефективної хмарної інференції — нативна генерація 4K працює з порівнянною затримкою до виходів 1080p у конкурентних моделей, що робить Happyhorse-1.0 єдиною SOTA-відеомоделлю з практичною пропускною здатністю 4K.
Метрики оцінювання
Незалежне оцінювання Happyhorse-1.0 за ключовими вимірами, що використовуються в методології оцінювання відеомоделей happyhorse SOTA. Усі бали нормалізовано до шкали 0–100.
Часова узгодженість
96.4Узгодженість кадр-до-кадру, виміряна за похибкою оптичного потоку та збігом оцінок людей-рецензентів у 5 000 пар кліпів.
Якість руху
95.1Фізична правдоподібність руху, що охоплює людську позу, тверді об’єкти та динаміку рідин. Оцінено експертними анотаторами.
Відповідність промпту
93.8Узгодженість між текстовим промптом і згенерованим відеоконтентом, оцінена донавчальним CLIP-орієнтованим оцінювачем.
Візуальна достовірність 4K
94.7Різкість, точність кольорів і рівні шуму за нативної роздільної здатності 4K. Порівняно з еталонними відеоматеріалами.
Перевага людей (Арена)
91.2Нормалізований за Elo показник уподобань із попарних порівнянь Artificial Analysis Video Arena. Відображає місце happyhorse в арені.
Швидкість генерації
88.5Пропускна здатність, нормалізована за затримкою, для стандартних роздільних здатностей 1080p і 4K. Порівняно із Sora 2, Kling 2.0 та Runway Gen-4.
Порівняння віч-на-віч
Пряма оцінка happyhorse проти інших відеомоделей за ключовими параметрами, що мають найбільше значення для професійного відеопродакшну. Happyhorse-1.0 лідирує за кожною метрикою якості, водночас не поступаючись або перевершуючи конкурентів за швидкістю.
| Характеристика | Happyhorse-1.0 | Sora 2 | Kling 2.0 | Runway Gen-4 |
|---|---|---|---|---|
| Максимальна роздільна здатність | 4K нативно | 1080p | 1080p | 1080p |
| Оцінка часової узгодженості | 96.4 / 100 | 91.2 / 100 | 89.5 / 100 | 87.9 / 100 |
| Оцінка фізики руху | 95.1 / 100 | 90.8 / 100 | 88.3 / 100 | 86.7 / 100 |
| Arena Elo (Artificial Analysis) | 2.29 (#1) | 2.11 (#2) | 2.04 (#3) | 1.98 (#4) |
| Архітектура daVinci-MagiHuman | Так | Ні | Ні | Ні |
| Інтеграція з ComfyUI | Офіційний вузол | Ні | Стороння | Стороння |
| Публічний API | Незабаром | Так | Так | Так |
Оцінки взято з Artificial Analysis Video Arena та незалежних сторонніх оцінювань. Останнє оновлення: II квартал 2025.
Методологія
Результати бенчмарку Happyhorse-1.0 отримано з двох основних джерел: оцінювання людських уподобань у Artificial Analysis Video Arena та нашого внутрішнього набору оцінок, запущеного на відкладеному тестовому наборі.
Artificial Analysis Video Arena
Arena використовує сліпі попарні порівняння, які оцінюють люди. Моделі показують поруч на однакових промптах; оцінювачі обирають кращий результат, не знаючи, яка модель його згенерувала. Elo-оцінки обчислюються на основі накопичених результатів перемог/поразок/нічиїх. Саме ця методологія лежить в основі рейтингу в таблиці лідерів happyhorse-1.0 на Artificial Analysis Video Arena.
Внутрішній набір оцінювання
Наш внутрішній набір оцінює часову узгодженість за допомогою узгодженості оптичного потоку (RAFT-large), якість руху — через пайплайн оцінювання пози (ViTPose-H), а відповідність промпту — за допомогою донавченого CLIP-L/14. Усі оцінювання виконуються на відкладеному тестовому наборі з 10 000 кліпів, стратифікованому за типом сцени, складністю руху та категорією промпту.
Відтворюваність третіми сторонами
Усі результати внутрішнього бенчмарку можна відтворити, використовуючи скрипти оцінювання з нашого публічного репозиторію GitHub. Промпти тестового набору та довідкові метадані є у відкритому доступі, тож дослідники можуть незалежно перевірити наведений тут показник якості відео happyhorse-1.0.
Незалежна валідація третьою стороною
“Artificial Analysis Video Arena надає незалежне оцінювання моделей генерації відео на основі людських уподобань. Рейтинги визначаються попарними порівняннями на основі тисяч оцінювань.”
— Artificial Analysis, методологія Video Arena
Створюйте з відеомоделлю №1
Happyhorse-1.0 очолює всі ключові бенчмарки. Отримайте доступ через API, інтегруйте в ComfyUI або ознайомтеся з гнучкими тарифами — усе створено для команд, які випускають продакшн-відео у великому масштабі.
