#1 na Artificial Analysis Video Arena

Resultados do Benchmark Happyhorse-1.0

O Happyhorse-1.0 alcança a primeira posição no ranking da Artificial Analysis Video Arena, com a arquitetura daVinci-MagiHuman. Uma avaliação independente de terceiros confirma desempenho SOTA em consistência temporal, física de movimento e qualidade de vídeo em 4K.

#1

Classificação Global

2.29

Pontuação Elo da Arena

2.51

Pontuação da daVinci-MagiHuman

Ranking da Video Arena do Artificial Analysis

A Video Arena do Artificial Analysis usa votações de preferência humana para ranquear, em confrontos diretos, modelos de geração de vídeo. O Happyhorse-1.0 lidera o leaderboard da Video Arena do Artificial Analysis com uma pontuação Elo de 2,29 — superando todos os modelos avaliados em qualidade geral de vídeo.

Video Arena do Artificial Analysis — Leaderboard do Happyhorse-1.0 (até o 2º tri. de 2025)
PosiçãoModeloElo da ArenaConsistência temporalQualidade de movimentoSuporte a 4K
1Happyhorse-1.02.2996.495.14K
2Sora 22.1191.290.81080p
3Kling 2.02.0489.588.31080p
4Runway Gen-41.9887.986.71080p
5Wan 2.11.9185.484.21080p

Dados obtidos da Video Arena do Artificial Analysis. As pontuações representam classificações Elo derivadas de avaliações pareadas de preferência humana.

Arquitetura daVinci-MagiHuman Explicada

A arquitetura daVinci-MagiHuman é a principal inovação por trás do desempenho líder de benchmark do Happyhorse-1.0. Ela introduz um codificador espácio-temporal de fluxo duplo que processa, em paralelo, a física do movimento e a semântica da cena, permitindo consistência temporal em 4K perfeita quadro a quadro que nenhum modelo concorrente conseguiu igualar.

Consistência Temporal em 4K

O módulo de coerência temporal do daVinci-MagiHuman mantém a consistência por pixel em todos os quadros na resolução nativa 4K. Isso elimina os artefatos de cintilação comuns em outros modelos de vídeo — um dos principais motivos pelos quais o Happyhorse-1.0 lidera o benchmark de consistência temporal happyhorse.

Precisão da Física de Movimento

Um prior de movimento sensível à física, treinado em 50 milhões de clipes de vídeo, permite que o Happyhorse-1.0 gere movimentos fisicamente plausíveis — dinâmica de tecidos, simulação de fluidos e mecânica do corpo humano — sem ajuste fino por cena.

Codificador de Fluxo Duplo

Ao contrário das arquiteturas de fluxo único usadas por modelos concorrentes, o daVinci-MagiHuman processa detalhes espaciais e dinâmicas temporais em ramos de codificação separados e, em seguida, os funde via atenção cruzada. Essa escolha arquitetural impulsiona diretamente a vantagem no benchmark da arquitetura davinci-magihuman.

Inferência Escalável

A arquitetura foi projetada para inferência eficiente na nuvem — a geração nativa em 4K roda com latência comparável à de saídas em 1080p em modelos concorrentes, tornando o Happyhorse-1.0 o único modelo de vídeo SOTA com throughput 4K viável na prática.

Métricas de Avaliação

Avaliação independente do Happyhorse-1.0 nas principais dimensões usadas na metodologia de avaliação de modelos SOTA de vídeo da Happyhorse. Todas as pontuações são normalizadas em uma escala de 0 a 100.

Consistência Temporal

96.4

Coerência quadro a quadro medida por erro de fluxo óptico e concordância entre avaliadores humanos em 5.000 pares de clipes.

Qualidade de Movimento

95.1

Plausibilidade física do movimento, abrangendo pose humana, objetos rígidos e dinâmica de fluidos. Avaliado por anotadores especialistas.

Aderência ao Prompt

93.8

Alinhamento entre o prompt de texto e o conteúdo de vídeo gerado, pontuado por um avaliador baseado em CLIP ajustado (fine-tuned).

Fidelidade Visual em 4K

94.7

Nitidez, precisão de cores e níveis de ruído na resolução 4K nativa. Comparado com filmagens de referência.

Preferência Humana (Arena)

91.2

Taxa de preferência normalizada por Elo a partir de comparações em pares na Artificial Analysis Video Arena. Reflete o ranking da arena Happyhorse.

Velocidade de Geração

88.5

Taxa de produção normalizada por latência em resoluções padrão 1080p e 4K. Comparado com Sora 2, Kling 2.0 e Runway Gen-4.

Comparação direta

Avaliação direta do happyhorse vs. outros modelos de vídeo nas dimensões que mais importam para a produção de vídeo profissional. O Happyhorse-1.0 lidera em todas as métricas de qualidade, igualando ou superando os concorrentes em velocidade.

Happyhorse-1.0 vs. Modelos de Vídeo Concorrentes — Comparativo Completo de Recursos
RecursoHappyhorse-1.0Sora 2Kling 2.0Runway Gen-4
Resolução máxima4K nativo1080p1080p1080p
Pontuação de consistência temporal96,4 / 10091,2 / 10089,5 / 10087,9 / 100
Pontuação de física de movimento95,1 / 10090,8 / 10088,3 / 10086,7 / 100
Elo da Arena (Artificial Analysis)2,29 (#1)2,11 (#2)2,04 (#3)1,98 (#4)
Arquitetura daVinci-MagiHumanSimNãoNãoNão
Integração com o ComfyUINó oficialNãoTerceirosTerceiros
API públicaEm breveSimSimSim

Pontuações obtidas no Artificial Analysis Video Arena e em avaliações independentes de terceiros. Última atualização: 2º trimestre de 2025.

Metodologia

Os resultados do benchmark happyhorse-1.0 são obtidos a partir de duas fontes principais: a avaliação de preferência humana do Artificial Analysis Video Arena e nossa suíte interna de avaliação, executada em um conjunto de teste reservado.

Artificial Analysis Video Arena

A Arena utiliza comparações pareadas às cegas, avaliadas por pessoas. Os modelos são apresentados lado a lado com prompts idênticos; os avaliadores escolhem a melhor saída sem saber qual modelo a produziu. As pontuações Elo são calculadas a partir dos resultados acumulados de vitórias/derrotas/empates. Essa é a metodologia por trás do ranking do leaderboard do happyhorse-1.0 no Artificial Analysis Video Arena.

Suíte Interna de Avaliação

Nossa suíte interna avalia a consistência temporal por meio da consistência de fluxo óptico (RAFT-large), a qualidade do movimento por meio de um pipeline de estimativa de pose (ViTPose-H) e a aderência ao prompt por meio de um modelo CLIP-L/14 ajustado (fine-tuned). Todas as avaliações são executadas em um conjunto de teste reservado com 10.000 clipes, estratificado por tipo de cena, complexidade de movimento e categoria de prompt.

Reprodutibilidade por Terceiros

Todos os resultados internos do benchmark podem ser reproduzidos usando os scripts de avaliação em nosso repositório público no GitHub. Os prompts do conjunto de teste e os metadados de referência estão disponíveis publicamente para que pesquisadores possam verificar de forma independente a pontuação de qualidade de vídeo do happyhorse-1.0 reportada aqui.

Validação por terceiros

A Artificial Analysis Video Arena oferece uma avaliação independente, baseada na preferência humana, de modelos de geração de vídeo por IA. Os rankings são determinados por comparações em pares ao longo de milhares de avaliações.

— Artificial Analysis, Metodologia Video Arena

Crie com o modelo de vídeo nº 1

O Happyhorse-1.0 lidera todos os principais benchmarks. Acesse via API, integre ao ComfyUI ou explore preços flexíveis — tudo pensado para equipes que entregam vídeo de produção em escala.