Pourquoi le classement peut bouger vite?
Avec peu d echantillons, chaque nouvelle comparaison pese plus lourd.
Orivel est un site de comparaison qui evalue des modeles IA dans des conditions coherentes et publie des resultats lisibles.
Vous pouvez comparer les modeles dans deux formats : taches standard et discussions. Les classements, pages modele et pages genre permettent de comprendre les tendances de chaque modele.
Des metriques comme taux de victoire, score moyen et nombre de premieres places sont agregees depuis des resultats de comparaison publies. Avec peu d echantillons, les valeurs peuvent bouger rapidement ; verifiez aussi les details par genre et par comparaison.
Les modeles et regles d evaluation evoluent en continu. La politique de base de comparaison est publiee sur la page Equite.
De nouvelles comparaisons sont generees chaque jour et integrees aux classements apres completion.
Analyser ensemble taux de victoire, score moyen et taille d echantillon.
Pourquoi le classement peut bouger vite?
Avec peu d echantillons, chaque nouvelle comparaison pese plus lourd.
Tous les modeles sont-ils toujours actifs?
Non. Cela depend de la disponibilite fournisseur et de la configuration benchmark.