4 modèles d’IA open source testés sur le programme officiel de Français de la FWB

Nous avons comparé plusieurs modèles open source locaux afin d’évaluer leur capacité à comprendre et exploiter un corpus pédagogique réel issu du programme officiel de Français de la Fédération Wallonie-Bruxelles.

Bonne surprise : plusieurs modèles open source locaux se sont montrés capables d’analyser efficacement un corpus pédagogique réel issu de la Fédération Wallonie-Bruxelles.

Le modèle Ministral 3 8B s’est démarqué par des réponses particulièrement fiables et cohérentes, tandis que les modèles les plus légers restent davantage adaptés à des usages simples ou fortement supervisés.

Modèles testés4Ministral 3B · 8B · 14B · phi4-mini 3.8B
Questions par test6dont 1 piège anti-hallucination
Niveaux documentaires3N0 PDF · N1 TXT · N2 Markdown
Réponses évaluées726 questions × 3 niveaux × 4 modèles
N0 – PDF brut N1 – TXT N2 – Markdown
#1 Ministral 3 8B (Serveur IA Light) : N0 4,17 – N1 4,17 – N2 4,67 | #2 Ministral 3 14B (Serveur IA) : N0 3,67 – N1 3,17 – N2 4,00 | #3 Ministral 3 3B (PC Portable) : N0 3,17 – N1 3,50 – N2 3,83 | #4 phi4-mini 3.8B (PC Portable) : N0 2,17 – N1 2,33 – N2 2,50

Les résultats détaillés vous attendent sur le labo de test