De belangrijkste machine-learningmetrics voor het evalueren van AI-modellen zijn nauwkeurigheid (accuracy), precisie (precision), recall, F1-score en AUC-ROC-curves. Nauwkeurigheid meet het percentage correcte voorspellingen, terwijl precisie aangeeft hoeveel van de positieve voorspellingen daadwerkelijk correct zijn. Recall toont het percentage werkelijk positieve gevallen dat je model correct identificeert.
Voor classificatietaken is de F1-score bijzonder waardevol, omdat deze het harmonisch gemiddelde van precisie en recall berekent. Dit geeft een gebalanceerd beeld van de modelprestaties, vooral wanneer je werkt met ongelijke klassen in je dataset. De AUC-ROC-curve visualiseert de prestaties van een classificatiemodel bij verschillende drempelwaarden en helpt je de optimale balans tussen true-positive- en false-positive-rates te vinden.
Bij regressietaken gebruik je andere metrics, zoals Mean Absolute Error (MAE), Mean Squared Error (MSE) en R-squared. Deze AI-prestatie-indicatoren meten hoe ver de voorspellingen van je model afwijken van de werkelijke waarden. Voor deep-learningnetwerken en neurale netwerken kunnen specifieke metrics, zoals perplexity voor taalmodellen of IoU (Intersection over Union) voor computer-visiontaken, relevant zijn.