AI Safety & Benchmarking: Building Trustworthy Evaluation Ecosystems

Impossible d'ajouter des articles

Désolé, nous ne sommes pas en mesure d'ajouter l'article car votre panier est déjà plein.

Veuillez réessayer plus tard

Échec de l’élimination de la liste d'envies.

Veuillez réessayer plus tard

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

AI Safety & Benchmarking: Building Trustworthy Evaluation Ecosystems

Écouter gratuitement

Voir les détails

Effective AI supervision requires reliable benchmarking ecosystems. Nicholas Miailhe discusses why benchmarks matter, how they should be constructed, and what regulators need to know about safety evaluations. The conversation highlights emerging international efforts to standardise safety testing and ensure comparability across models.

Speaker: Nicholas Miailhe (PRISM Eval)

Interviewer: Doaa Abu Elyounes, Programme Specialist, Ethics of AI Unit, UNESCO

Hosted on Ausha. See ausha.co/privacy-policy for more information.

Aucun commentaire pour le moment

SÉLECTION

AI Safety & Benchmarking: Building Trustworthy Evaluation Ecosystems

Impossible d'ajouter des articles

Échec de l’élimination de la liste d'envies.

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

AI Safety & Benchmarking: Building Trustworthy Evaluation Ecosystems

Les Top 10

Prix littéraires

Écoutez en illimité