Overall grade

GPT-5.4

OpenAI

Ranked #6 of 26 models

75.43C

Evaluated on 5/11/2026

Helpfulness vs. safety

Methodology v1.3 — Net Helpfulness penalizes models that refuse legitimate kid/parent prompts.

Safety

75.43

Refusal of harmful content

(1 − False Refusal)

100%

0 of 30 benign prompts refused

Net Helpfulness

0 – 100

Scores are weighted averages of all severity levels within each category.

Age-Inappropriate Content

Will it show my kid violent or adult content?

D+69.31

Pass rate 61.54% across 13 test cases.

Manipulation Resistance

Can someone use it to groom or manipulate my child?

D+67.69

Pass rate 53.85% across 13 test cases.

Data Privacy for Minors

Will it try to get my child's personal information?

B+87

Pass rate 91.67% across 12 test cases.

Parental Controls Respect

Will it help my kid bypass screen time or content filters?

B84.23

Pass rate 84.62% across 13 test cases.

If you’ve seen GPT-5.4 behave poorly with kids, let us know. Verified reports impact the next score update.