GPT-5 AIME Benchmark 100% Saturation Analysis