GPT-5.4のリークされたベンチマークは、大規模言語モデルの能力向上に天井が来たことを示唆しているか?