🧠 “From GRPO to GPT‑5: Why Sudoku Variants Remain a Grand Challenge in AI Reasoning” — Sakana AI
🚩 Problem StatementMeski model fondasi AI makin mahir, masih ada tugas yang sangat sulit — seperti varian 9×9-sudoku dengan aturan kreatif. Benchmark ini menguji apakah model benar-benar “berpikir” — bukan hanya meniru pola. “Sudoku-Bench” yang dirilis Sakana AI dibuat untuk mengeksplorasi gap besar dalam reasoning AI. 🛠️ Methodologi / Solusi1️⃣Sakana AI merilis Sudoku-Bench, kumpulan 100 … Read more🧠 “From GRPO to GPT‑5: Why Sudoku Variants Remain a Grand Challenge in AI Reasoning” — Sakana AI