🚀 2025 LLM Year in Review - .:: Data Sains Lab ::.

Tanggal artikel: 19 Desember 2025

📝 Deskripsi Ringkas
Andrej Karpathy merenungkan tahun 2025 sebagai tahun yang penuh peristiwa dan perubahan paradigma dalam dunia Large Language Models (LLM). Ia menyoroti pergeseran dari pelatihan tradisional ke pembelajaran penguatan yang dapat diverifikasi, sifat kecerdasan LLM yang "bergerigi" (jagged), serta munculnya cara baru berinteraksi dengan AI melalui alat seperti Claude Code, Cursor, dan konsep "vibe coding".

1. ⚠️ Problem Statement
Keterbatasan Paradigma Lama: Metode Pretraining + SFT + RLHF mulai mencapai batasnya.

Jagged Intelligence: Kecerdasan LLM tidak merata seperti hewan, melainkan "bergerigi"—jenius dalam matematika tapi bodoh dalam hal dasar, membuatnya sulit diprediksi dan diukur dengan benchmark tradisional yang rentan dimanipulasi (benchmaxxing).

Kesenjangan UI/UX: Interaksi berbasis teks dengan LLM terasa kuno seperti konsol komputer tahun 1980-an; manusia membutuhkan antarmuka visual yang lebih intuitif.

2. 🛠️ Solusi / Approach
Pergeseran paradigma utama di 2025:

RLVR (Reinforcement Learning from Verifiable Rewards): Tahap baru pelatihan di mana model belajar "berpikir" dan menyusun strategi pemecahan masalah secara mandiri melalui reward objektif (seperti teka-teki matematika/kode), memungkinkan waktu berpikir (thinking time) yang lebih lama saat inferensi (contoh: OpenAI o3, DeepSeek R1).

LLM Apps Layer (Cursor): Munculnya lapisan aplikasi tebal yang mengorkestrasi panggilan LLM, menyediakan konteks, dan GUI spesifik (seperti Cursor untuk coding), bukan sekadar model mentah.

Local Agents (Claude Code): Pergeseran ke agen yang berjalan di komputer lokal (localhost), memiliki akses ke environment pribadi, rahasia, dan konteks pengguna, memberikan pengalaman latensi rendah yang lebih intim daripada cloud.

3. 📊 Findings / Results / Impact
Vibe Coding: Pemrograman menjadi demokratis; siapa saja bisa membuat perangkat lunak hanya dengan bahasa Inggris (vibe), sementara profesional menjadi jauh lebih produktif, bahkan membuat alat sekali pakai (ephemeral apps) untuk debugging.

Kematian Benchmark: Kepercayaan pada benchmark publik runtuh karena optimalisasi berlebihan (overfitting) pada set tes melalui RLVR.

Nano Banana (LLM GUI): Model seperti Google Gemini Nano Banana menunjukkan masa depan di mana LLM menghasilkan output visual/spasial (gambar, UI, widget), bukan sekadar teks, meletakkan dasar bagi "LLM GUI".

4. ⚙️ How to Implement (General Pattern)
Pelajaran bagi pengembang dan industri:

Adopsi RLVR: Fokus pada lingkungan dengan reward yang dapat diverifikasi secara otomatis untuk melatih kemampuan penalaran model.

Bangun Aplikasi Vertikal: Jangan hanya membuat wrapper; bangun aplikasi yang mengelola konteks, alat, dan feedback loop spesifik domain (seperti Cursor).

Rangkul Vibe Coding: Jangan takut menulis kode dalam bahasa alami; manfaatkan AI untuk membuat alat bantu kecil yang sebelumnya tidak sepadan dengan usaha pengkodingan manual.

5. 💡 Key Takeaways
Ghosts, not Animals: Jangan antropomorfisasi AI. Mereka adalah entitas kecerdasan "asing" dengan profil kemampuan yang sangat berbeda dari manusia atau hewan.

Thinking Time is Key: Kemampuan model kini bisa ditingkatkan secara dinamis dengan memberinya waktu "berpikir" lebih lama saat inferensi.

AI Lives on Your Computer: Masa depan interaksi AI bukan hanya di browser, tapi sebagai "roh" yang hidup di terminal dan sistem operasi Anda (Claude Code).

🗣️ Apakah Anda sudah mulai merasakan dampak "vibe coding" dalam pekerjaan Anda? Apakah Anda lebih sering menulis kode secara manual atau hanya mendeskripsikan apa yang Anda inginkan kepada AI?

Sumber:
https://karpathy.bearblog.dev/year-in-review-2025/

🏷️ #LLM2025 #AndrejKarpathy #RLVR #VibeCoding #ClaudeCode #Cursor #AIHistory #GenerativeAI #FutureOfCoding #GeminiNano

Share this:

Leave a Comment Cancel reply