Pernah nyuruh AI bikin aplikasi full-stack, awalnya lancar, tapi lama-lama dia mulai ngaco, lupa kode yang ditulis sebelumnya, atau tiba-tiba bilang “Selesai” padahal fitur belum jalan? π€
Anthropic Engineering baru saja merilis panduan “Effective Harnesses”. Intinya: Jangan biarkan Agent kerja sendirian tanpa “alat bantu ingat”.
Ini bedahannya:
1. β οΈ Problem Statement (Masalah)
* Sesi Terputus: Agent bekerja dalam sesi-sesi terpisah (context window terbatas). Saat sesi baru dimulai, Agent mengalami “amnesia”βdia tidak ingat apa yang baru saja dia kerjakan di sesi sebelumnya.
* The “One-Shot” Trap: Agent cenderung ingin menyelesaikan semua tugas sekaligus dalam satu prompt. Akibatnya, kode jadi setengah jadi, tidak terdokumentasi, dan melampaui batas memori.
* Premature Completion: Tanpa daftar tugas yang jelas, Agent sering merasa “sudah selesai” padahal banyak fitur yang masih buggy.
2. π οΈ Metodologi & Solusi (The Harness)
Anthropic menyarankan arsitektur Dua Fase yang meniru cara kerja software engineer manusia:
* Fase 1: Initializer Agent (Arsitek)
* Tugasnya cuma satu: Setup lingkungan kerja.
* Membuat file feature_list.json (daftar fitur yang harus dibangun).
* Membuat claude-progress.txt (log kerja).
* Inisialisasi Git repo.
* Fase 2: Coding Agent (Pekerja)
* Bekerja dalam loop (putaran) pendek.
* Start: Baca git log dan progress.txt untuk “mengembalikan ingatan”.
* Action: Pilih satu fitur dari feature_list.json yang masih passes: false. Kerjakan. Test.
* End: Commit kode ke Git, update log, lalu mati. Ulangi sesi baru.
3. π Findings & Hasil
* π Memory Artifacts: Dengan memaksa Agent membaca/menulis ke file eksternal (Git & Logs), Agent tidak perlu mengandalkan context window model untuk mengingat progres.
* π‘οΈ Self-Healing: Jika Agent membuat bug, sesi berikutnya bisa melihat error di log/test dan melakukan revert via Git, persis seperti developer manusia.
* β‘ Incremental Wins: Memecah tugas besar menjadi 200+ tugas kecil (feature_list) mencegah Agent kewalahan dan menjamin kualitas kode lebih stabil.
4. π‘ Key Takeaways
* Context is Not Enough: Kita tidak bisa hanya mengandalkan memori internal model (Context Window) untuk tugas durasi panjang. Kita butuh Memori Eksternal (File System/Git).
* Structure > Intelligence: Agent terpintar sekalipun (seperti Claude Opus 4.5) akan gagal tanpa struktur kerja yang rapi.
* Treat Agents like Humans: Beri mereka checklist, log book, dan version control. Jangan suruh mereka kerja “buta”.
π Baca Panduan Lengkapnya: https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents
#AIAgents #SoftwareEngineering #Anthropic #DevOps #LLM #SystemDesign #CodingTips #TechTutorial