Di BlaBlaCar, ada "garis putih" tak terlihat yang memisahkan Software Engineer (SWE) dan Data Analyst (DA). SWE punya kode, DA punya insight. Keduanya sering terpisah oleh tembok SQL yang rumit. BlaBlaCar memutuskan untuk meruntuhkan tembok ini dengan Data Copilot.
🚧 Masalah: The Great Divide
🧱 Silo Budaya: Engineer takut menyentuh Data Warehouse karena sintaks SQL/DBT yang rumit. Analyst kewalahan menjawab pertanyaan dasar ("quick questions") sehingga tidak sempat melakukan analisis mendalam.
🍝 Spaghetti SQL: Tanpa standar, analisis data sering dilakukan secara ad-hoc, tersebar di spreadsheet dan notebook yang tidak terawat, dan sulit direproduksi.
🛠️ Solusi: Shift Left & Data Copilot di IDE
BlaBlaCar menerapkan filosofi "Shift Left" dari DevOps ke Data: Engineer harus bisa menjawab pertanyaan data mereka sendiri sebelum fitur dirilis, bukan menunggu Analyst menemukan bug data di production.
🤖 The Junior Analyst in Your IDE: Bukan tool BI drag-and-drop, tapi ekstensi VS Code yang ditenagai LLM.
🧠 Context Over Syntax: Copilot ini tidak hanya tahu SQL, tapi tahu konteks bisnis. Dia belajar dari curated queries tim data, jadi saat ditanya "Driver Churn Rate", dia mengambil definisi resmi perusahaan, bukan halusinasi.
🩺 Data Health Card: Seperti linter untuk kode, fitur ini memberi peringatan dini jika ada logika analisis yang mencurigakan (meski sintaks SQL-nya benar).
✅ Findings & Dampak
🚀 Velocity Tinggi: Pertanyaan yang dulu butuh 3 minggu di backlog Jira, sekarang terjawab dalam 10 menit langsung di VS Code.
🛡️ Review Culture: Analisis data kini diperlakukan sebagai kode. Engineer membuat Pull Request berisi script analisis + unit test. DA me-review logika tersebut. DA berubah peran dari "Pabrik Query" menjadi "Mentor & Reviewer".
🧠 Repository as Memory: Semua analisis tersimpan di git repo. Tidak ada lagi insight yang hilang di history Slack. Pertanyaan serupa di masa depan bisa langsung menarik script lama.
💻 How to Use (Open Source)
BlaBlaCar telah merilis versi Open Source dari Data Copilot ini! Kamu hanya butuh lisensi GitHub Copilot.
🔗 Fork & Try: Kunjungi repo mereka, hubungkan ke BigQuery (bisa pakai sample dataset), dan mulai tanya-tanya data langsung dari IDE. Repo: github.com/blablacar/data-copilot
💡 Key Takeaways
🌐 The Ecotone: Inovasi terbaik terjadi di perbatasan antara dua disiplin ilmu. Dengan LLM, Engineer bisa masuk ke wilayah Data tanpa perlu jadi ahli statistik.
🏗️ Zero-Infrastructure RAG: Tidak perlu vector DB mahal. Cukup gunakan file teks (Markdown/SQL) di repo yang diindeks otomatis oleh VS Code. Simpel tapi powerful.
👇 Diskusi Yuk!
Kalian para Engineer, seberapa sering kalian minta tolong tim Data cuma buat query SQL simpel? Atau kalian para Analyst, capek nggak sih jadi "human search engine"?
Share unek-unek kolaborasi data kalian di bawah! 👇
Sumber: https://medium.com/blablacar/why-we-built-blablacar-data-copilot-shifting-data-analysis-left-b4cc246faf52
Repo: https://github.com/blablacar/data-copilot
#DataEngineering #DataScience #SoftwareEngineering #BlaBlaCar #OpenSource #LLM #Copilot #ShiftLeft #DevOps #DataAnalytics