🚀 Planetary-Scale Deep Reasoning: Building Our Final Presidential Daily Brief Prompt & Comparing Gemini 3/2.5 Pro/Flash ASR/TOC

 
Tanggal artikel: 24 Desember 2025

📝 Deskripsi Ringkas

Artikel ini merinci eksperimen Proyek GDELT dalam menggunakan model AI terbaru Google, Gemini 3 Pro, Gemini 3 Flash, dan Gemini 2.5 Pro, untuk menghasilkan laporan intelijen harian bergaya Presidential Daily Brief (PDB). Eksperimen ini membandingkan kinerja model dalam menganalisis transkrip siaran berita televisi sehari penuh dari Rusia, baik menggunakan transkrip mentah (ASR) maupun daftar isi cerita yang telah diproses sebelumnya (TOC).

⚠️ Problem Statement

Overload Informasi: Volume data berita global terlalu besar untuk diproses secara manual menjadi intelijen strategis yang mendalam secara real-time.

Kesenjangan Model: Eksperimen sebelumnya menunjukkan penurunan kinerja yang tajam antara Gemini 3 Pro (generasi terbaru) dan Gemini 2.5 Pro, di mana model yang lebih lama kesulitan melakukan abstraksi tingkat tinggi.

Efisiensi Biaya vs. Kualitas: Menggunakan transkrip mentah lengkap sangat mahal; tantangannya adalah apakah ringkasan cerita (TOC) yang jauh lebih murah dapat menghasilkan wawasan analitis yang setara.

🛠️ Solusi / Approach

Eksperimen ini menggunakan pendekatan prompt engineering bertingkat:

Prompt "Ultimate" PDB: Prompt yang sangat terstruktur dikembangkan secara interaktif oleh Gemini 3 Pro sendiri untuk memaksa model berpikir analitis, skeptis, dan strategis (bukan sekadar meringkas).

Perbandingan Model: Menguji empat model (Gemini 3 Pro, 3 Flash, 2.5 Pro, 2.5 Flash Thinking) pada data yang sama (siaran berita Rusia 1 hari penuh).

Dua Metode Input:

Full ASR Transcript: Teks lengkap hasil transkripsi audio.

Story TOC (Table of Contents): Daftar cerita yang diekstraksi terlebih dahulu oleh model AI lain (Gemini 2.5 Flash Thinking) menjadi format JSON terstruktur.

📊 Findings / Results / Impact

Kesenjangan Model Menyempit: Dengan prompt baru yang sangat terstruktur, Gemini 2.5 Pro mampu menghasilkan analisis yang jauh lebih mendekati kualitas Gemini 3 Pro, meskipun 3 Pro masih unggul dalam abstraksi tema besar.

Efisiensi TOC: Menggunakan input TOC (daftar cerita) alih-alih transkrip penuh menghemat biaya sekitar 2.5x - 3.6x, namun dengan sedikit penurunan kualitas narasi menyeluruh (kehilangan sinyal "perhatian" atau durasi tayang yang menandakan prioritas berita).

Keunikan Interpretasi: Tidak ada satu model "terbaik"; setiap model (bahkan varian Flash) menangkap nuansa tema yang sedikit berbeda namun valid, memberikan perspektif intelijen yang saling melengkapi.

Kemampuan Gemini 3 Flash: Varian Flash yang lebih murah dan cepat menunjukkan kinerja yang mengejutkan, hampir setara dengan model Pro berkat struktur prompt yang kuat.

⚙️ How to Implement (General Pattern)

Gunakan Prompt Terstruktur: Jangan hanya minta "ringkasan". Berikan peran spesifik ("Analis Intelijen Senior"), instruksi filter noise ("abaikan iklan"), dan struktur output yang kaku (BLUF, Deep Dive, Foresight).

Preprocessing Data: Untuk skala besar dan biaya rendah, gunakan model yang lebih murah untuk mengubah data mentah menjadi metadata terstruktur (seperti daftar cerita JSON) sebelum diumpankan ke model penalaran yang lebih mahal.

Bandingkan Output: Jangan mengandalkan satu model saja untuk keputusan kritis. Gunakan beberapa model untuk melihat sudut pandang analitis yang berbeda (misal: satu model fokus pada ekonomi, yang lain pada politik elit).

💡 Key Takeaways

Prompt Engineering > Model Power: Prompt yang dirancang dengan sangat baik dapat meningkatkan kinerja model lama (2.5 Pro) hingga hampir menyamai model terbaru (3 Pro).

Abstraksi adalah Kunci: Nilai utama AI dalam intelijen bukan pada peringkasan fakta, melainkan pada kemampuan menghubungkan titik-titik (misal: menghubungkan cuaca buruk dengan kegagalan kapasitas negara).

Biaya vs. Konteks: Menggunakan ringkasan (TOC) menghemat biaya, tapi menghilangkan konteks implisit (seperti nada bicara atau durasi segmen) yang penting untuk analisis sentimen mendalam.

🗣️ Apakah Anda lebih memprioritaskan biaya rendah atau kedalaman analisis dalam sistem monitoring berita Anda? Apakah hilangnya konteks non-verbal (seperti penekanan nada pembaca berita) merupakan pengorbanan yang dapat diterima demi efisiensi?

Sumber:
https://blog.gdeltproject.org/planetary-scale-deep-reasoning-building-our-final-presidential-daily-brief-prompt-comparing-gemini-3-2-5-pro-flash-asr-toc/

🏷️ #ArtificialIntelligence #Gemini #StrategicIntelligence #DataAnalysis #PromptEngineering #GDELT #OpenSourceIntelligence #OSINT #NewsMonitoring #LLM

Leave a Comment