📌 Problem Statement
1. Untuk banyak agen AI, kebutuhan bukan hanya “menjawab satu pertanyaan”, tetapi “menemukan dan mengumpulkan banyak entitas (perusahaan, orang, lokasi) dari web” dengan cara yang terstruktur — namun tradisional data-set statis tidak fleksibel.
2. Data statis cepat kedaluwarsa dan sulit untuk mencakup kriteria spesifik yang dibutuhkan agen atau aplikasi — sehingga banyak proyek data enrichment terhambat oleh kebutuhan “dataset custom real-time”.
3. Agen AI membutuhkan data yang siap pakai (structured, dengan kutipan sumber) agar hasilnya dapat dipercaya — bukan sekadar feed bebas tanpa verifikasi.
🛠️ Methodology / Solusi / Hypothesis
1. Parallel memperkenalkan FindAll API yang memungkinkan pengguna:
a. Menulis query bahasa alami, seperti “find all fintech startups in Berlin founded after 2018 with Series A funding”.
b. Sistem kemudian mencari web secara terstruktur, mengumpulkan entitas yang cocok, memperkaya dengan metadata, dan memberikan dataset siap konsumsi dalam format yang bisa langsung digunakan oleh agen atau pipeline.
2. Solusi teknis mencakup index web besar, ekstraksi data terstruktur, dan output yang sudah dilengkapi dengan atribusi (sumber) serta metrik recall yang tinggi.
3. Hipotesis: Dengan output “dataset on demand” yang siap digunakan, builder agen AI dapat mengurangi waktu pengumpulan data secara manual, mempercepat iterasi, dan memiliki data yang lebih relevan serta dapat diverifikasi.
📊 Findings / Results / Impact
1. FindAll API dilapor dapat mencapai 61% recall untuk dataset hasil query kompleks — angka ini disebut “3× lebih baik dari pesaing” dalam konteks pembentukan dataset custom.
2. Karena dataset bisa dibangun dengan cepat berdasarkan kriteria spesifik, tim AI dan data dapat mempercepat langkah dari “eksplorasi data” ke “pengembangan model/agen” secara lebih efisien.
3. Output sudah dilengkapi dengan atribusi sumber sehingga cocok untuk use-case yang memerlukan audit, verifikasi, atau traceability — penting untuk enterprise & regulator.
4. Dengan menyediakan layer ini sebagai API, Parallel memperkuat posisi sebagai “infra web untuk agen AI” — tidak hanya search / chat, tetapi juga enrichment dan dataset building.
đź§© How to Use (Contoh Praktis)
1. Dapatkan API key dari platform Parallel (https://platform.parallel.ai) dan akses endpoint FindAll:
curl https://api.parallel.ai/v1/findall \
-H “Content-Type: application/json” \
-H “x-api-key: $PARALLEL_API_KEY” \
-d ‘{
“query”: “fintech startups in Berlin founded after 2018 Series A”,
“max_entities”: 50,
“fields”: [“name”, “founding_year”, “funding_stage”, “city”, “website”]
}’
— API kemudian mengembalikan daftar entitas, dengan atribut sesuai yang diminta, dan link sumber masing-masing.
2. Gunakan dalam pipeline agen:
Agen AI menerima dataset dari FindAll →
Lakukan filter/tanda prioritas →
Jalankan analisis lebih lanjut atau automasi berdasarkan entitas dan metadata.
3. Integrasi ke workflow:
Ide: “Buat daftar 100 prospek perusahaan SaaS di Eropa dengan revenue < $10M dan potensi akuisisi” → gunakan FindAll → hasil → feed ke agent email outreach atau pipeline M&A.
4. Monitoring & refresh: Karena data web selalu berubah, jadwalkan ulang query periodik untuk menjaga dataset tetap segar.
âś… Key Takeaways
1. Agen AI sukses tidak hanya soal model dan prompt — data yang tepat dan waktu pengumpulannya sangat penting.
2. FindAll API mengisi gap besar: dataset khusus yang dibuat on-demand berdasarkan kriteria, bukan mengambil dataset statis lama.
3. Builder agen dan tim data sebaiknya mempertimbangkan layanan seperti ini untuk menghemat waktu dan meningkatkan relevansi data.
4. Fitur atribusi dan recall tinggi membuat penggunaan API ini layak untuk enterprise yang memerlukan trust dan audit trail.
5. Dengan menyediakan dataset sebagai service, Parallel memperkuat tren “infrastructure layer” untuk agen AI — bukan hanya model.
Sumber:
https://parallel.ai/blog/introducing-findall-api
🔥 #ParallelAI #FindAllAPI #AIagents #WebDataInfrastructure #DatasetAsService #DeepResearch #DataEnrichment #AgenticAI