đ Problem Statement
1. Bahasa SQL telah lama menjadi tulang punggung analitik data terstrukturânamun ketika kita masuk ke era data tak terstruktur (teks, gambar, video) dan AI generatif, SQL saja tidak cukup fleksibel.
2. Integrasi model besar (LLM) dengan alur SQL sering dibebani oleh pemindahan data, promptâengineering, pemilihan model, dan tuning parameterâyang mahal dan sulit di skala produksi.
3. Banyak pengguna data analitik ingin tetap di lingkungan SQL yang familiar namun butuh kemampuan âcerdasâ untuk memahami arti, kategori, rangkingâtidak hanya query berbasis angka atau string.
đ ïž Methodology / Solusi / Hypothesis
1. BigQuery memperkenalkan fungsiâAI terkelola (managed) dalam pratinjau publik: AI.IF, AI.CLASSIFY, dan AI.SCORE â memungkinkan pengguna memakai AI generatif langsung dalam query SQL tanpa memikirkan model atau prompt tuning.
2. Fungsiâfungsi ini memungkinkan:
a. AI.IF â filter atau join berdasar arti semantik atau kondisi bahasa alami.
b. AI.CLASSIFY â klasifikasi teks/gambar berdasarkan kategori yang ditentukan, di GROUP BY.
c. AI.SCORE â rangking baris data berdasarkan kriteria bahasa alami di ORDER BY.
3. Hipotesis: Dengan menyediakan fungsi AI yang disederhanakan dalam SQL, maka analis maupun engineer data bisa menjawab pertanyaan baru (tidak hanya âberapa jumlahâ tetapi âapa maksudnyaâ) dengan cepat, dan arsitektur analitik mereka menjadi lebih produktif.
đ Findings / Results / Impact
1. BigQuery mengoptimalkan prompt, pemilihan model, dan planning query secara internal sehingga pengguna tidak perlu melakukan tuning manual.
2. Artikel menyebut bahwa integrasi sudah memungkinkan untuk teks, gambar, dan data tak terstruktur lainnya â yang sebelumnya butuh pipeline terpisah.
3. Dengan fungsiâAI ini, barrier for entry bagi analis data maupun tim BI menurun â karena mereka tetap memakai SQL tetapi mendapatkan âreasoningâ dari AI.
đ§© How to Use (Examples)
1. AI.IF â Filter data berdasarkan makna (semantic filtering)
Contoh: ambil review yang bermakna positif, meskipun tidak menyebut kata âgood/positiveâ secara eksplisit.SELECT review_text
FROM reviews
WHERE AI.IF(review_text, "Is this review generally positive?")
Contoh lain: pilih produk yang âmirip dengan iPhone 15â.SELECT product_name
FROM catalog
WHERE AI.IF(description, "Does this describe a product similar to iPhone 15?")
2. AI.CLASSIFY â Klasifikasi otomatis untuk GROUP BY / kategori
Contoh: kelompokkan review ke kategori âcomplaintâ, âpraiseâ, atau âneutralâ.SELECT
AI.CLASSIFY(review_text, ["complaint", "praise", "neutral"]) AS category,
COUNT(*) AS total
FROM reviews
GROUP BY category
Contoh gambar (BigQuery mendukung image URL/base64):SELECT
AI.CLASSIFY(image_bytes, ["food", "receipt", "people"]) AS label,
COUNT(*)
FROM uploads
GROUP BY label;
3. AI.SCORE â Ranking dengan kriteria bahasa alami
Contoh: urutkan artikel berdasarkan âseberapa relevan dengan topik machine learningâ.SELECT
title,
AI.SCORE(content, "Rank this by relevance to machine learning") AS relevance
FROM articles
ORDER BY relevance DESC
Contoh lain: pilih 10 job posting paling cocok untuk âfresh graduate data analystâ.SELECT
job_id,
AI.SCORE(description, "How suitable is this job for a fresh graduate data analyst?") AS score
FROM job_postings
ORDER BY score DESC
LIMIT 10;
â
Key Takeaways
1. SQL tidak digantikanâjustru diperluas: dengan fungsiâAI, âquery dataâ sekarang bisa termasuk âapa maksudnyaâ atau âurut berdasarkan relevansiâ.
2. Jika Anda tim analitik atau data engineer: mulai pertimbangkan bagaimana workflow Anda bisa memakai AIâdriven filter, klasifikasi, dan rangking dalam pipeline data.
3. Fitur ini menunjukkan bahwa masa depan data warehouse adalah komprehensif: mampu mengelola data terstruktur + tak terstruktur, latihan analitik + reasoning, semua dalam satu lingkungan.
4. Meskipun preview dan fungsi masih berkembang, konsep ini memberi sinyal bahwa standar SQL akan terus berevolusi untuk era AI.
5. Bagi organisasi: ini adalah momen untuk mengevaluasi apakah data warehouse Anda hanya âmenyimpanâ data atau juga âmemahamiâ dataâapakah workflow Anda siap untuk hasilâanalitik yang lebih cerdas?
Sumber:
https://cloud.google.com/blog/products/data-analytics/sql-reimagined-for-the-ai-era-with-bigquery-ai-functions/
đ„ #BigQuery #SQLforAI #GenerativeAI #DataAnalytics #AIinSQL #CloudDataWarehouse #SemanticQuery #AIFunctions