🚀 “SQL Direkayasa Ulang untuk Era AI dengan Fungsi-Fungsi AI di BigQuery”

📌 Problem Statement
1. Bahasa SQL telah lama menjadi tulang punggung analitik data terstruktur—namun ketika kita masuk ke era data tak terstruktur (teks, gambar, video) dan AI generatif, SQL saja tidak cukup fleksibel.
2. Integrasi model besar (LLM) dengan alur SQL sering dibebani oleh pemindahan data, prompt‐engineering, pemilihan model, dan tuning parameter—yang mahal dan sulit di skala produksi.
3. Banyak pengguna data analitik ingin tetap di lingkungan SQL yang familiar namun butuh kemampuan “cerdas” untuk memahami arti, kategori, rangking—tidak hanya query berbasis angka atau string.

🛠️ Methodology / Solusi / Hypothesis
1. BigQuery memperkenalkan fungsi‐AI terkelola (managed) dalam pratinjau publik: AI.IF, AI.CLASSIFY, dan AI.SCORE — memungkinkan pengguna memakai AI generatif langsung dalam query SQL tanpa memikirkan model atau prompt tuning.
2. Fungsi‐fungsi ini memungkinkan:
a. AI.IF → filter atau join berdasar arti semantik atau kondisi bahasa alami.
b. AI.CLASSIFY → klasifikasi teks/gambar berdasarkan kategori yang ditentukan, di GROUP BY.
c. AI.SCORE → rangking baris data berdasarkan kriteria bahasa alami di ORDER BY.
3. Hipotesis: Dengan menyediakan fungsi AI yang disederhanakan dalam SQL, maka analis maupun engineer data bisa menjawab pertanyaan baru (tidak hanya “berapa jumlah” tetapi “apa maksudnya”) dengan cepat, dan arsitektur analitik mereka menjadi lebih produktif.

📊 Findings / Results / Impact
1. BigQuery mengoptimalkan prompt, pemilihan model, dan planning query secara internal sehingga pengguna tidak perlu melakukan tuning manual.
2. Artikel menyebut bahwa integrasi sudah memungkinkan untuk teks, gambar, dan data tak terstruktur lainnya — yang sebelumnya butuh pipeline terpisah.
3. Dengan fungsi‐AI ini, barrier for entry bagi analis data maupun tim BI menurun — karena mereka tetap memakai SQL tetapi mendapatkan “reasoning” dari AI.

🧩 How to Use (Examples)
1. AI.IF — Filter data berdasarkan makna (semantic filtering)
Contoh: ambil review yang bermakna positif, meskipun tidak menyebut kata “good/positive” secara eksplisit.
SELECT review_text
FROM reviews
WHERE AI.IF(review_text, "Is this review generally positive?")

Contoh lain: pilih produk yang “mirip dengan iPhone 15”.
SELECT product_name
FROM catalog
WHERE AI.IF(description, "Does this describe a product similar to iPhone 15?")

2. AI.CLASSIFY — Klasifikasi otomatis untuk GROUP BY / kategori
Contoh: kelompokkan review ke kategori “complaint”, “praise”, atau “neutral”.
SELECT
AI.CLASSIFY(review_text, ["complaint", "praise", "neutral"]) AS category,
COUNT(*) AS total
FROM reviews
GROUP BY category

Contoh gambar (BigQuery mendukung image URL/base64):
SELECT
AI.CLASSIFY(image_bytes, ["food", "receipt", "people"]) AS label,
COUNT(*)
FROM uploads
GROUP BY label;

3. AI.SCORE — Ranking dengan kriteria bahasa alami
Contoh: urutkan artikel berdasarkan “seberapa relevan dengan topik machine learning”.
SELECT
title,
AI.SCORE(content, "Rank this by relevance to machine learning") AS relevance
FROM articles
ORDER BY relevance DESC

Contoh lain: pilih 10 job posting paling cocok untuk “fresh graduate data analyst”.
SELECT
job_id,
AI.SCORE(description, "How suitable is this job for a fresh graduate data analyst?") AS score
FROM job_postings
ORDER BY score DESC
LIMIT 10;


✅ Key Takeaways
1. SQL tidak digantikan—justru diperluas: dengan fungsi‐AI, “query data” sekarang bisa termasuk “apa maksudnya” atau “urut berdasarkan relevansi”.
2. Jika Anda tim analitik atau data engineer: mulai pertimbangkan bagaimana workflow Anda bisa memakai AI‐driven filter, klasifikasi, dan rangking dalam pipeline data.
3. Fitur ini menunjukkan bahwa masa depan data warehouse adalah komprehensif: mampu mengelola data terstruktur + tak terstruktur, latihan analitik + reasoning, semua dalam satu lingkungan.
4. Meskipun preview dan fungsi masih berkembang, konsep ini memberi sinyal bahwa standar SQL akan terus berevolusi untuk era AI.
5. Bagi organisasi: ini adalah momen untuk mengevaluasi apakah data warehouse Anda hanya “menyimpan” data atau juga “memahami” data—apakah workflow Anda siap untuk hasil‐analitik yang lebih cerdas?

Sumber:
https://cloud.google.com/blog/products/data-analytics/sql-reimagined-for-the-ai-era-with-bigquery-ai-functions/

🔥 #BigQuery #SQLforAI #GenerativeAI #DataAnalytics #AIinSQL #CloudDataWarehouse #SemanticQuery #AIFunctions

Leave a Comment