🧠 Bukan Sekadar Hype: AI Sedang “Merenovasi” Ulang Struktur Ekonomi Kita! πŸ’Έ

Simon Taylor dari Fintech Brainfood baru saja merilis analisis yang wajib dibaca. Jangan terjebak sama euforia ChatGPT; perubahan yang sebenarnya terjadi jauh lebih dalam. AI sedang mengubah struktur biaya dari ekonomi itu sendiri.Ini bedahannya: 1. ⚠️ Problem Statement (Masalah) * The Productivity Paradox: Selama dekade terakhir, meskipun teknologi makin canggih (Cloud, SaaS), pertumbuhan produktivitas global … Read more🧠 Bukan Sekadar Hype: AI Sedang “Merenovasi” Ulang Struktur Ekonomi Kita! πŸ’Έ

πŸ¦† DuckDB: Kecil-Kecil Cabe Rawit, Rahasianya di Optimizer!

DuckDB lagi naik daun banget sebagai “SQLite-nya OLAP”. Bisa proses data bergiga-giga di laptop lokal dengan kecepatan kilat. Tapi, kok bisa secepat itu? πŸ€” Jawabannya bukan cuma di format penyimpanan (Parquet/Columnar), tapi di otak cerdasnya: Query Optimizer. Mari kita bedah cara kerjanya berdasarkan artikel Alibaba Cloud “DuckDB Internals”! πŸ‘‡ πŸ›‘ 1. The Problem (Masalah Utama)SQL … Read moreπŸ¦† DuckDB: Kecil-Kecil Cabe Rawit, Rahasianya di Optimizer!

πŸ‡¨πŸ‡³βœˆοΈπŸ‡ΊπŸ‡Έ Demi AI, Raksasa Tech China “Kabur” ke Silicon Valley? (Plot Twist Geopolitik)

Perang dagang AS-China makin panas, tapi ironisnya, perusahaan teknologi China justru ramai-ramai buka kantor rahasia di halaman belakang Amerika. Laporan Yahoo Finance membongkar strategi “gerilya” ini.Ini bedahannya: 1. ⚠️ Problem Statement (Masalah) * Talent Crunch: Talenta AI terbaik dunia masih terkonsentrasi di Bay Area (San Francisco/Silicon Valley). China kesulitan merekrut mereka untuk pindah ke Beijing … Read moreπŸ‡¨πŸ‡³βœˆοΈπŸ‡ΊπŸ‡Έ Demi AI, Raksasa Tech China “Kabur” ke Silicon Valley? (Plot Twist Geopolitik)

πŸš‘ PostgreSQL Masuk UGD? Kenalan dengan pgFirstAid!

Mimpi buruk terbesar seorang DBA atau Backend Engineer: Database corrupt, log isinya PANIC: page verification failed, dan backup terakhir ternyata rusak. 😱Sebelum kalian menyerah dan kehilangan data, ada satu repository di GitHub yang berfungsi sebagai “Defibrillator” untuk Postgres kalian. Namanya pgFirstAid.Mari kita bedah isinya! πŸ‘‡ πŸ›‘ 1. The Problem (Masalah Utama)PostgreSQL didesain untuk sangat ketat … Read moreπŸš‘ PostgreSQL Masuk UGD? Kenalan dengan pgFirstAid!

🏎️ Pelajaran Mahal Developer AI: Jangan Bikin AI Pinter Dulu, Bikin Cepat Dulu! πŸ“‰

Sering nemu aplikasi AI yang jawabnya super pinter, tapi loading-nya bikin emosi (bisa 10-20 detik)? Ternyata itu kesalahan fatal dalam desain produk.Artikel dari Kix.dev berjudul “First make it fast, then make it smart” membongkar kenapa obsesi kita sama model tercanggih (GPT-4/Opus) justru membunuh UX.Ini bedahannya: πŸ”— Baca Artikelnya: https://kix.dev/first-make-it-fast-then-make-it-smart/Β  #AIEngineering #UXDesign #ProductManagement #Latency #DevOps #SoftwareArchitecture … Read more🏎️ Pelajaran Mahal Developer AI: Jangan Bikin AI Pinter Dulu, Bikin Cepat Dulu! πŸ“‰

Jupyter Matlab kernel

Buat teman2 di tanah air yang belum beruntung utk mengakses matlab di kampus/sekolahnya (karena lisensinya yang mahal), bisa akses gratis matlab kernel (lisensi TUD) di mesin saya (4 core CPU, 16 GB RAM), url: https://datasainslab.com/matlab. Untuk pake kernel matlab harus bisa menggunakan jupyter (coba cek manualnya di: https://jupyter-notebook.readthedocs.io/en/stable/). Sebagai starter, ada bbrp contoh di folder … Read moreJupyter Matlab kernel

Home Lab

I like to learn something new everyday, whether it is related to my PhD research (big data value creation) or not. I have investigated and learned many big data artifacts in multiple layers, i.e., Openstack, OpenFlow, Cumulus VX, VSphere, HPC, etc. in technology/infrastructure layer MPP/distributed solutions such as Hadoop, Spark, Elasticsearch, Kafka, MapD etc. in … Read moreHome Lab

Benchmark Python’s Dataframe: Pandas vs. Datatable vs. PySpark SQL

Setup Machine: 16-thread Xeon 2.6 GHz, 32 GB RAM, NVME PCIx16 System: Ubuntu 16.04, Spark 2.4.4, Python 3.7.4, Pandas 0.25.1, Datatable 0.10.1 Data: 100 million rows generated CSV (1.6 GB gzip compressed) Operation: Create a dataframe from a compressed file Group the dataframe by 3 columns Aggregate 2 different columns with 2 different function (group … Read moreBenchmark Python’s Dataframe: Pandas vs. Datatable vs. PySpark SQL

Google BigQuery, a serverless Datawarehouse-as-a-Service to batch query huge datasets (Part 2)

Contents How to use GBQ Note that the data should be located in Google cloud, whether in Google Cloud Storage, Google Drive, Cloud BigTable, or output from any Google’s SaaS. Google BigQuery also provides a number of public datasets that make users easier to combine instantly with their own dataset such as NOAA, Bitcoin, WorldBank, … Read moreGoogle BigQuery, a serverless Datawarehouse-as-a-Service to batch query huge datasets (Part 2)

Apache Hadoop: What is that & how to install and use it? (Part 2)

Part 2: How to install a standalone Hadoop Now, we are going to install a standalone Hadoop. The easiest way is to use VM sandbox provided by vendors such as Hortonworks/Cloudera and MapR. However, since the sandbox has many components (not only Hadoop, but also HBase, Spark, Hive, Oozie, etc.), it requires substantial resources (4 … Read moreApache Hadoop: What is that & how to install and use it? (Part 2)