|

RAG: AI yang Bisa Mencari Dokumen Sebelum Menjawab

RAG adalah salah satu fondasi penting dalam belajar AI engineering. Materi ini disusun ulang dalam bahasa Indonesia dari gagasan besar kurikulum AI Engineering from Scratch: memahami konsep dari dasar, mengerti alasan matematisnya, lalu baru memakai framework atau tools modern.

RAG atau Retrieval-Augmented Generation adalah pola sistem AI yang mencari dokumen relevan terlebih dahulu sebelum menghasilkan jawaban. Model tidak hanya mengandalkan pengetahuan bawaan, tetapi diberi konteks tambahan dari sumber yang dipilih sistem.

Kenapa materi ini penting?

RAG penting karena pengetahuan model bisa usang atau tidak mencakup dokumen internal. Dengan RAG, perusahaan bisa membuat chatbot yang menjawab berdasarkan SOP, FAQ, kontrak, artikel, atau knowledge base terbaru tanpa melatih ulang model setiap saat.

Cara kerjanya secara sederhana

Alurnya dimulai dari dokumen yang dipecah menjadi chunk. Tiap chunk dibuat embedding dan disimpan di vector database. Saat user bertanya, pertanyaan juga dibuat embedding, lalu sistem mencari chunk paling relevan. Chunk tersebut dimasukkan ke prompt agar model menjawab berdasarkan konteks.

Hal utama yang perlu dipahami

  • RAG menggabungkan retrieval dan generation.
  • Chunking menentukan kualitas konteks yang ditemukan.
  • Embedding membantu pencarian semantik.
  • Jawaban sebaiknya menyertakan sumber atau referensi.
  • Evaluasi perlu mengecek retrieval dan jawaban akhir.

Kesalahan umum pemula

  • Memasukkan dokumen tanpa membersihkan format.
  • Chunk terlalu besar sehingga konteks melebar.
  • Tidak menyimpan metadata sumber.
  • Tidak mengecek apakah jawaban benar-benar didukung dokumen.

Contoh penggunaan nyata

RAG banyak dipakai untuk helpdesk, chatbot dokumen, pencarian kebijakan internal, legal research, dan asisten belajar. Dengan RAG, AI bisa lebih mudah diaudit karena jawabannya dikaitkan ke sumber yang jelas.

Latihan kecil

Ambil lima dokumen pendek. Pecah menjadi beberapa chunk, beri judul, lalu tulis pertanyaan untuk tiap dokumen. Cek apakah sistem bisa mengambil chunk yang benar sebelum model menjawab.

Ringkasan

Untuk belajar AI dengan kuat, jangan hanya menghafal istilah. Coba pahami input, proses, output, dan cara mengevaluasi hasilnya. Pendekatan seperti ini membuat Anda lebih siap saat nanti memakai model besar, membangun RAG, melakukan fine-tuning, atau membuat agent yang menjalankan tugas bertahap.

Apa itu RAG?

<p>RAG adalah singkatan dari Retrieval-Augmented Generation. Ini adalah arsitektur AI yang menggabungkan pencarian informasi (retrieval) dengan pembuatan teks (generation). Sebelum menjawab pertanyaan, sistem RAG mencari dokumen relevan dari basis pengetahuan, lalu memberikan dokumen tersebut sebagai konteks ke model bahasa untuk menghasilkan jawaban. Pendekatan ini membuat jawaban lebih akurat dan bisa dilacak sumbernya.</p>

Kenapa RAG penting?

<p>Model bahasa memiliki batasan pengetahuan yang tertahan di data training. Model yang dilatih tahun 2025 tidak tahu peristiwa tahun 2026. RAG memecahkan masalah ini dengan memberikan akses ke informasi terbaru tanpa perlu melatih ulang model. RAG juga membantu mengurangi halusinasi karena model bisa merujuk pada sumber yang diberikan, bukan mengandalkan ingatan yang mungkin salah. Untuk aplikasi enterprise, RAG adalah standar industri saat ini.</p>

Komponen RAG

<p>Sistem RAG memiliki tiga komponen utama. Pertama, indexing: dokumen dipecah menjadi chunk, di-embedding, dan disimpan di vector database. Kedua, retrieval: saat ada pertanyaan, sistem mencari chunk yang paling relevan berdasarkan kesamaan vektor embedding. Ketiga, generation: model bahasa menerima pertanyaan plus chunk yang ditemukan, lalu menghasilkan jawaban berdasarkan konteks tersebut. Setiap komponen bisa dioptimasi secara terpisah untuk meningkatkan kualitas hasil.</p>

RAG di Indonesia

<p>Untuk bahasa Indonesia, RAG punya tantangan tersendiri. Kualitas embedding untuk bahasa Indonesia mungkin kurang optimal jika menggunakan model embedding berbahasa Inggris. Alternatifnya, gunakan model embedding multilingual atau yang sudah dilatih dengan data Indonesia. Basis pengetahuan juga perlu dokumen berbahasa Indonesia yang berkualitas. Beberapa perusahaan sudah mulai membangun RAG untuk customer service berbahasa Indonesia dengan hasil yang menjanjikan.</p>

Latihan

<p>AIEngineeringFromScratch mencakup implementasi RAG. Coba bangun RAG sederhana dengan mengambil 5 dokumen tentang AI, simpan di vector database lokal (gunakan ChromaDB atau FAISS), lalu buat sistem tanya jawab yang merujuk pada dokumen-dokumen tersebut. Uji dengan pertanyaan yang jawabannya ada di dokumen dan lihat bagaimana RAG bisa memberikan jawaban yang akurat beserta sumbernya.</p>

Vector Database untuk RAG

Vector database adalah jantung dari RAG. Database ini menyimpan embedding vektor dan menyediakan pencarian kemiripan (similarity search) yang efisien. Pilihan populer termasuk Pinecone (managed), Weaviate (self-hosted), Qdrant (ringan), ChromaDB (untuk prototyping), dan FAISS (library dari Facebook). Setiap database memiliki trade-off antara performa, skalabilitas, dan kemudahan penggunaan. Untuk proyek kecil, ChromaDB atau FAISS sudah cukup. Untuk produksi, pertimbangkan Pinecone atau Weaviate.

Chunking Strategy

Cara memotong dokumen menjadi chunk sangat memengaruhi kualitas RAG. Chunk yang terlalu kecil kehilangan konteks; chunk yang terlalu besar mengandung informasi tidak relevan. Strategi umum: chunk berdasarkan paragraf (200-500 kata) dengan overlap 10-20% antar chunk untuk menjaga kontinuitas. Untuk dokumen terstruktur, chunk berdasarkan section. Untuk kode, chunk berdasarkan fungsi atau kelas. Eksperimen dengan ukuran dan strategi chunking yang berbeda untuk menemukan yang optimal.

RAG untuk Dokumen Bahasa Indonesia

Implementasi RAG untuk dokumen berbahasa Indonesia punya tantangan unik. Model embedding multibahasa seperti multilingual-e5 atau LaBSE bisa digunakan, tetapi mungkin kurang optimal dibandingkan embedding spesifik Indonesia. Alternatif lain adalah menggunakan model embedding dari IndoBERT atau Indonesian Sentence Embedding. Untuk basis pengetahuan, kumpulkan dokumen berkualitas dari sumber terpercaya seperti situs pemerintah, portal berita, dan repositori akademik Indonesia.

Hybrid Search: Keyword + Semantic

Untuk hasil retrieval yang lebih baik, kombinasikan pencarian keyword (BM25) dengan pencarian semantik (embedding). BM25 bagus untuk mencocokkan kata kunci persis seperti nama produk atau istilah teknis. Embedding bagus untuk menangkap makna dan sinonim. Gabungkan kedua hasil dengan weighted sum (misal 0.3 BM25 + 0.7 semantik). Pendekatan hybrid ini secara konsisten mengalahkan salah satu metode saja di berbagai benchmark.

Evaluasi Kualitas RAG

Mengukur kualitas RAG penting untuk improvement. Metrik utama: faithfulness (apakah jawaban berdasarkan konteks, bukan halusinasi), relevance (apakah jawaban relevan dengan pertanyaan), dan completeness (apakah semua informasi yang dibutuhkan tersedia). Gunakan dataset test dengan pertanyaan dan jawaban referensi. Hitung metrik seperti ROUGE, BLEU, atau gunakan LLM-as-judge untuk evaluasi otomatis. A/B testing dengan user nyata juga penting.

Masa Depan RAG

RAG terus berkembang. Tren terkini termasuk: Agentic RAG (agent loop yang bisa memutuskan kapan perlu retrieval), Self-RAG (model mengecek sendiri apakah jawaban perlu didukung retrieval), dan Multi-modal RAG (retrieval untuk teks + gambar + tabel). RAG juga semakin terintegrasi dengan tool calling, di mana model bisa memanggil API untuk mendapatkan data real-time. Diperkirakan RAG akan menjadi arsitektur standar untuk sebagian besar aplikasi AI enterprise dalam 2-3 tahun ke depan.

class=”wp-block-heading”>Sumber

AI Engineering from Scratch · Referensi kurikulum

Penjelasan Tambahan untuk Pemula

Jika Anda baru belajar AI, jangan mencoba memahami semuanya sekaligus. Fokuslah pada konsep inti: AI membantu memproses informasi, membuat prediksi, menghasilkan teks/gambar/kode, dan membantu mengambil langkah berdasarkan instruksi. Semakin jelas instruksi yang diberikan, semakin besar peluang AI menghasilkan output yang berguna.

Belajar AI paling efektif dilakukan lewat praktik kecil. Pilih satu kebutuhan nyata, misalnya meringkas artikel, membuat jadwal belajar, menyusun email, membuat ide konten, atau memahami kode sederhana. Setelah itu bandingkan hasil AI dengan pengetahuan Anda sendiri dan perbaiki prompt secara bertahap.

Latihan Praktis

  • Minta AI menjelaskan topik ini untuk anak SMA.
  • Minta AI membuat contoh penggunaan dalam pekerjaan sehari-hari.
  • Minta AI membuat tabel kelebihan dan kekurangan.
  • Minta AI membuat 5 pertanyaan kuis untuk menguji pemahaman Anda.
  • Minta AI mengubah penjelasan menjadi langkah praktis.

Latihan seperti ini membantu Anda memahami bukan hanya jawaban AI, tetapi juga cara mengarahkan AI agar lebih bermanfaat.

Tips Belajar Berkelanjutan

Catat prompt yang berhasil, simpan contoh output yang bagus, dan perhatikan pola instruksi yang membuat jawaban lebih akurat. Jangan terlalu cepat berganti tools. Kuasai dasar penggunaan satu atau dua tools terlebih dahulu, lalu baru eksplorasi tools lain sesuai kebutuhan.

Penjelasan Tambahan untuk Pemula

Jika Anda baru belajar AI, jangan mencoba memahami semuanya sekaligus. Fokuslah pada konsep inti: AI membantu memproses informasi, membuat prediksi, menghasilkan teks/gambar/kode, dan membantu mengambil langkah berdasarkan instruksi. Semakin jelas instruksi yang diberikan, semakin besar peluang AI menghasilkan output yang berguna.

Belajar AI paling efektif dilakukan lewat praktik kecil. Pilih satu kebutuhan nyata, misalnya meringkas artikel, membuat jadwal belajar, menyusun email, membuat ide konten, atau memahami kode sederhana. Setelah itu bandingkan hasil AI dengan pengetahuan Anda sendiri dan perbaiki prompt secara bertahap.

Latihan Praktis

  • Minta AI menjelaskan topik ini untuk anak SMA.
  • Minta AI membuat contoh penggunaan dalam pekerjaan sehari-hari.
  • Minta AI membuat tabel kelebihan dan kekurangan.
  • Minta AI membuat 5 pertanyaan kuis untuk menguji pemahaman Anda.
  • Minta AI mengubah penjelasan menjadi langkah praktis.

Latihan seperti ini membantu Anda memahami bukan hanya jawaban AI, tetapi juga cara mengarahkan AI agar lebih bermanfaat.

Tips Belajar Berkelanjutan

Catat prompt yang berhasil, simpan contoh output yang bagus, dan perhatikan pola instruksi yang membuat jawaban lebih akurat. Jangan terlalu cepat berganti tools. Kuasai dasar penggunaan satu atau dua tools terlebih dahulu, lalu baru eksplorasi tools lain sesuai kebutuhan.

Penjelasan Tambahan untuk Pemula

Jika Anda baru belajar AI, jangan mencoba memahami semuanya sekaligus. Fokuslah pada konsep inti: AI membantu memproses informasi, membuat prediksi, menghasilkan teks/gambar/kode, dan membantu mengambil langkah berdasarkan instruksi. Semakin jelas instruksi yang diberikan, semakin besar peluang AI menghasilkan output yang berguna.

Belajar AI paling efektif dilakukan lewat praktik kecil. Pilih satu kebutuhan nyata, misalnya meringkas artikel, membuat jadwal belajar, menyusun email, membuat ide konten, atau memahami kode sederhana. Setelah itu bandingkan hasil AI dengan pengetahuan Anda sendiri dan perbaiki prompt secara bertahap.

Latihan Praktis

  • Minta AI menjelaskan topik ini untuk anak SMA.
  • Minta AI membuat contoh penggunaan dalam pekerjaan sehari-hari.
  • Minta AI membuat tabel kelebihan dan kekurangan.
  • Minta AI membuat 5 pertanyaan kuis untuk menguji pemahaman Anda.
  • Minta AI mengubah penjelasan menjadi langkah praktis.

Latihan seperti ini membantu Anda memahami bukan hanya jawaban AI, tetapi juga cara mengarahkan AI agar lebih bermanfaat.

Tips Belajar Berkelanjutan

Catat prompt yang berhasil, simpan contoh output yang bagus, dan perhatikan pola instruksi yang membuat jawaban lebih akurat. Jangan terlalu cepat berganti tools. Kuasai dasar penggunaan satu atau dua tools terlebih dahulu, lalu baru eksplorasi tools lain sesuai kebutuhan.

Lanjut Belajar AI

Jika artikel ini membantu, lanjutkan ke materi terstruktur agar pemahaman AI lebih rapi dan praktis.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *