RAG a znalostní báze – technická řešení

Kategorie:

Popis

Stavba RAG systému od nuly – Supabase, pgvector, embeddingy, chunking, hybrid search, napojení na n8n. Kdy RAG, kdy stačí context window, kdy GraphRAG. Case study z reálného projektu pro realitní kancelář.

Oblasti: 🗄️ Firemní znalostní báze · 📞 Zákaznická komunikace · 🗣️ Voice AI · 🔗 Propojení firemních systémů

RAG a znalostní báze (16 hodin):

1. Proč RAG a jak funguje (1 hodina)

  • problém velkých jazykových modelů: halucinace, zastaralá data, žádná firemní znalost
  • co je RAG – princip: dotaz → vyhledání relevantních dat → generování odpovědi s kontextem
  • RAG vs. fine-tuning vs. dlouhý context window – kdy co použít, rozhodovací framework
  • architektura RAG systému: ingestion pipeline → vektorová databáze → retrieval → LLM → odpověď
  • reálné use cases: firemní FAQ bot, zákaznická linka, interní znalostní báze, voice AI asistent
  • case study: voice AI asistent pro realitní kancelář – co fungovalo, co ne a proč

2. Vektorové databáze a embedding modely (1 hodina)

  • co jsou embeddingy – jak AI převádí text na čísla a proč to funguje
  • přehled embedding modelů: OpenAI text-embedding-3, Cohere, open-source alternativy
  • vektorové databáze: Supabase pgvector, Pinecone, Weaviate, Chroma – srovnání
  • proč Supabase pgvector: PostgreSQL základ, SQL + vektorové vyhledávání, self-hosting, cena
  • similarity search: cosine distance, inner product, L2 – kdy co použít
  • praktická ukázka: vytvoření embeddingu z textu a vyhledání nejpodobnějšího dokumentu

3. Chunking strategie a příprava dat (1 hodina)

  • proč je chunking klíčový – příliš velké i příliš malé chunky zhoršují výsledky
  • strategie: fixed-size, sentence-based, recursive, semantic chunking
  • metadata a enrichment: přidání kontextu ke chunkům (zdroj, datum, kategorie)
  • práce s různými formáty: PDF, DOCX, HTML, e-maily, tabulky
  • overlap a jeho vliv na kvalitu vyhledávání
  • praktická ukázka: zpracování reálného firemního dokumentu různými chunking strategiemi

4. Hybridní vyhledávání a reranking (1 hodina)

  • limity čistě vektorového vyhledávání – kdy selhává semantic search
  • full-text search (BM25) vs. semantic search – silné a slabé stránky
  • hybridní přístup: kombinace keyword + vector search v Supabase
  • reranking: Cohere Rerank, cross-encoder modely – zpřesnění výsledků
  • filtrování podle metadat: kategorie, datum, jazyk, zdroj
  • praktická ukázka: stejný dotaz přes vector search, full-text search a hybrid – srovnání výsledků

5. Praktická stavba RAG systému (12 hodin)

Blok A – Nastavení infrastruktury (3 hodiny)

  • založení Supabase projektu a konfigurace pgvector rozšíření
  • návrh databázového schématu: tabulky, indexy, RLS (Row Level Security)
  • vytvoření SQL funkcí pro vektorové vyhledávání (match_documents)
  • napojení na n8n: webhook trigger, HTTP request nody, Supabase integrace
  • testování: první vložení embeddingu a první vektorový dotaz
  • troubleshooting: nejčastější chyby při nastavení (dimenze embeddingů, typy indexů)

Blok B – Ingestion pipeline: zpracování a indexace dokumentů (3 hodiny)

  • stavba ingestion workflow v n8n: příjem dokumentu → extrakce textu → chunking → embedding → uložení
  • práce s různými zdroji: PDF upload, webový scraping, e-mailová schránka, Google Drive
  • automatický re-processing při aktualizaci dokumentů
  • monitoring kvality: logování, detekce duplicit, verzování
  • praktický workshop: účastníci naindexují vlastní dataset (firemní dokumenty, produktový katalog, FAQ)

Blok C – Retrieval pipeline a integrace s LLM (3 hodiny)

  • stavba retrieval workflow: dotaz → embedding dotazu → vyhledání → sestavení kontextu → LLM
  • prompt engineering pro RAG: system prompt, context injection, source attribution
  • implementace hybridního vyhledávání v Supabase (SQL funkce pro hybrid search)
  • napojení na LLM: OpenAI API, Claude API, lokální modely – srovnání pro RAG
  • evaluace kvality odpovědí: relevance, faithfulness, hallucination detection
  • praktický workshop: účastníci postaví kompletní retrieval pipeline nad svým datasetem

Blok D – Nasazení, škálování a závěrečný projekt (3 hodiny)

  • výstupní kanály: chatbot na webu, voice AI (ElevenLabs + Twilio), Slack bot, interní portál
  • ukázka napojení na voice AI: jak RAG systém odpovídá hlasem po telefonu (case study realitní kancelář)
  • GDPR a bezpečnost: co smí do vektorové databáze, RLS, anonymizace, data retention
  • provozní realita: monitoring, údržba, náklady, kdy se RAG vyplatí a kdy ne
  • škálování: od prototypu k produkci – co se mění (indexy, caching, rate limiting)
  • závěrečný projekt: účastníci dokončí a odprezentují funkční RAG systém nad vlastními daty
  • zpětná vazba, doporučení pro nasazení v praxi, návazné zdroje