RAG a znalostní báze – technická řešení
Popis
Stavba RAG systému od nuly – Supabase, pgvector, embeddingy, chunking, hybrid search, napojení na n8n. Kdy RAG, kdy stačí context window, kdy GraphRAG. Case study z reálného projektu pro realitní kancelář.
Oblasti: 🗄️ Firemní znalostní báze · 📞 Zákaznická komunikace · 🗣️ Voice AI · 🔗 Propojení firemních systémů
RAG a znalostní báze (16 hodin):
1. Proč RAG a jak funguje (1 hodina)
- problém velkých jazykových modelů: halucinace, zastaralá data, žádná firemní znalost
- co je RAG – princip: dotaz → vyhledání relevantních dat → generování odpovědi s kontextem
- RAG vs. fine-tuning vs. dlouhý context window – kdy co použít, rozhodovací framework
- architektura RAG systému: ingestion pipeline → vektorová databáze → retrieval → LLM → odpověď
- reálné use cases: firemní FAQ bot, zákaznická linka, interní znalostní báze, voice AI asistent
- case study: voice AI asistent pro realitní kancelář – co fungovalo, co ne a proč
2. Vektorové databáze a embedding modely (1 hodina)
- co jsou embeddingy – jak AI převádí text na čísla a proč to funguje
- přehled embedding modelů: OpenAI text-embedding-3, Cohere, open-source alternativy
- vektorové databáze: Supabase pgvector, Pinecone, Weaviate, Chroma – srovnání
- proč Supabase pgvector: PostgreSQL základ, SQL + vektorové vyhledávání, self-hosting, cena
- similarity search: cosine distance, inner product, L2 – kdy co použít
- praktická ukázka: vytvoření embeddingu z textu a vyhledání nejpodobnějšího dokumentu
3. Chunking strategie a příprava dat (1 hodina)
- proč je chunking klíčový – příliš velké i příliš malé chunky zhoršují výsledky
- strategie: fixed-size, sentence-based, recursive, semantic chunking
- metadata a enrichment: přidání kontextu ke chunkům (zdroj, datum, kategorie)
- práce s různými formáty: PDF, DOCX, HTML, e-maily, tabulky
- overlap a jeho vliv na kvalitu vyhledávání
- praktická ukázka: zpracování reálného firemního dokumentu různými chunking strategiemi
4. Hybridní vyhledávání a reranking (1 hodina)
- limity čistě vektorového vyhledávání – kdy selhává semantic search
- full-text search (BM25) vs. semantic search – silné a slabé stránky
- hybridní přístup: kombinace keyword + vector search v Supabase
- reranking: Cohere Rerank, cross-encoder modely – zpřesnění výsledků
- filtrování podle metadat: kategorie, datum, jazyk, zdroj
- praktická ukázka: stejný dotaz přes vector search, full-text search a hybrid – srovnání výsledků
5. Praktická stavba RAG systému (12 hodin)
Blok A – Nastavení infrastruktury (3 hodiny)
- založení Supabase projektu a konfigurace pgvector rozšíření
- návrh databázového schématu: tabulky, indexy, RLS (Row Level Security)
- vytvoření SQL funkcí pro vektorové vyhledávání (match_documents)
- napojení na n8n: webhook trigger, HTTP request nody, Supabase integrace
- testování: první vložení embeddingu a první vektorový dotaz
- troubleshooting: nejčastější chyby při nastavení (dimenze embeddingů, typy indexů)
Blok B – Ingestion pipeline: zpracování a indexace dokumentů (3 hodiny)
- stavba ingestion workflow v n8n: příjem dokumentu → extrakce textu → chunking → embedding → uložení
- práce s různými zdroji: PDF upload, webový scraping, e-mailová schránka, Google Drive
- automatický re-processing při aktualizaci dokumentů
- monitoring kvality: logování, detekce duplicit, verzování
- praktický workshop: účastníci naindexují vlastní dataset (firemní dokumenty, produktový katalog, FAQ)
Blok C – Retrieval pipeline a integrace s LLM (3 hodiny)
- stavba retrieval workflow: dotaz → embedding dotazu → vyhledání → sestavení kontextu → LLM
- prompt engineering pro RAG: system prompt, context injection, source attribution
- implementace hybridního vyhledávání v Supabase (SQL funkce pro hybrid search)
- napojení na LLM: OpenAI API, Claude API, lokální modely – srovnání pro RAG
- evaluace kvality odpovědí: relevance, faithfulness, hallucination detection
- praktický workshop: účastníci postaví kompletní retrieval pipeline nad svým datasetem
Blok D – Nasazení, škálování a závěrečný projekt (3 hodiny)
- výstupní kanály: chatbot na webu, voice AI (ElevenLabs + Twilio), Slack bot, interní portál
- ukázka napojení na voice AI: jak RAG systém odpovídá hlasem po telefonu (case study realitní kancelář)
- GDPR a bezpečnost: co smí do vektorové databáze, RLS, anonymizace, data retention
- provozní realita: monitoring, údržba, náklady, kdy se RAG vyplatí a kdy ne
- škálování: od prototypu k produkci – co se mění (indexy, caching, rate limiting)
- závěrečný projekt: účastníci dokončí a odprezentují funkční RAG systém nad vlastními daty
- zpětná vazba, doporučení pro nasazení v praxi, návazné zdroje




