RAG a znalostní báze – technická řešení

Kategorie: Školení

Popis

Popis

Stavba RAG systému od nuly – Supabase, pgvector, embeddingy, chunking, hybrid search, napojení na n8n. Kdy RAG, kdy stačí context window, kdy GraphRAG. Case study z reálného projektu pro realitní kancelář.

Oblasti: 🗄️ firemní znalostní báze · 📞 zákaznická komunikace · 🗣️ voice AI · 🔗 propojení firemních systémů

RAG a znalostní báze (16 hodin):

1. Proč RAG a jak funguje (1 hodina)

problém velkých jazykových modelů: halucinace, zastaralá data, žádná firemní znalost
co je RAG – princip: dotaz → vyhledání relevantních dat → generování odpovědi s kontextem
RAG vs. fine-tuning vs. dlouhý context window – kdy co použít, rozhodovací framework
architektura RAG systému: ingestion pipeline → vektorová databáze → retrieval → LLM → odpověď
reálné use cases: firemní FAQ bot, zákaznická linka, interní znalostní báze, voice AI asistent
case study: voice AI asistent pro realitní kancelář – co fungovalo, co ne a proč

2. Vektorové databáze a embedding modely (1 hodina)

co jsou embeddingy – jak AI převádí text na čísla a proč to funguje
přehled embedding modelů: OpenAI text-embedding-3, Cohere, open-source alternativy
vektorové databáze: Supabase pgvector, Pinecone, Weaviate, Chroma – srovnání
proč Supabase pgvector: PostgreSQL základ, SQL + vektorové vyhledávání, self-hosting, cena
similarity search: cosine distance, inner product, L2 – kdy co použít
praktická ukázka: vytvoření embeddingu z textu a vyhledání nejpodobnějšího dokumentu

3. Chunking strategie a příprava dat (1 hodina)

proč je chunking klíčový – příliš velké i příliš malé chunky zhoršují výsledky
strategie: fixed-size, sentence-based, recursive, semantic chunking
metadata a enrichment: přidání kontextu ke chunkům (zdroj, datum, kategorie)
práce s různými formáty: PDF, DOCX, HTML, e-maily, tabulky
overlap a jeho vliv na kvalitu vyhledávání
praktická ukázka: zpracování reálného firemního dokumentu různými chunking strategiemi

4. Hybridní vyhledávání a reranking (1 hodina)

limity čistě vektorového vyhledávání – kdy selhává semantic search
full-text search (BM25) vs. semantic search – silné a slabé stránky
hybridní přístup: kombinace keyword + vector search v Supabase
reranking: Cohere Rerank, cross-encoder modely – zpřesnění výsledků
filtrování podle metadat: kategorie, datum, jazyk, zdroj
praktická ukázka: stejný dotaz přes vector search, full-text search a hybrid – srovnání výsledků

5. Praktická stavba RAG systému (12 hodin)

Blok A – nastavení infrastruktury (3 hodiny)

založení Supabase projektu a konfigurace pgvector rozšíření
návrh databázového schématu: tabulky, indexy, RLS (Row Level Security)
vytvoření SQL funkcí pro vektorové vyhledávání (match_documents)
napojení na n8n: webhook trigger, HTTP request nody, Supabase integrace
testování: první vložení embeddingu a první vektorový dotaz
troubleshooting: nejčastější chyby při nastavení (dimenze embeddingů, typy indexů)

Blok B – ingestion pipeline: zpracování a indexace dokumentů (3 hodiny)

stavba ingestion workflow v n8n: příjem dokumentu → extrakce textu → chunking → embedding → uložení
práce s různými zdroji: PDF upload, webový scraping, e-mailová schránka, Google Drive
automatický re-processing při aktualizaci dokumentů
monitoring kvality: logování, detekce duplicit, verzování
praktický workshop: účastníci naindexují vlastní dataset (firemní dokumenty, produktový katalog, FAQ)

Blok C – retrieval pipeline a integrace s LLM (3 hodiny)

stavba retrieval workflow: dotaz → embedding dotazu → vyhledání → sestavení kontextu → LLM
prompt engineering pro RAG: system prompt, context injection, source attribution
implementace hybridního vyhledávání v Supabase (SQL funkce pro hybrid search)
napojení na LLM: OpenAI API, Claude API, lokální modely – srovnání pro RAG
evaluace kvality odpovědí: relevance, faithfulness, hallucination detection
praktický workshop: účastníci postaví kompletní retrieval pipeline nad svým datasetem

Blok D – nasazení, škálování a závěrečný projekt (3 hodiny)

výstupní kanály: chatbot na webu, voice AI (ElevenLabs + Twilio), Slack bot, interní portál
ukázka napojení na voice AI: jak RAG systém odpovídá hlasem po telefonu (case study realitní kancelář)
GDPR a bezpečnost: co smí do vektorové databáze, RLS, anonymizace, data retention
provozní realita: monitoring, údržba, náklady, kdy se RAG vyplatí a kdy ne
škálování: od prototypu k produkci – co se mění (indexy, caching, rate limiting)
závěrečný projekt: účastníci dokončí a odprezentují funkční RAG systém nad vlastními daty
zpětná vazba, doporučení pro nasazení v praxi, návazné zdroje

Popis

Související produkty

Váš první AI zaměstnanec jako osobní asistent

AI automatizace pro firmy – od chatu k agentovi

Stavba firemního intranetu a automatizace procesů

Vaše digitální kancelář v Microsoft 365