Vektorová databáza
Databáza navrhnutá na ukladanie embeddingov a vyhľadávanie podľa významovej podobnosti namiesto presnej zhody.
Definícia
Vektorová databáza je špecializovaný typ databázy na ukladanie a rýchle vyhľadávanie embeddingov, teda vektorov, ktoré reprezentujú význam textu či iných dát. Na rozdiel od klasickej databázy nehľadá presnú zhodu, ale záznamy, ktoré sú významovo najpodobnejšie. Aby bolo vyhľadávanie rýchle aj pri miliónoch vektorov, používa približné hľadanie najbližších susedov cez indexy ako HNSW. Vektorové databázy sú motorom vyhľadávacej fázy v systémoch RAG a v AI vyhľadávačoch.
Kľúčové čísla
Príklady
- 1pgvector pridáva vektorové vyhľadávanie priamo do PostgreSQL
- 2Pinecone je plne manažovaná vektorová databáza bez správy serverov
- 3Qdrant a Weaviate sú open-source riešenia na vlastné nasadenie
Čím sa líši od klasickej databázy
Klasická databáza odpovie na otázku typu „nájdi faktúru číslo 123", teda hľadá presnú zhodu alebo rozsah hodnôt. Vektorová databáza odpovie na otázku „nájdi dokumenty, ktoré sa významom podobajú tomuto". Vstupom dopytu nie je kľúčové slovo, ale embedding, a výsledkom sú významovo najbližšie záznamy. Vďaka tomu nájde relevantný obsah, aj keď ste použili úplne iné slová než sú v texte.
Praktické tipy
- 1Ak už používate PostgreSQL, najjednoduchšou voľbou býva pgvector
- 2Pre rýchly štart bez správy serverov zvážte manažovanú službu
- 3Pre plnú kontrolu a výkon siahnite po open-source riešení
Často kladené otázky
Čo je vektorová databáza jednoducho povedané?
Je to databáza, ktorá namiesto presnej zhody hľadá záznamy s najpodobnejším významom. Ukladá embeddingy a vie rýchlo nájsť tie najbližšie k vašej otázke.
Potrebujem vektorovú databázu, ak používam PostgreSQL?
Nie nutne samostatnú. Rozšírenie pgvector pridá vektorové vyhľadávanie priamo do PostgreSQL, takže vektory máte vedľa ostatných dát bez ďalšieho systému.
Ako súvisí vektorová databáza s RAG?
Vo fáze vyhľadávania v RAG sa otázka premení na vektor a systém vo vektorovej databáze nájde najrelevantnejšie dokumenty. Tie sa potom dodajú modelu ako podklad pre odpoveď.
Súvisiace pojmy
Embedding
Zoznam čísel (vektor), ktorý zachytáva význam slova alebo textu tak, že podobné významy majú podobné čísla.
RAG (Retrieval Augmented Generation)
Technológia kombinujúca vyhľadávanie informácií s AI generovaním — základ fungovania Perplexity a ChatGPT web search.
Sémantické vyhľadávanie
Typ vyhľadávania, kde AI rozumie významu a kontextu otázky, nie len kľúčovým slovám — základ moderného AI aj Google vyhľadávania.
Veľký jazykový model (LLM)
Typ AI modelu trénovaného na obrovskom množstve textu, schopný generovať, porozumieť a spracovať ľudský jazyk — základ AI vyhľadávačov.
Ďalšie informácie
Monitorujte svoju AI viditeľnosť
Zistite, či AI vyhľadávače citujú vašu stránku. Vyskúšajte zadarmo.
Začať zadarmo