Vektorová databáza

Databáza navrhnutá na ukladanie embeddingov a vyhľadávanie podľa významovej podobnosti namiesto presnej zhody.

Definícia

Vektorová databáza je špecializovaný typ databázy na ukladanie a rýchle vyhľadávanie embeddingov, teda vektorov, ktoré reprezentujú význam textu či iných dát. Na rozdiel od klasickej databázy nehľadá presnú zhodu, ale záznamy, ktoré sú významovo najpodobnejšie. Aby bolo vyhľadávanie rýchle aj pri miliónoch vektorov, používa približné hľadanie najbližších susedov cez indexy ako HNSW. Vektorové databázy sú motorom vyhľadávacej fázy v systémoch RAG a v AI vyhľadávačoch.

Kľúčové čísla

Podobnosť

Hľadá podľa významu, nie presnej zhody

HNSW

Index pre rýchle približné vyhľadávanie

Motor RAG

Poháňa vyhľadávaciu fázu v RAG

Príklady

1pgvector pridáva vektorové vyhľadávanie priamo do PostgreSQL
2Pinecone je plne manažovaná vektorová databáza bez správy serverov
3Qdrant a Weaviate sú open-source riešenia na vlastné nasadenie

Čím sa líši od klasickej databázy

Klasická databáza odpovie na otázku typu „nájdi faktúru číslo 123", teda hľadá presnú zhodu alebo rozsah hodnôt. Vektorová databáza odpovie na otázku „nájdi dokumenty, ktoré sa významom podobajú tomuto". Vstupom dopytu nie je kľúčové slovo, ale embedding, a výsledkom sú významovo najbližšie záznamy. Vďaka tomu nájde relevantný obsah, aj keď ste použili úplne iné slová než sú v texte.

Praktické tipy

1Ak už používate PostgreSQL, najjednoduchšou voľbou býva pgvector
2Pre rýchly štart bez správy serverov zvážte manažovanú službu
3Pre plnú kontrolu a výkon siahnite po open-source riešení

Často kladené otázky

Čo je vektorová databáza jednoducho povedané?

Je to databáza, ktorá namiesto presnej zhody hľadá záznamy s najpodobnejším významom. Ukladá embeddingy a vie rýchlo nájsť tie najbližšie k vašej otázke.

Potrebujem vektorovú databázu, ak používam PostgreSQL?

Nie nutne samostatnú. Rozšírenie pgvector pridá vektorové vyhľadávanie priamo do PostgreSQL, takže vektory máte vedľa ostatných dát bez ďalšieho systému.

Ako súvisí vektorová databáza s RAG?

Vo fáze vyhľadávania v RAG sa otázka premení na vektor a systém vo vektorovej databáze nájde najrelevantnejšie dokumenty. Tie sa potom dodajú modelu ako podklad pre odpoveď.

Súvisiace pojmy

Embedding

Zoznam čísel (vektor), ktorý zachytáva význam slova alebo textu tak, že podobné významy majú podobné čísla.

RAG (Retrieval Augmented Generation)

Technológia kombinujúca vyhľadávanie informácií s AI generovaním — základ fungovania Perplexity a ChatGPT web search.

Sémantické vyhľadávanie

Typ vyhľadávania, kde AI rozumie významu a kontextu otázky, nie len kľúčovým slovám — základ moderného AI aj Google vyhľadávania.

Veľký jazykový model (LLM)

Typ AI modelu trénovaného na obrovskom množstve textu, schopný generovať, porozumieť a spracovať ľudský jazyk — základ AI vyhľadávačov.

Ďalšie informácie

Článok: Vektorové databázy Článok: Čo je RAG

Predchádzajúci

Transformer

Ďalší

Fine-tuning (Doladenie)

Monitorujte svoju AI viditeľnosť

Zistite, či AI vyhľadávače citujú vašu stránku. Vyskúšajte zadarmo.

Začať zadarmo