Vector database
Een vector database is een gespecialiseerde database die vector-embeddings efficiënt opslaat en similarity-search toestaat, essentieel voor RAG-systemen.
Klassieke databases (PostgreSQL, MySQL) zijn niet geoptimaliseerd voor vector-similarity-search op honderden miljoenen vectors. Vector databases (Pinecone, Weaviate, Qdrant, Chroma, Milvus, pgvector voor PostgreSQL) gebruiken algoritmes als HNSW of IVF om sub-seconde similarity retrieval te doen op schaalbare datasets.
Voorbeeld
Een bedrijf bouwt een interne 'ask your docs'-chatbot. 50.000 documenten worden ge-embed en in Qdrant opgeslagen. Query → embedding → top-5 meest vergelijkbare chunks uit vectorDB → als context naar LLM → gegrond antwoord.
Veelgestelde vragen
Welke vector-DB kies ik?
Budget & eenvoud: pgvector (bestaande PostgreSQL). Managed & scale: Pinecone. Open source & control: Qdrant of Weaviate. Embedded/local: Chroma.
Hoeveel data past in een vector-DB?
Schaal: honderden miljoenen vectors met horizontale sharding. Compute memory-intensief — grote datasets vragen gepaste tier.
Zijn vector-DBs alleen voor AI?
Primair ja, maar ook voor klassiek semantic search, recommendation engines, en fraud detection. Over tijd vervagen grenzen tussen klassieke en vector-DB.
Gerelateerde termen
Verder lezen
- → Onze dienst: AI-sector