> For the complete documentation index, see [llms.txt](https://doc.ainexlayer.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://doc.ainexlayer.com/documentation/ai-engine-configuration/vector-databases.md). # Vector Databases

Overview Vector databases are specialized databases designed to store, index, and search high-dimensional vectors efficiently. In AINexLayer, they store document embeddings and enable semantic search across your knowledge base. ### How Vector Databases Work #### Vector Storage 1. **Embedding Generation**: Text converted to vectors 2. **Vector Storage**: Vectors stored in database 3. **Indexing**: Efficient search indexes created 4. **Similarity Search**: Fast similarity queries 5. **Result Ranking**: Results ranked by similarity #### Search Process 1. **Query Embedding**: Convert query to vector 2. **Similarity Calculation**: Calculate similarity to stored vectors 3. **Index Search**: Use indexes for fast search 4. **Result Ranking**: Rank results by similarity score 5. **Context Retrieval**: Return relevant document chunks ### Supported Vector Databases #### LanceDB (Default) **Best for**: Local deployment, simplicity, performance **Features** * **Local Storage**: No external dependencies * **High Performance**: Fast similarity search * **Easy Setup**: Minimal configuration required * **ACID Compliance**: Reliable data operations **Configuration** ```json { "provider": "lancedb", "path": "./storage/vectors", "tableName": "documents", "dimensions": 1536, "metric": "cosine" } ``` **Advantages** * **Zero Configuration**: Works out of the box * **Fast Performance**: Optimized for speed * **Local Control**: Complete data control * **Cost Effective**: No external service costs **Limitations** * **Single Node**: No distributed deployment * **Limited Scalability**: Best for moderate data sizes * **No Advanced Features**: Basic vector operations only #### Pinecone **Best for**: Cloud deployment, scalability, enterprise features **Features** * **Managed Service**: Fully managed vector database * **High Scalability**: Handles millions of vectors * **Advanced Features**: Metadata filtering, namespaces * **Global Distribution**: Multiple regions available **Configuration** ```json { "provider": "pinecone", "apiKey": "your-pinecone-api-key", "environment": "us-west1-gcp", "indexName": "ainexlayer-docs", "dimensions": 1536, "metric": "cosine" } ``` **Advantages** * **Managed Service**: No infrastructure management * **High Scalability**: Handles large datasets * **Advanced Features**: Rich query capabilities * **Global Availability**: Multiple regions **Limitations** * **Cost**: Pay-per-use pricing * **Vendor Lock-in**: Proprietary service * **Internet Dependency**: Requires internet connection #### Chroma **Best for**: Development, experimentation, local deployment **Features** * **Open Source**: Free and open source * **Local Deployment**: Run locally or in cloud * **Python Integration**: Easy Python integration * **Flexible Storage**: Multiple storage backends **Configuration** ```json { "provider": "chroma", "persistDirectory": "./storage/chroma", "collectionName": "documents", "dimensions": 1536, "distance": "cosine" } ``` **Advantages** * **Open Source**: Free to use * **Flexible**: Multiple deployment options * **Python Native**: Easy Python integration * **Local Control**: Complete data control **Limitations** * **Performance**: May be slower than commercial options * **Scalability**: Limited scalability * **Features**: Fewer advanced features #### Weaviate **Best for**: Enterprise features, hybrid search, advanced queries **Features** * **Hybrid Search**: Vector + keyword search * **GraphQL API**: Powerful query interface * **Multi-modal**: Text, image, and other data types * **Enterprise Features**: Advanced security and compliance **Configuration** ```json { "provider": "weaviate", "url": "http://localhost:8080", "apiKey": "your-weaviate-api-key", "className": "Document", "dimensions": 1536 } ``` **Advantages** * **Hybrid Search**: Combines vector and keyword search * **Advanced Queries**: Powerful query capabilities * **Multi-modal**: Support for different data types * **Enterprise Ready**: Advanced security features **Limitations** * **Complexity**: More complex setup and configuration * **Resource Intensive**: Requires more resources * **Learning Curve**: Steeper learning curve #### PGVector (PostgreSQL) **Best for**: Existing PostgreSQL users, SQL integration **Features** * **PostgreSQL Extension**: Extends existing PostgreSQL * **SQL Integration**: Use familiar SQL queries * **ACID Compliance**: Full transaction support * **Mature Ecosystem**: Leverage PostgreSQL ecosystem **Configuration** ```json { "provider": "pgvector", "connectionString": "postgresql://user:pass@localhost:5432/ainexlayer", "tableName": "document_embeddings", "dimensions": 1536, "metric": "cosine" } ``` **Advantages** * **SQL Integration**: Use familiar SQL * **ACID Compliance**: Reliable transactions * **Mature**: Well-established technology * **Flexible**: Combine with other data **Limitations** * **Performance**: May be slower for vector operations * **Complexity**: Requires PostgreSQL knowledge * **Scalability**: Limited vector-specific optimizations ### Vector Database Selection #### By Use Case **Local Development** * **Recommended**: LanceDB, Chroma * **Why**: Easy setup, no external dependencies * **Use Cases**: Development, testing, small deployments **Production Deployment** * **Recommended**: Pinecone, Weaviate * **Why**: Scalability, reliability, managed service * **Use Cases**: Production applications, large datasets **Enterprise Deployment** * **Recommended**: Weaviate, PGVector * **Why**: Advanced features, compliance, security * **Use Cases**: Enterprise applications, compliance requirements **Cost Optimization** * **Recommended**: LanceDB, Chroma * **Why**: No external service costs * **Use Cases**: Budget-conscious deployments #### By Scale **Small Scale (< 100K vectors)** * **Recommended**: LanceDB, Chroma * **Why**: Simple, cost-effective * **Performance**: Fast for small datasets **Medium Scale (100K - 1M vectors)** * **Recommended**: Pinecone, Weaviate * **Why**: Good balance of features and cost * **Performance**: Optimized for medium datasets **Large Scale (> 1M vectors)** * **Recommended**: Pinecone, Weaviate * **Why**: High scalability, managed service * **Performance**: Designed for large datasets ### Configuration Management #### Environment Variables ```bash # LanceDB (Default) VECTOR_DB=lancedb VECTOR_DB_PATH=./storage/vectors # Pinecone VECTOR_DB=pinecone PINECONE_API_KEY=your-pinecone-api-key PINECONE_ENVIRONMENT=us-west1-gcp PINECONE_INDEX_NAME=ainexlayer-docs # Chroma VECTOR_DB=chroma CHROMA_PERSIST_DIRECTORY=./storage/chroma # Weaviate VECTOR_DB=weaviate WEAVIATE_URL=http://localhost:8080 WEAVIATE_API_KEY=your-weaviate-api-key # PGVector VECTOR_DB=pgvector DATABASE_URL=postgresql://user:pass@localhost:5432/ainexlayer ``` #### Database Configuration ```json { "vectorDatabase": { "provider": "lancedb", "config": { "path": "./storage/vectors", "tableName": "documents", "dimensions": 1536, "metric": "cosine" } } } ``` ### Performance Optimization #### Index Optimization * **Index Type**: Choose appropriate index type * **Index Parameters**: Optimize index parameters * **Index Maintenance**: Regular index maintenance * **Index Monitoring**: Monitor index performance #### Query Optimization * **Batch Queries**: Process multiple queries together * **Query Caching**: Cache frequent queries * **Result Limiting**: Limit result sets appropriately * **Similarity Thresholds**: Optimize similarity thresholds #### Storage Optimization * **Vector Compression**: Compress vectors for storage * **Deduplication**: Remove duplicate vectors * **Archival**: Archive old vectors * **Cleanup**: Regular cleanup of unused vectors ### Similarity Metrics #### Cosine Similarity * **Best for**: General semantic similarity * **Range**: -1 to 1 * **Advantages**: Scale-invariant, good for text * **Use Cases**: Most document search applications #### Euclidean Distance * **Best for**: Geometric similarity * **Range**: 0 to infinity * **Advantages**: Intuitive distance measure * **Use Cases**: Clustering, classification #### Dot Product * **Best for**: Fast computation * **Range**: -infinity to infinity * **Advantages**: Very fast computation * **Use Cases**: High-performance applications #### Manhattan Distance * **Best for**: Sparse vectors * **Range**: 0 to infinity * **Advantages**: Good for sparse data * **Use Cases**: Sparse vector applications ### Troubleshooting #### Common Issues **Connection Problems** * **Database Unavailable**: Check database service status * **Authentication Errors**: Verify API keys and credentials * **Network Issues**: Check network connectivity * **Configuration Errors**: Verify configuration settings **Performance Issues** * **Slow Queries**: Optimize indexes and queries * **Memory Issues**: Monitor memory usage * **Storage Issues**: Check storage capacity * **Concurrent Limits**: Check concurrent query limits **Data Issues** * **Missing Vectors**: Check vector generation process * **Inconsistent Results**: Verify vector consistency * **Index Corruption**: Rebuild indexes if needed * **Data Loss**: Check backup and recovery procedures #### Error Handling ```json { "error": { "type": "vector_database_error", "message": "Failed to query vector database", "details": { "provider": "pinecone", "errorCode": "RATE_LIMIT_EXCEEDED", "retryAfter": 60 } } } ``` ### Best Practices #### Database Selection * **Start Simple**: Begin with LanceDB for development * **Scale Gradually**: Move to managed services as needed * **Consider Costs**: Balance features with costs * **Plan for Growth**: Consider scaling requirements #### Performance Optimization * **Monitor Performance**: Track query performance * **Optimize Indexes**: Regular index optimization * **Cache Queries**: Implement query caching * **Batch Operations**: Use batch operations when possible #### Data Management * **Regular Backups**: Implement backup procedures * **Data Validation**: Validate vector data integrity * **Cleanup Procedures**: Regular cleanup of old data * **Monitoring**: Monitor database health and performance #### Security * **Access Control**: Implement proper access controls * **API Key Security**: Secure API keys and credentials * **Network Security**: Use secure network connections * **Data Encryption**: Encrypt sensitive data ### Migration Between Databases #### Export Data ```bash # Export vectors from current database curl -X POST /api/v1/vectors/export \ -H "Content-Type: application/json" \ -d '{"format": "json", "includeMetadata": true}' ``` #### Import Data ```bash # Import vectors to new database curl -X POST /api/v1/vectors/import \ -H "Content-Type: application/json" \ -d '{"format": "json", "data": "..."}' ``` #### Migration Tools * **Export Wizard**: Guided export process * **Import Wizard**: Guided import process * **Validation Tools**: Verify migration integrity * **Rollback Options**: Undo migration if needed *** **🗄️ Vector databases are the engine of semantic search. Choose the right database for your scale, performance, and feature requirements.** --- # Agent Instructions This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com. ## Querying This Documentation If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question. Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter: ``` GET https://doc.ainexlayer.com/documentation/ai-engine-configuration/vector-databases.md?ask=&goal= ``` `ask` is the immediate question: it should be specific, self-contained, and written in natural language. `goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal. The response will contain a direct answer to the question and relevant excerpts and sources from the documentation. Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.