Vector Search

Vector search allows you to search documents using custom embedding vectors. Unlike semantic search where TopK generates embeddings for you, with vector search you provide your own embeddings and TopK handles the efficient similarity computation.

Overview

With vector search, you can:

Use embeddings from any model or source
Search using dense vectors with various precision levels
Choose from multiple distance metrics
Optimize storage with different vector types (f32, f16, f8, u8, i8, binary)

Schema Setup

To enable vector search, define a vector field with a vectorIndex():

import { Client } from "topk-js";
import { f32Vector, vectorIndex, text } from "topk-js/schema";

const client = new Client({
  apiKey: "YOUR_API_KEY",
  region: "aws-us-east-1-elastica"
});

await client.collections().create("books", {
  title: text(),
  embedding: f32Vector({ dimension: 1536 }).index(
    vectorIndex({ metric: "cosine" })
  )
});

Vector Types

TopK supports multiple vector data types for different precision and storage requirements:

f32Vector - 32-bit floating point (standard precision)
f16Vector - 16-bit floating point (half precision)
f8Vector - 8-bit floating point
u8Vector - 8-bit unsigned integer
i8Vector - 8-bit signed integer
binaryVector - 1-bit binary vectors

import { f32Vector, f16Vector, u8Vector, binaryVector, vectorIndex } from "topk-js/schema";

const schema = {
  // Standard precision
  embedding_f32: f32Vector({ dimension: 1536 }).index(
    vectorIndex({ metric: "cosine" })
  ),
  
  // Half precision - 50% storage savings
  embedding_f16: f16Vector({ dimension: 1536 }).index(
    vectorIndex({ metric: "cosine" })
  ),
  
  // Quantized - 75% storage savings
  embedding_u8: u8Vector({ dimension: 1536 }).index(
    vectorIndex({ metric: "dot_product" })
  ),
  
  // Binary - 96.875% storage savings
  embedding_binary: binaryVector({ dimension: 1536 }).index(
    vectorIndex({ metric: "hamming" })
  )
};

Distance Metrics

Choose the appropriate distance metric for your use case:

cosine - Cosine similarity (dense vectors only)
euclidean - Euclidean distance (dense vectors only)
dot_product - Dot product (dense vectors)
hamming - Hamming distance (binary vectors only)

The hamming metric is only supported for binaryVector type. Dense vectors support cosine, euclidean, and dot_product.

Inserting Documents with Vectors

When inserting documents, provide the embedding vectors using the appropriate data constructor:

import { f32Vector, u8Vector, binaryVector } from "topk-js/data";

await client.collection("books").upsert([
  {
    _id: "gatsby",
    title: "The Great Gatsby",
    // F32 vectors can be plain arrays
    embedding_f32: [0.1, 0.2, 0.3, /* ... 1536 dimensions */],
    // U8 vectors need the constructor
    embedding_u8: u8Vector([12, 45, 78, /* ... */]),
    // Binary vectors need the constructor
    embedding_binary: binaryVector([0, 1, 1, 0, /* ... */])
  }
]);

Querying with Vector Search

Use fn.vectorDistance() to compute the distance between your query vector and indexed vectors:

import { select, field, fn } from "topk-js/query";
import { f32Vector } from "topk-js/data";

// Generate your query embedding (example using hypothetical embedding function)
const queryEmbedding = await generateEmbedding("classic American literature");

const results = await client.collection("books").query(
  select({
    title: field("title"),
    distance: fn.vectorDistance("embedding", queryEmbedding)
  })
  .topk(field("distance"), 10, true) // true for ascending (closest first)
);

Different Vector Types in Queries

import { f32Vector, u8Vector, binaryVector } from "topk-js/data";
import { select, field, fn } from "topk-js/query";

// F32 vector query
const results1 = await client.collection("books").query(
  select({
    distance: fn.vectorDistance("embedding_f32", [0.1, 0.2, 0.3])
  })
  .topk(field("distance"), 10, true)
);

// U8 vector query
const results2 = await client.collection("books").query(
  select({
    distance: fn.vectorDistance("embedding_u8", u8Vector([12, 45, 78]))
  })
  .topk(field("distance"), 10, true)
);

// Binary vector query
const results3 = await client.collection("books").query(
  select({
    distance: fn.vectorDistance("embedding_binary", binaryVector([0, 1, 1, 0]))
  })
  .topk(field("distance"), 10, true)
);

Combining with Filters

Filter your results before performing vector search:

import { select, filter, field, fn } from "topk-js/query";

const results = await client.collection("books").query(
  select({
    title: field("title"),
    distance: fn.vectorDistance("embedding", queryEmbedding)
  })
  .filter(field("published_year").gt(1950))
  .topk(field("distance"), 10, true)
);

Skip Refine Option

For very large result sets, you can skip the refinement step for better performance:

import { select, field, fn } from "topk-js/query";

const results = await client.collection("books").query(
  select({
    distance: fn.vectorDistance(
      "embedding", 
      queryEmbedding,
      { skipRefine: true }
    )
  })
  .topk(field("distance"), 100, true)
);

Skipping refinement may reduce accuracy but improves query performance. Use this option only when you need approximate results and performance is critical.

Choose your vector type based on your accuracy and storage requirements. F32 provides maximum accuracy, while binary vectors provide maximum compression at the cost of some accuracy.

Semantic Search - Automatic embedding generation
Sparse Vector Search - Search with sparse vectors
Multi-Vector Search - Search with multiple vectors per document

Get Started

Core Concepts

Collections

Documents

Advanced

Vector Search

Overview

Schema Setup

Vector Types

Distance Metrics

Inserting Documents with Vectors

Querying with Vector Search

Different Vector Types in Queries

Combining with Filters

Skip Refine Option

Build docs developers (and LLMs) love

Get Started

Core Concepts

Collections

Documents

Advanced

​Overview

​Schema Setup

​Vector Types

​Distance Metrics

​Inserting Documents with Vectors

​Querying with Vector Search

​Different Vector Types in Queries

​Combining with Filters

​Skip Refine Option

​Related Concepts

Build docs developers (and LLMs) love

Overview

Schema Setup

Vector Types

Distance Metrics

Inserting Documents with Vectors

Querying with Vector Search

Different Vector Types in Queries

Combining with Filters

Skip Refine Option

Related Concepts