Linear Models

LogisticTextClassifier

Logistic regression classifier using stochastic gradient descent with L2 regularization. Supports multi-class classification via one-vs-rest.

Constructor

new LogisticTextClassifier(options?: {
  epochs?: number;
  learningRate?: number;
  l2?: number;
  maxFeatures?: number;
  useNativeScoring?: boolean;
})

Parameters:

epochs (optional): Number of training iterations (default: 20, minimum: 1)
learningRate (optional): Learning rate for SGD (default: 0.1, minimum: 1e-6)
l2 (optional): L2 regularization strength (default: 1e-4, minimum: 0)
maxFeatures (optional): Max vocabulary size (default: 16000, minimum: 256)
useNativeScoring (optional): Use native acceleration (default: true)

Example:

import { LogisticTextClassifier } from "bun_nltk";

const classifier = new LogisticTextClassifier({
  epochs: 30,
  learningRate: 0.05,
  l2: 1e-4,
});

Methods

train()

Train the logistic regression model.

train(examples: LinearModelExample[]): this

Parameters:

examples: Array of { label: string, text: string } objects

Returns: The classifier instance (for chaining) Throws: Error if examples array is empty Example:

classifier.train([
  { label: "politics", text: "Government announces new policy" },
  { label: "sports", text: "Team advances to finals" },
  { label: "technology", text: "AI research makes breakthrough" },
]);

classify()

Predict the most likely label for a text.

classify(text: string): string

Parameters:

text: The text to classify

Returns: The predicted label Throws: Error if classifier has no labels Example:

const label = classifier.classify("New smartphone released");
console.log(label); // "technology"

predict()

Get predictions with probabilities and scores for all labels.

predict(text: string): Array<{
  label: string;
  probability: number;
  score: number;
}>

Returns: Array sorted by probability (descending) Example:

const predictions = classifier.predict("Election results announced");
console.log(predictions);
// [
//   { label: "politics", probability: 0.78, score: 1.35 },
//   { label: "sports", probability: 0.15, score: -0.52 },
//   { label: "technology", probability: 0.07, score: -1.21 }
// ]

classifyBatch()

Classify multiple texts efficiently in batch.

classifyBatch(texts: string[]): string[]

Parameters:

texts: Array of texts to classify

Returns: Array of predicted labels Example:

const texts = [
  "Stock market rises",
  "Player scores winning goal",
  "New software update available",
];
const labels = classifier.classifyBatch(texts);
console.log(labels); // ["politics", "sports", "technology"]

evaluate()

Evaluate the classifier on test examples.

evaluate(examples: LinearModelExample[]): {
  accuracy: number;
  total: number;
  correct: number;
}

Example:

const results = classifier.evaluate(testData);
console.log(`Accuracy: ${(results.accuracy * 100).toFixed(1)}%`);

toJSON() / fromJSON()

Serialize and deserialize the model.

toJSON(): LogisticSerialized
static fromJSON(payload: LogisticSerialized): LogisticTextClassifier

Example:

// Save
const data = classifier.toJSON();
await Bun.write("logistic.json", JSON.stringify(data));

// Load
const loaded = LogisticTextClassifier.fromJSON(
  await Bun.file("logistic.json").json()
);

LinearSvmTextClassifier

Linear Support Vector Machine classifier using hinge loss with margin and L2 regularization.

Constructor

new LinearSvmTextClassifier(options?: {
  epochs?: number;
  learningRate?: number;
  l2?: number;
  margin?: number;
  maxFeatures?: number;
  useNativeScoring?: boolean;
})

Parameters:

epochs (optional): Number of training iterations (default: 20, minimum: 1)
learningRate (optional): Learning rate for SGD (default: 0.05, minimum: 1e-6)
l2 (optional): L2 regularization strength (default: 5e-4, minimum: 0)
margin (optional): SVM margin parameter (default: 1.0, minimum: 0.1)
maxFeatures (optional): Max vocabulary size (default: 16000, minimum: 256)
useNativeScoring (optional): Use native acceleration (default: true)

Example:

import { LinearSvmTextClassifier } from "bun_nltk";

const classifier = new LinearSvmTextClassifier({
  epochs: 25,
  learningRate: 0.03,
  margin: 1.5,
});

Methods

The LinearSvmTextClassifier has the same methods as LogisticTextClassifier:

train(examples) - Train the SVM
classify(text) - Predict label
predict(text) - Get scores for all labels (no probabilities)
classifyBatch(texts) - Batch classification
evaluate(examples) - Compute accuracy
toJSON() / fromJSON() - Serialization

Predict() difference:

predict(text: string): Array<{
  label: string;
  score: number; // Raw SVM score (no probability)
}>

Helper Functions

trainLogisticTextClassifier()

trainLogisticTextClassifier(
  examples: LinearModelExample[],
  options?: {
    epochs?: number;
    learningRate?: number;
    l2?: number;
    maxFeatures?: number;
    useNativeScoring?: boolean;
  }
): LogisticTextClassifier

trainLinearSvmTextClassifier()

trainLinearSvmTextClassifier(
  examples: LinearModelExample[],
  options?: {
    epochs?: number;
    learningRate?: number;
    l2?: number;
    margin?: number;
    maxFeatures?: number;
    useNativeScoring?: boolean;
  }
): LinearSvmTextClassifier

loadLogisticTextClassifier()

loadLogisticTextClassifier(
  payload: LogisticSerialized
): LogisticTextClassifier

loadLinearSvmTextClassifier()

loadLinearSvmTextClassifier(
  payload: LinearSvmSerialized
): LinearSvmTextClassifier

Types

LinearModelExample

type LinearModelExample = {
  label: string;
  text: string;
};

LogisticSerialized

type LogisticSerialized = {
  version: number;
  labels: string[];
  vectorizer: VectorizerSerialized;
  weights: number[];
  bias: number[];
  options: {
    epochs: number;
    learningRate: number;
    l2: number;
    maxFeatures: number;
    useNativeScoring?: boolean;
  };
};

LinearSvmSerialized

type LinearSvmSerialized = {
  version: number;
  labels: string[];
  vectorizer: VectorizerSerialized;
  weights: number[];
  bias: number[];
  options: {
    epochs: number;
    learningRate: number;
    l2: number;
    margin: number;
    maxFeatures: number;
    useNativeScoring?: boolean;
  };
};

Complete Example

import {
  trainLogisticTextClassifier,
  trainLinearSvmTextClassifier,
} from "bun_nltk";

// Training data for sentiment analysis
const trainingData = [
  { label: "positive", text: "Excellent product, very satisfied" },
  { label: "negative", text: "Terrible quality, waste of money" },
  { label: "neutral", text: "Average product, nothing special" },
  { label: "positive", text: "Love it! Highly recommend" },
  { label: "negative", text: "Broke after one week" },
  { label: "neutral", text: "Works as expected" },
];

// Train logistic regression
const logistic = trainLogisticTextClassifier(trainingData, {
  epochs: 30,
  learningRate: 0.1,
});

// Train linear SVM
const svm = trainLinearSvmTextClassifier(trainingData, {
  epochs: 25,
  learningRate: 0.05,
  margin: 1.0,
});

// Compare predictions
const text = "Amazing value for the price";
console.log("Logistic:", logistic.predict(text));
console.log("SVM:", svm.predict(text));

// Batch classification
const reviews = [
  "Great purchase",
  "Not worth it",
  "It's okay",
];
console.log(logistic.classifyBatch(reviews));
// ["positive", "negative", "neutral"]

// Evaluate both models
const testData = [
  { label: "positive", text: "Best decision ever" },
  { label: "negative", text: "Complete disappointment" },
];

const logisticMetrics = logistic.evaluate(testData);
const svmMetrics = svm.evaluate(testData);

console.log(`Logistic accuracy: ${(logisticMetrics.accuracy * 100).toFixed(1)}%`);
console.log(`SVM accuracy: ${(svmMetrics.accuracy * 100).toFixed(1)}%`);

// Save models
await Bun.write("logistic.json", JSON.stringify(logistic.toJSON()));
await Bun.write("svm.json", JSON.stringify(svm.toJSON()));

Choosing Between Logistic and SVM

Use Logistic Regression when:

You need probability estimates
You want calibrated confidence scores
You have balanced classes

Use Linear SVM when:

You only need the best label
You have imbalanced classes (adjust margin)
You want more robust decision boundaries

Tokenization

Text Processing

Tagging & Analysis

Language Models

Parsing

Classification

WordNet

Corpus

WASM Runtime

Native APIs

LogisticTextClassifier

Constructor

Methods

train()

classify()

predict()

classifyBatch()

evaluate()

toJSON() / fromJSON()

LinearSvmTextClassifier

Constructor

Methods

Helper Functions

trainLogisticTextClassifier()

trainLinearSvmTextClassifier()

loadLogisticTextClassifier()

loadLinearSvmTextClassifier()

Types

LinearModelExample

LogisticSerialized

LinearSvmSerialized

Complete Example

Choosing Between Logistic and SVM

Build docs developers (and LLMs) love

Tokenization

Text Processing

Tagging & Analysis

Language Models

Parsing

Classification

WordNet

Corpus

WASM Runtime

Native APIs

​LogisticTextClassifier

​Constructor

​Methods

​train()

​classify()

​predict()

​classifyBatch()

​evaluate()

​toJSON() / fromJSON()

​LinearSvmTextClassifier

​Constructor

​Methods

​Helper Functions

​trainLogisticTextClassifier()

​trainLinearSvmTextClassifier()

​loadLogisticTextClassifier()

​loadLinearSvmTextClassifier()

​Types

​LinearModelExample

​LogisticSerialized

​LinearSvmSerialized

​Complete Example

​Choosing Between Logistic and SVM

Build docs developers (and LLMs) love

LogisticTextClassifier

Constructor

Methods

train()

classify()

predict()

classifyBatch()

evaluate()

toJSON() / fromJSON()

LinearSvmTextClassifier

Constructor

Methods

Helper Functions

trainLogisticTextClassifier()

trainLinearSvmTextClassifier()

loadLogisticTextClassifier()

loadLinearSvmTextClassifier()

Types

LinearModelExample

LogisticSerialized

LinearSvmSerialized

Complete Example

Choosing Between Logistic and SVM