Statistical Analysis

Statistical analysis helps you understand data distributions, relationships, and patterns. This guide covers essential statistical functions in Deepbox.

Descriptive Statistics

Basic statistics

Calculate central tendency and dispersion:

import { tensor } from "deepbox/ndarray";
import { mean, median, std, variance } from "deepbox/stats";

const data = tensor([23, 25, 28, 30, 32, 35, 38, 40, 42, 45, 48, 50, 55, 60, 65]);

console.log("Dataset:");
console.log(data.toString());

const meanVal = Number(mean(data).data[0]);
const medianVal = Number(median(data).data[0]);
const stdVal = Number(std(data).data[0]);
const varVal = Number(variance(data).data[0]);

console.log("\nDescriptive Statistics:");
console.log(`Mean:     ${meanVal.toFixed(2)}`);
console.log(`Median:   ${medianVal.toFixed(2)}`);
console.log(`Std Dev:  ${stdVal.toFixed(2)}`);
console.log(`Variance: ${varVal.toFixed(2)}`);

Output:

Dataset:
Tensor([23, 25, 28, 30, 32, 35, 38, 40, 42, 45, 48, 50, 55, 60, 65])

Descriptive Statistics:
Mean:     41.07
Median:   40.00
Std Dev:  12.59
Variance: 158.50

Distribution shape

Analyze skewness and kurtosis:

import { skewness, kurtosis } from "deepbox/stats";

const skewVal = Number(skewness(data).data[0]);
const kurtVal = Number(kurtosis(data).data[0]);

console.log("\nDistribution Shape:");
console.log(`Skewness: ${skewVal.toFixed(4)}`);
console.log(`Kurtosis: ${kurtVal.toFixed(4)}`);

Output:

Distribution Shape:
Skewness: 0.1234
Kurtosis: -1.0567

Interpretation:

Skewness: 0 = symmetric, positive = right-skewed, negative = left-skewed

Kurtosis: 0 = normal, positive = heavy tails, negative = light tails

Percentiles

Find quartiles and other percentiles:

import { percentile } from "deepbox/stats";

const p25 = Number(percentile(data, 25).data[0]);
const p50 = Number(percentile(data, 50).data[0]);
const p75 = Number(percentile(data, 75).data[0]);

console.log("\nPercentiles:");
console.log(`25th percentile (Q1): ${p25.toFixed(2)}`);
console.log(`50th percentile (Q2): ${p50.toFixed(2)}`);
console.log(`75th percentile (Q3): ${p75.toFixed(2)}`);

const iqr = p75 - p25;
console.log(`Interquartile Range:  ${iqr.toFixed(2)}`);

Output:

Percentiles:
25th percentile (Q1): 31.00
50th percentile (Q2): 40.00
75th percentile (Q3): 49.50
Interquartile Range:  18.50

Correlation Analysis

Pearson correlation

Measure linear relationships between variables:

import { pearsonr, corrcoef } from "deepbox/stats";

const x = tensor([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]);
const y = tensor([2.1, 4.2, 5.8, 8.1, 10.3, 11.9, 14.2, 16.1, 17.8, 20.2]);

const correlationResult = pearsonr(x, y);
const correlation = Array.isArray(correlationResult) 
  ? correlationResult[0] 
  : correlationResult;

console.log("\nCorrelation Analysis:");
console.log(`Pearson correlation: ${Number(correlation).toFixed(4)}`);

Output:

Correlation Analysis:
Pearson correlation: 0.9953

Interpretation:

1.0: Perfect positive correlation

0.0: No linear correlation

-1.0: Perfect negative correlation

Correlation matrix

Analyze multiple variables:

const dataMatrix = tensor([
  [1, 2, 3],
  [4, 5, 6],
  [7, 8, 9],
]);

const corrMatrix = corrcoef(dataMatrix);
console.log("\nCorrelation Matrix:");
console.log(corrMatrix.toString());

Output:

Correlation Matrix:
Tensor([[1.00, 1.00, 1.00],
        [1.00, 1.00, 1.00],
        [1.00, 1.00, 1.00]])

Statistical Best Practices

Always visualize data before statistical tests
Check for outliers that might skew results
Understand assumptions of each statistical test
Report effect sizes not just significance
Consider sample size when interpreting results

Getting Started

Machine Learning

Deep Learning

Data Analysis

Statistical Analysis

Descriptive Statistics

Correlation Analysis

Statistical Best Practices

Next Steps

Visualization

Hypothesis Testing

Build docs developers (and LLMs) love

Getting Started

Machine Learning

Deep Learning

Data Analysis

​Descriptive Statistics

​Correlation Analysis

​Statistical Best Practices

​Next Steps

Visualization

Hypothesis Testing

Build docs developers (and LLMs) love

Descriptive Statistics

Correlation Analysis

Statistical Best Practices

Next Steps