Microphone Manager

createMicrophone()

Factory function that creates a microphone manager object with methods for requesting permissions, starting, and stopping audio recording. Defined in public/index.js:12-59

Function Signature

function createMicrophone()

Return Value

Returns an object with the following methods:

requestPermission() - Request microphone access from the user
startRecording(callback) - Start recording audio and invoke callback with audio data
stopRecording() - Stop recording and clean up resources

Internal State

The returned object maintains the following internal state:

let stream;              // MediaStream from getUserMedia
let audioContext;        // AudioContext (16kHz sample rate)
let audioWorkletNode;    // AudioWorkletNode for processing
let source;              // MediaStreamSource node
let audioBufferQueue;    // Int16Array buffer for audio chunks

Methods

requestPermission()

Requests microphone access permission from the user.

Method Signature

async requestPermission()

Return Value

Returns a Promise<void> that resolves when permission is granted.

Implementation

async requestPermission() {
  stream = await navigator.mediaDevices.getUserMedia({ audio: true });
}

See public/index.js:20-22

Error Handling

Throws an error if:

User denies microphone permission
No microphone device is available
Browser doesn’t support getUserMedia

startRecording()

Starts recording audio and processes it through an AudioWorklet.

Method Signature

async startRecording(onAudioCallback)

Parameters

onAudioCallback

function

required

Callback function invoked with audio data chunks. Receives a Uint8Array containing 100ms of audio data at 16kHz sample rate.Callback Signature:

function(audioChunk: Uint8Array): void

Return Value

Returns a Promise<void> that resolves when recording has started.

Implementation Details

The method performs the following steps:

Request stream if not available:

if (!stream) stream = await navigator.mediaDevices.getUserMedia({ audio: true });

Create AudioContext with 16kHz sample rate:

audioContext = new AudioContext({
  sampleRate: 16000,
  latencyHint: 'balanced'
});

Set up AudioWorklet processing:

source = audioContext.createMediaStreamSource(stream);
await audioContext.audioWorklet.addModule('audio-processor.js');

audioWorkletNode = new AudioWorkletNode(audioContext, 'audio-processor');
source.connect(audioWorkletNode);
audioWorkletNode.connect(audioContext.destination);

Process audio messages with buffering:

audioWorkletNode.port.onmessage = (event) => {
  const currentBuffer = new Int16Array(event.data.audio_data);
  audioBufferQueue = mergeBuffers(audioBufferQueue, currentBuffer);
  
  const bufferDuration = (audioBufferQueue.length / audioContext.sampleRate) * 1000;
  
  if (bufferDuration >= 100) {
    const totalSamples = Math.floor(audioContext.sampleRate * 0.1);
    const finalBuffer = new Uint8Array(audioBufferQueue.subarray(0, totalSamples).buffer);
    audioBufferQueue = audioBufferQueue.subarray(totalSamples);
    
    if (onAudioCallback) onAudioCallback(finalBuffer);
  }
};

See implementation in public/index.js:23-52

Audio Buffering Strategy

Audio data is buffered until at least 100ms of audio is accumulated
Each callback receives exactly 100ms of audio (1,600 samples at 16kHz)
Remaining audio is kept in the buffer for the next chunk
This ensures consistent chunk sizes for optimal streaming performance

stopRecording()

Stops recording and cleans up all audio resources.

Method Signature

stopRecording()

Return Value

Returns void (no return value).

Implementation

stopRecording() {
  stream?.getTracks().forEach((track) => track.stop());
  audioContext?.close();
  audioBufferQueue = new Int16Array(0);
}

See public/index.js:53-57

Cleanup Operations

Stops all media stream tracks (releases microphone access)
Closes the AudioContext (frees audio processing resources)
Clears the audio buffer queue (frees memory)

Usage Example

Basic Usage

// Create a microphone instance
const microphone = createMicrophone();

// Request permission
await microphone.requestPermission();

// Start recording with a callback
await microphone.startRecording((audioChunk) => {
  // Send audio to WebSocket
  if (ws.readyState === WebSocket.OPEN) {
    ws.send(audioChunk);
  }
});

// Later: stop recording
microphone.stopRecording();

Complete Integration Example

From public/index.js:80-102:

microphone = createMicrophone();
await microphone.requestPermission();

const response = await fetch("http://localhost:8000/token");
const data = await response.json();

if (data.error || !data.token) {
  alert("Failed to get temp token");
  return;
}

const endpoint = `wss://streaming.assemblyai.com/v3/ws?sample_rate=16000&formatted_finals=true&token=${data.token}`;
ws = new WebSocket(endpoint);

ws.onopen = () => {
  console.log("WebSocket connected!");
  messageEl.style.display = "";
  microphone.startRecording((audioChunk) => {
    if (ws.readyState === WebSocket.OPEN) {
      ws.send(audioChunk);
    }
  });
};

Technical Specifications

Audio Configuration

sampleRate

number

default:"16000"

Sample rate in Hz. AssemblyAI’s API requires 16kHz audio.

latencyHint

string

default:"balanced"

Audio processing latency hint. Options: 'interactive', 'balanced', 'playback'.

chunkDuration

number

default:"100"

Duration of each audio chunk in milliseconds.

chunkSize

number

default:"1600"

Number of samples per chunk (16000 Hz × 0.1 seconds = 1600 samples).

Browser Compatibility

Requires browser support for:

navigator.mediaDevices.getUserMedia()
AudioContext
AudioWorklet API
MediaStream API

Supported in all modern browsers (Chrome, Firefox, Safari, Edge).

Get Started

Core Concepts

Implementation Guide

API Reference

Troubleshooting

createMicrophone()

Function Signature

Return Value

Internal State

Methods

requestPermission()

Method Signature

Return Value

Implementation

Error Handling

startRecording()

Method Signature

Parameters

Return Value

Implementation Details

Audio Buffering Strategy

stopRecording()

Method Signature

Return Value

Implementation

Cleanup Operations

Usage Example

Basic Usage

Complete Integration Example

Technical Specifications

Audio Configuration

Browser Compatibility

Build docs developers (and LLMs) love

Get Started

Core Concepts

Implementation Guide

API Reference

Troubleshooting

​createMicrophone()

​Function Signature

​Return Value

​Internal State

​Methods

​requestPermission()

​Method Signature

​Return Value

​Implementation

​Error Handling

​startRecording()

​Method Signature

​Parameters

​Return Value

​Implementation Details

​Audio Buffering Strategy

​stopRecording()

​Method Signature

​Return Value

​Implementation

​Cleanup Operations

​Usage Example

​Basic Usage

​Complete Integration Example

​Technical Specifications

​Audio Configuration

​Browser Compatibility

Build docs developers (and LLMs) love

createMicrophone()

Function Signature

Return Value

Internal State

Methods

requestPermission()

Method Signature

Return Value

Implementation

Error Handling

startRecording()

Method Signature

Parameters

Return Value

Implementation Details

Audio Buffering Strategy

stopRecording()

Method Signature

Return Value

Implementation

Cleanup Operations

Usage Example

Basic Usage

Complete Integration Example

Technical Specifications

Audio Configuration

Browser Compatibility