Il formato Apache Arrow IPC Stream è un formato di serializzazione progettato per il trasferimento e l'archiviazione efficiente dei dati, in particolare all'interno dell'ecosistema Apache Arrow. Si tratta di un formato binario ottimizzato per i dati colonnari (columnar data), il che significa che i dati sono organizzati per colonne anziché per righe. Questa disposizione colonnare (columnar layout) consente operazioni vettorializzate (vectorized operations) e prestazioni migliorate durante l'elaborazione di grandi insiemi di dati (datasets). Il formato IPC Stream viene tipicamente utilizzato per lo streaming di dati tra processi o sistemi che utilizzano Apache Arrow. È progettato per essere agnostico rispetto al linguaggio (language-agnostic), consentendo uno scambio di dati senza interruzioni tra applicazioni scritte in diversi linguaggi di programmazione. Il formato include metadati (metadata) che descrivono lo schema (schema) dei dati, permettendo all'estremità ricevente di interpretare correttamente i dati senza conoscenza preliminare. Lo stream consiste in una sequenza di messaggi, ciascuno contenente uno schema e un batch di dati. Ciò consente una gestione efficiente di grandi insiemi di dati che potrebbero non rientrare interamente nella memoria. Il formato è ampiamente utilizzato nell'analisi dei dati (data analytics), nell'apprendimento automatico (machine learning) e in altre applicazioni ad alta intensità di dati (data-intensive), dove le prestazioni e l'interoperabilità sono fondamentali.