El ARFF (Attribute-Relation File Format o Formato de Archivo de Relación de Atributos) es un formato de archivo de texto desarrollado por el Grupo de Aprendizaje Automático (Machine Learning Group) de la Universidad de Waikato para describir conjuntos de datos utilizados en el aprendizaje automático (machine learning). Se utiliza principalmente con el software WEKA (Waikato Environment for Knowledge Analysis), pero también es compatible con otras herramientas de machine learning. Un archivo ARFF consta de dos secciones principales: una sección de encabezado (header section) y una sección de datos (data section).
La sección de encabezado define el nombre de la relación (relation name, o nombre del conjunto de datos) y los atributos (features o columnas) de los datos. Cada atributo se declara con su nombre y tipo de dato específico (por ejemplo, numeric, nominal, string, date). La sección de datos contiene las instancias de datos reales, donde cada instancia se representa como una lista de valores de atributos separados por comas. Los valores faltantes (missing values) se representan típicamente con un signo de interrogación (?). Los archivos ARFF están diseñados para ser legibles por humanos y fácilmente analizados (parsed) por algoritmos de aprendizaje automático, lo que los convierte en una opción popular para almacenar e intercambiar datasets en la comunidad de machine learning. El formato admite varios tipos de datos y permite la representación de datos tanto numéricos como categóricos, lo que lo hace versátil para una amplia gama de tareas de aprendizaje automático.