O ARFF (Attribute-Relation File Format, Formato de Arquivo de Atributo-Relação) é um formato de arquivo de texto desenvolvido pelo Grupo de Aprendizado de Máquina (Machine Learning Group) da Universidade de Waikato para descrever conjuntos de dados utilizados em aprendizado de máquina (machine learning). É primariamente utilizado com o software WEKA (Waikato Environment for Knowledge Analysis), mas também é suportado por outras ferramentas de aprendizado de máquina. Um arquivo ARFF consiste em uma seção de cabeçalho (header section) e uma seção de dados (data section). A seção de cabeçalho define o nome da relação (dataset name) e os atributos (features ou colunas) dos dados. Cada atributo é declarado com seu nome e tipo de dado (e.g., numérico, nominal, string, data). A seção de dados contém as instâncias de dados reais, com cada instância representada como uma lista de valores de atributos separados por vírgula. Valores ausentes são tipicamente representados por um ponto de interrogação (?). Os arquivos ARFF são projetados para serem legíveis por humanos e facilmente analisáveis por algoritmos de aprendizado de máquina, tornando-os uma escolha popular para armazenar e trocar conjuntos de dados na comunidade de machine learning. O formato suporta vários tipos de dados e permite a representação de dados tanto numéricos quanto categóricos, tornando-o versátil para uma ampla gama de tarefas de aprendizado de máquina.