traitement de texte brut : ensemble des opérations effectuées sur un texte non formaté, généralement constitué de caractères ASCII, afin de le préparer pour une analyse ou un traitement ultérieur. Ce type de texte ne contient pas de mise en forme, de balises ou d'éléments graphiques.
Le traitement de texte brut est souvent la première étape dans le processus d'analyse de données textuelles.
Les programmeurs utilisent fréquemment le traitement de texte brut pour manipuler des fichiers de configuration.
Avant d'appliquer des algorithmes de traitement de langage naturel, il est essentiel d'effectuer un traitement de texte brut sur les données collectées.