La vie

Comment analyser des fichiers texte avec Perl

Comment analyser des fichiers texte avec Perl



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

L’analyse des fichiers texte est l’une des raisons pour lesquelles Perl est un excellent outil d’exploration de données et de script.

Comme vous le verrez ci-dessous, Perl peut être utilisé pour reformater un groupe de texte. Si vous regardez le premier bloc de texte, puis la dernière partie en bas de la page, vous pouvez voir que le code au milieu est ce qui transforme le premier ensemble en deuxième.

Comment analyser les fichiers texte

Par exemple, construisons un petit programme qui ouvre un fichier de données séparé par des tabulations et analyse les colonnes pour en faire quelque chose.

Par exemple, votre patron vous remet un fichier avec une liste de noms, adresses e-mail et numéros de téléphone, et vous demande de le lire et de faire quelque chose avec les informations, comme le mettre dans une base de données ou tout simplement l'imprimer dans un rapport bien formaté.

Les colonnes du fichier sont séparées par le caractère de tabulation et ressembleraient à ceci:

Larry [email protected] 111-1111

Curly [email protected] 222-2222

Moe [email protected] 333-3333

Voici la liste complète avec laquelle nous allons travailler:

#! / usr / bin / perl

open (FILE, 'data.txt');

tandis que () {

chomp;

($ name, $ email, $ phone) = split (" t");

print "Nom: $ nom n";

print "Email: $ email n";

print "Phone: $ phone n";

print "--------- n";

}

Fermer le fichier);

sortie;

Remarque: Cela extrait du code du tutoriel sur la lecture et l’écriture de fichiers en Perl.

Ce qu’il fait en premier lieu, c’est d’ouvrir un fichier appelé data.txt (qui devrait résider dans le même répertoire que le script Perl). Ensuite, il lit le fichier dans la variable fourre-tout $ _ ligne par ligne. Dans ce cas, le $ _ est implicite et pas réellement utilisé dans le code.

Après avoir lu une ligne, tous les espaces blancs sont supprimés à la fin. Ensuite, la fonction split est utilisée pour couper la ligne sur le caractère de tabulation. Dans ce cas, l'onglet est représenté par le code t. À la gauche du signe de la scission, vous verrez que j'attribue un groupe de trois variables différentes. Celles-ci représentent un pour chaque colonne de la ligne.

Enfin, chaque variable séparée de la ligne du fichier est imprimée séparément afin que vous puissiez voir comment accéder aux données de chaque colonne individuellement.

La sortie du script devrait ressembler à ceci:

Nom: Larry

Email: [email protected]

Téléphone: 111-1111

---------

Nom: Curly

Email: [email protected]

Téléphone: 222-2222

---------

Nom: Moe

Email: [email protected]

Téléphone: 333-3333

---------

Bien que, dans cet exemple, nous imprimions simplement les données, il serait très facile de stocker les mêmes informations analysées à partir d'un fichier TSV ou CSV, dans une base de données complète.


Voir la vidéo: Utiliser un lecteur de code-barres douchette sur Excel et Access (Août 2022).