10 просмотров

Как анализировать текстовые файлы с помощью Perl

Бизнесмен с помощью компьютера в офисе

Синтаксический анализ текстовых файлов — одна из причин, по которой Perl является отличным инструментом для анализа данных и написания сценариев.

Как вы увидите ниже, Perl можно использовать для переформатирования группы текста. Если вы посмотрите на первый фрагмент текста, а затем на последнюю часть внизу страницы, вы увидите, что код в середине — это то, что преобразует первый набор во второй.

Как анализировать текстовые файлы

В качестве примера давайте создадим небольшую программу, которая открывает файл данных, разделенный табуляцией, и анализирует столбцы во что-то, что мы можем использовать.

Скажем, например, что ваш начальник передает вам файл со списком имен, адресов электронной почты и номеров телефонов и хочет, чтобы вы прочитали файл и что-то сделали с информацией, например, поместили ее в базу данных или просто распечатали. в красиво оформленном отчете.

Столбцы файла разделены символом TAB и будут выглядеть примерно так:

Вот полный список, с которым мы будем работать:

Примечание: Это берет некоторый код из учебника о том, как читать и записывать файлы в Perl.

Сначала он открывает файл с именем data.txt (который должен находиться в том же каталоге, что и сценарий Perl). Затем он считывает файл в общую переменную $_ построчно. В этом случае $_ подразумеваемый и фактически не используется в коде.

После чтения строки любые пробелы удаляются с ее конца. Затем функция разделения используется для разрыва строки на символе табуляции. В этом случае вкладка представлена ​​кодом т. Слева от знака разделения вы увидите, что я назначаю группу из трех разных переменных. Они представляют по одному для каждого столбца строки.

Наконец, каждая переменная, которая была отделена от строки файла, печатается отдельно, чтобы вы могли видеть, как получить доступ к данным каждого столбца по отдельности.

Вывод скрипта должен выглядеть примерно так:

Хотя в этом примере мы просто распечатываем данные, было бы тривиально легко сохранить ту же информацию, проанализированную из файла TSV или CSV, в полноценной базе данных.

голоса
Рейтинг статьи
Статья в тему:  Купер против Аарона: дело Верховного суда, аргументы, влияние
Ссылка на основную публикацию
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x