Команда uniq
в Bash используется для удаления дубликатов соседних строк в текстовых файлах. Она анализирует входные данные и выводит только уникальные строки, что делает её полезной для обработки и анализа текстовой информации.
Основной синтаксис команды выглядит следующим образом:
uniq [опции] [аргументы]
-c
: Подсчитывает количество повторений каждой уникальной строки.-d
: Выводит только строки, которые повторяются.-u
: Выводит только уникальные строки, которые не имеют дубликатов.-i
: Игнорирует регистр при сравнении строк.Вот несколько практических примеров использования команды uniq
:
uniq input.txt output.txt
uniq -c input.txt
uniq -d input.txt
uniq -i input.txt output.txt
uniq
, убедитесь, что строки отсортированы, так как команда удаляет только соседние дубликаты. Используйте команду sort
для предварительной сортировки:
sort input.txt | uniq > output.txt
uniq
в сочетании с sort
и tee
для обработки данных по частям.-c
, чтобы быстро получить статистику по дубликатам, что может быть полезно для анализа данных.