BASH скрипт для поиска дубликатов текстовых файлов

Недавно какогото лешего взбрело в голову kmail и он затянул с почтового сервера все сообщения еще раз. В итоге получилось по 2 экземпляра всех входящих писем. Руками удалять — лень. Решил написать небольшой баш сркипт, вот так вышло:

#!/bin/bash

WORK_DIR="/home/black/.kde/share/apps/kmail/mail/inbox/cur"
LIST_ALL=`ls $WORK_DIR`

for MSG in $LIST_ALL
 do
  FILE_SIZE=`ls -l $WORK_DIR/$MSG |awk '{print $5}'`
  LIST_NEW=`find $WORK_DIR -size ${FILE_SIZE}c |grep -v $MSG`
    for TEST_MSG in $LIST_NEW
      do
         diff $TEST_MSG $WORK_DIR/$MSG > /dev/null && echo "Duplicate for $MSG is - $TEST_MSG" && rm $TEST_MSG
      done
done

Отлично отработал. Рекомендую для поиска дублей текстовых файлов.
Enjoy!

  1. Комментов пока нет

  1. Трэкбэков пока нет.

Why ask?