Этот инструмент помогает находить одинаковые файлы в указанной директории. Он использует хеширование (SHA-256) для сравнения содержимого файлов, что делает процесс быстрым и надежным.
Программа сканирует заданную директорию и находит файлы с одинаковым содержимым. Это может быть полезно для:
- Очистки жесткого диска от дубликатов.
- Организации файлов.
- Поиска копий документов или изображений.
-
Убедитесь, что у вас установлен Python 3.6 или выше.
- Проверить версию Python:
python --version
- Проверить версию Python:
-
Клонируйте репозиторий:
git clone https://github.com/dffdgdg/FindDuplicates.git
-
Перейдите в директорию проекта:
cd find-duplicate-files
Запустите программу, указав директорию для сканирования:
python find_duplicates.py /path/to/directory
python find_duplicates.py /path/to/directory --ignore *.tmp *.log --min-size 2048
/path/to/directory
— директория для поиска.--ignore *.tmp *.log
— игнорировать файлы с расширениями.tmp
и.log
.--min-size 2048
— проверять только файлы размером более 2048 байт.
2023-10-10 12:00:00,000 - INFO: Найдено 3 групп дубликатов:
📁 Группа 1:
Хеш: abc123...
Размер группы: 2 файлов
Общий размер: 10.50 МБ
- /path/to/directory/file1.txt
- /path/to/directory/file2.txt
📁 Группа 2:
Хеш: def456...
Размер группы: 3 файлов
Общий размер: 15.75 МБ
- /path/to/directory/file3.txt
- /path/to/directory/file4.txt
- /path/to/directory/file5.txt
- Python 3.6 или выше.
- Базовые права доступа к файловой системе.