Skip to content

Этот проект представляет собой мощный инструмент для поиска и анализа дублирующихся файлов в указанной директории. Программа позволяет эффективно выявлять одинаковые файлы на основе их содержимого, используя алгоритм хеширования SHA-256. Она поддерживает настройку параметров, таких как минимальный размер файла для проверки и игнорирование определен

Notifications You must be signed in to change notification settings

dffdgdg/FindDuplicates

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

Поиск дубликатов файлов

Python

Этот инструмент помогает находить одинаковые файлы в указанной директории. Он использует хеширование (SHA-256) для сравнения содержимого файлов, что делает процесс быстрым и надежным.


Содержание

  1. Описание
  2. Установка
  3. Использование
  4. Пример использования
  5. Требования

Описание

Программа сканирует заданную директорию и находит файлы с одинаковым содержимым. Это может быть полезно для:

  • Очистки жесткого диска от дубликатов.
  • Организации файлов.
  • Поиска копий документов или изображений.

Установка

  1. Убедитесь, что у вас установлен Python 3.6 или выше.

    • Проверить версию Python:
      python --version
  2. Клонируйте репозиторий:

    git clone https://github.com/dffdgdg/FindDuplicates.git
  3. Перейдите в директорию проекта:

    cd find-duplicate-files

Использование

Запустите программу, указав директорию для сканирования:

python find_duplicates.py /path/to/directory

Пример использования

python find_duplicates.py /path/to/directory --ignore *.tmp *.log --min-size 2048
  • /path/to/directory — директория для поиска.
  • --ignore *.tmp *.log — игнорировать файлы с расширениями .tmp и .log.
  • --min-size 2048 — проверять только файлы размером более 2048 байт.

Вывод программы:

2023-10-10 12:00:00,000 - INFO: Найдено 3 групп дубликатов:

📁 Группа 1:
   Хеш: abc123...
   Размер группы: 2 файлов
   Общий размер: 10.50 МБ
   - /path/to/directory/file1.txt
   - /path/to/directory/file2.txt

📁 Группа 2:
   Хеш: def456...
   Размер группы: 3 файлов
   Общий размер: 15.75 МБ
   - /path/to/directory/file3.txt
   - /path/to/directory/file4.txt
   - /path/to/directory/file5.txt

Требования

  • Python 3.6 или выше.
  • Базовые права доступа к файловой системе.

About

Этот проект представляет собой мощный инструмент для поиска и анализа дублирующихся файлов в указанной директории. Программа позволяет эффективно выявлять одинаковые файлы на основе их содержимого, используя алгоритм хеширования SHA-256. Она поддерживает настройку параметров, таких как минимальный размер файла для проверки и игнорирование определен

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages