'filezilla'에 해당되는 글 1건

  1. 2017.04.18 중복 파일 제거 프로그램 작성하기
Project/pyrmdup2017. 4. 18. 01:05

* 폴더안의 중복 파일들을 제거 하는앱


* 전체 소스 : https://github.com/chobocho/pyrmdup 



* 아이디어 : 크기순 정렬 -> 1024 바이트씩 읽어서 해쉬값으로 사용


1. 폴더안의 모든 파일 읽기


2. 같은 크기의 파일끼리 모으기

    - List 1 :  크기가 65536 이상인 파일

    - List 2 :  크리가 65535 미만인 파일


3. 각각의 리스트에서 같은 크기의 파일이 2개 이상인, 파일들만 남기기

 

4. 각각의 리스트의 파일에서 1024 바이트씩 읽어서, 같은 값인 파일끼리 모으기 


5. List 1의 남은 파일 : 전수 비교


6. List 2의 남은 파일 : MD5 Hash 비교  


7. 같은 크기의 파일을 출력하기



update : 2017.4.23

Posted by chobocho