UnZip 패키지에는 ZIP 추출 유틸리티가 포함되어 있습니다. 이 유틸리티는 ZIP 아카이브에서 파일을 추출하는 데 유용합니다. ZIP 아카이브는 주로 DOS 환경에서 PKZIP 또는 Info-ZIP 유틸리티를 사용하여 생성됩니다.
이 패키지는 LFS 12.1 플랫폼을 사용하여 빌드하고 제대로 작동하는 것으로 알려져 있습니다.
주의 이전 버전의 UnZip 패키지에는 일부 로캘 관련 문제가 있었습니다. 현재 이러한 로캘 문제를 테스트할 수 있는 BLFS 편집기는 없습니다. 따라서 로캘 관련 정보는 이 페이지에 남아 있지만 테스트되지 않았습니다. 이러한 문제에 대한 보다 일반적인 논의는 Locale Related Issues 페이지의 Program Assumes Encoding 섹션에서 확인할 수 있습니다.
참고 BLFS 지침에서는 파일 이름에 ASCII가 아닌 문자가 포함된 파일을 추출할 때 UnZip을 사용하지 않으므로 JDK, Mozilla, DocBook 또는 기타 BLFS 패키지 설치에서 UnZip을 사용하는 것은 문제가 되지 않습니다.
이러한 문제는 패치에서 해결될 것으로 예상됩니다. 그러나 편집자 중 누구도 이 문제를 테스트할 데이터가 없기 때문에 여전히 필요할 경우를 대비하여 다음과 같은 해결 방법을 유지합니다.
UnZip 패키지는 비유닉스 시스템에서 생성된 ZIP 아카이브에 저장된 파일명이 CP850으로 인코딩되고 파일시스템에 파일을 쓸 때 ISO-8859-1로 변환되어야 한다고 가정합니다. 하지만 이러한 가정이 항상 유효한 것은 아닙니다. 실제로 ZIP 아카이브 내부에서 파일 이름은 해당 국가에서 사용 중인 DOS 코드 페이지로 인코딩되며 디스크의 파일 이름은 로케일 인코딩으로 되어 있어야 합니다. MS Windows에서는 User32.DLL의 OemToChar() C 함수가 올바른 변환을 수행하지만(실제로 MS Windows가 미국 영어를 사용하도록 설정된 경우 CP850에서 ISO-8859-1의 상위 집합으로 변환됨) Linux에는 이에 상응하는 함수가 없습니다.
unzip을 사용하여 ASCII가 아닌 파일명이 포함된 ZIP 아카이브의 압축을 풀 때 인코딩 가정 중 하나라도 잘못되면 unzip이 부적절한 변환을 사용하기 때문에 파일명이 손상됩니다. 예를 들어, ru_RU.KOI8-R 로캘에서는 파일 이름을 CP866에서 KOI8-R로 변환해야 하지만, CP850에서 ISO-8859-1로 변환하면 단어 대신 해독할 수 없는 문자로 구성된 파일 이름이 생성됩니다(영어 전용 사용자가 이해할 수 있는 가장 가까운 예는 rot13입니다). 이 제한을 해결하는 방법에는 여러 가지가 있습니다:
zh_CN.UTF-8
로캘에 대한 예제입니다:
convmv -f cp936 -t utf-8 -r --nosmart --notest \
</path/to/unzipped/files>
먼저 패치를 적용합니다:
patch -Np1 -i ../unzip-6.0-consolidated_fixes-1.patch
make -f unix/Makefile generic
이제 root 사용자로서
make prefix=/usr MANDIR=/usr/share/man/man1 \
-f unix/Makefile install