Compression
pdf,djvu和圖像的最高壓縮比壓縮器是什麼
到目前為止,評論還沒有具體說明他們需要壓縮的文件類型,也沒有得到明確的答案
我有一個 1 TB 的硬碟驅動器,其中大部分是 pdf、djvu,其餘的是圖像,我需要將其壓縮到盡可能小的大小,而且我不在乎速度。
我嘗試了 kgb,但它並沒有充分利用我的 cpu。
我試過 tar.lzr、tar.lzma 和 tar.7z。tar.lzr 是最好的,但它沒有提供我預期的那麼多。
我也注意到 nanozip,但我看到很多人報告了它的問題,即使它在我看到的基準測試中所佔的百分比最高,所以有人以前有過使用它的經驗嗎?
7z 和 lzma 是相同的壓縮算法,使用不同的容器。
7z
啟用可靠存檔模式的效果應該和 一樣好tar.7z
,並且提供對單個文件的隨機隨機訪問也不那麼糟糕。(不過還是很糟糕。)pdf 內部使用 gzip,這使得它不是很可壓縮。大多數圖像格式相同(儘管熵編碼器的選擇各不相同;IIRC JPEG 的熵編碼器更簡單)。
理論上,我不知道這個想法的任何實現,你可以有一個存檔器來撤銷簡單的 gzip 或 pdf、png、jpeg 和各種其他已經壓縮的文件格式的其他熵編碼。然後用像 LZMA 這樣的好東西壓縮那個流。提取時,您將從 LZMA 流中提取數據,並對需要它的部分重新進行 pdf 內部壓縮。您的輸出將是相同的 pdf/jpg/whatever,但文件可能具有不同的校驗和/雜湊。(所以它對於最終渲染的像素是無損的,但不是文件字節。)
PNG 和 jpeg 優化器在某種程度上為單個文件實現了這個想法:用 gzip -9 的等效值而不是預設值重做內部壓縮。
最好的辦法是嘗試使用各種壓縮器壓縮 1GB 左右的樣本,看看什麼效果好。1GB 應該是有代表性的,因為這對於字典大小來說是合理的。