Linux
大數據 + 什麼是正確的文件系統 ext4 或 xfs?
我們有 Linux Redhat 7.2 版,帶有 xfs 文件系統。
from /etc/fstab /dev/mapper/vgCLU_HDP-root / xfs defaults 0 0 UUID=7de1ab5c-b605-4b6f-bdf1-f1e8658fb9 /boot xfs defaults 0 0 /dev/mapper/vg /dev/mapper/vgCLU_HDP-root / xfs defaults 0 0 UUID=7de1dc5c-b605-4a6f-bdf1-f1e869f6ffb9 /boot xfs defaults 0 0 /dev/mapper/vgCLU_HDP-var /var xfs defaults 0 0 var /var xfs defaults 0 0
這些機器用於 hadoop 集群。
我只是想為此目的最好的文件系統是什麼?
那麼對於用於 hadoop 集群的機器來說,EXT4 或 XFS 有什麼更好的呢?
此知識庫文章對此進行了說明;您的主要考慮因素是可用的支持級別:Ext4 支持高達 50TB,XFS 支持高達 500TB。對於真正的大數據,您可能最終會查看共享儲存,預設情況下這意味著 RHEL 7 上的 GFS2,但對於 Hadoop,您將使用 HDFS 或 GlusterFS。
對於 RHEL 上的本地儲存,預設是 XFS,除非您有特定的理由不這樣做,否則您通常應該使用它。
XFS 是一個了不起的文件系統,尤其是對於大文件。如果您的負載涉及大量小文件,則定期清理任何碎片可能會提高性能。我不擔心,所有負載都使用 XFS。它得到了很好的支持,所以沒有理由不使用它。
如果您想找出最適合您的典型工作負載的方法,請留出一台機器和磁碟用於您自己測試各種文件系統。在整個磁碟上逐步執行測試負載可以告訴您有關正在測試的文件系統如何工作的一些資訊。
測試機器上的負載是唯一可以確定的方法。