FILESYSTEM OPS

파일 시스템 문제 확인 지표

파일 시스템 장애는 “디스크 문제” 하나로 묶으면 늦다. 블록 공간, inode 고갈, mount 옵션, journal/fsck 상태, 권한 문제를 각각 확인해야 한다.

01

공간 확인

블록 사용량과 inode 사용량을 나눠 본다. 용량이 남아도 inode가 100%면 파일 생성이 실패한다.

df -h / df -i
02

마운트 상태

파일 시스템이 read-only로 remount 되었는지, 옵션이 실행/쓰기 정책과 맞는지 본다.

mount options
03

무결성 확인

비정상 종료 뒤 journal replay, fsck 필요, bad block 로그를 확인한다.

dmesg/fsck
04

파일 핸들/권한

삭제했는데 공간이 안 비면 열린 파일 핸들, 권한 오류면 ACL/소유자를 본다.

lsof/permissions
No space left
블록 또는 inode 고갈 작은 파일이 많으면 inode가 먼저 고갈될 수 있다.
ENOSPC
Read-only FS
오류 후 보호 모드 전환 커널이 손상 방지를 위해 ro로 바꿨는지 로그를 확인한다.
remount-ro
Deleted but full
프로세스가 삭제 파일을 계속 열고 있음 lsof로 deleted 파일 핸들을 찾아 재시작하거나 닫는다.
open fd
Permission denied
소유권, mode, ACL, mount 옵션 문제 chmod만 보기보다 ACL과 noexec/nosuid 옵션까지 확인한다.
접근 경로

운영 예방

모니터링 블록 사용률, inode 사용률, read-only remount 이벤트를 모두 알림에 둔다.
백업 fsck 전에는 가능한 한 스냅샷/백업 상태를 확인한다.
로그 회전 로그 폭증과 삭제 후 열린 핸들 문제를 logrotate/restart 정책으로 줄인다.