기준선 생성
릴리스 빌드, 대표 입력, 반복 횟수, 측정 장비를 고정해 비교 가능한 baseline을 둔다.
성능 도구는 숫자를 주지만 어떤 질문으로 측정했는지가 더 중요하다. CPU 시간, 할당, 캐시, 대기 시간을 분리해야 최적화 방향이 흔들리지 않는다.
릴리스 빌드, 대표 입력, 반복 횟수, 측정 장비를 고정해 비교 가능한 baseline을 둔다.
느린 함수, 잦은 할당, lock 대기, cache miss 중 무엇이 병목인지 도구로 확인한다.
최적화 하나가 전체 지표를 얼마나 바꾸는지 확인하고 다음 변경으로 넘어간다.
// 목표: p95 latency를 40ms 이하로 낮춘다.
// 고정: release build, production-sized input, 30 runs.
// 관찰: CPU samples, allocations, lock wait time.