문자열 단위 판단 기준

UTF-8 문자열은 원하는 단위를 우선 선택한다

Rust 문자열은 바이트로 저장되지만 사람이 보는 글자와 바이트 경계가 같지 않으므로 처리 단위를 먼저 정해야 합니다.

01

소유 문자열

String은 수정과 저장에 적합하고 힙에 UTF-8 바이트를 소유합니다.

02

문자열 슬라이스

&str은 빌린 문자열 조각이며 반드시 유효한 UTF-8 경계만 가리킵니다.

03

반복 단위

bytes는 원시 바이트, chars는 유니코드 스칼라 값을 순회하므로 화면 글자와 다를 수 있습니다.

1

unit

바이트, char, 단어, 사용자 눈의 글자 중 목표 단위를 정합니다.

2

경계

문자열 슬라이스가 UTF-8 경계에 맞는지 확인합니다.

3

allocation

새 문자열이 필요한지 빌린 &str로 충분한지 봅니다.

4

display

사용자 표시용 처리는 grapheme crate가 필요한지 검토합니다.