Python

3. 문자열 다루기

Uno_says 2024. 6. 28. 00:27
728x90

1. 문자열 다루기

파이썬에서 문자열은 텍스트 데이터를 다루는 데 사용되는 중요한 데이터 타입이다. 문자열은 작은 따옴표(')나 큰 따옴표("), 세 개의 따옴표(",""")로 둘러싸인 텍스트로 표현된다.

 

파이썬의 문자열은 유니코드(Unicode) 문자의 시퀀스로 구성되며, 문자열 값은 메모리에 저장되고 해당 값은 불변(immutable)한 특성을 가진다. 파이썬은 문자열 리터럴의 공유 문자열 최적화와 같은 기술을 사용하여 문자열을 메모리 효율적으로 다루도록 설계되었다.

최적화: 문자열 재사용

 

is 연산자는 파이썬에서 두 객체의 식별(Identity)을 비교할 때 사용되는 연산자이다. 객체의 식별은 메모리 내에서 객체가 저장된 위치를 의미한다. is 연산자는 두 객체가 동일한 메모리 위치에 저장되어 있는지 여부를 판단한다.

 

 

2. 문자열 재할당

파이썬에서 문자열은 불변(immutable)한 데이터 타입이므로 같은 변수에 문자열을 재할당하는 경우, 새로운 문자열 객체가 생성되고 변수는 새로운 문자열 객체를 참조하게 된다. 이전 문자열 객체는 변경되지 않는다.

 

 

3. 가비지 컬렉션

파이썬은 메모리 관리를 위해 참조 카운팅(reference counting) 메커니즘을 사용한다. 이 메커니즘은 객체가 얼마나 많은 변수에 의해 참조되고 있는지를 추적한다. 객체의 참조 카운트가 0이 되면 해당 객체는 더 이상 사용되지않으며, 가비지 컬렉션(garbage collection)에 의해 메모리에서 해제된다.

따라서 이전 문자열 객체에 더 이상 어떠한 변수도 참조하지 않을 때, 해당 문자열 객체는 참조 카운트가 0이 되며 가비지 컬렉션의 대상이 된다. 가비지 컬렉션은 주기적으로 실행되며 더 이상 사용되지 않는 객체를 메모리에서 해제하여 자동으로 메모리를 관리한다.

 

4. 문자열 함수와 연산자

4-1. 문자열 길이 확인하기(len()): 문자열의 길이를 반환한다.

 

4-2. 문자열 합치기(+): 두 문자열을 합쳐 새로운 문자열을 생성한다.

 

4-3. 문자열 반복하기(*): 문자열을 여러 번 반복하여 새로운 문자열을 생성한다.

 

4-4. 문자열 인덱싱과 슬라이싱: 문자열 내부의 문자에 인덱스를 사용하여 접근하거나 슬라이스할 수 있다.

 

 

5. 문자열 메서드

문자열 메서드는 문자열 객체에 적용되는 함수로, 문자열을 조작하거나 변환하는 다양한 작업을 수행할 수 있게 해준다.

 

5-1. upper()와 lower() - 대소문자 변환

 

5-2. count() - 특정 문자열의 등장 횟수 확인

 

5-3. find() - 특정 부분 문자열의 첫 번째 등장 위치(인덱스) 확인

 

5-4. replace() - 문자열 대체

'Python' 을 'World' 로 대체

 

5-5. strip() - 문자열 양쪽 공백 제거

 

5-6. split() - 문자열 분리(리스트로 출력)

split() : 디폴트값으로 공백을 기준으로 문자열을 분리한다.

 

5-7. join() - 문자열 결합

 

5-8. startswith() 와 endswith() - 접두사와 접미사 확인

728x90