본문 바로가기

학습 내용 정리/Computer Science

String Tokenizer vs split

728x90

split = 토큰화에 대한 생각을 항해 잡담방에 올렸다.
그 뒤 재밌는 질문을 받게 되었다.

그러면 StringToken방식이랑 split메서드에 차이도 크게 있을까요?? 혹은 split메서드는 배열을 따로 받아 사용하는데 메모리관점에서 비효율적인게 아닐까요?? 궁금해서 댓글 남겨요!


질문에 답변 드리기 위해 조사한 결과를 기록한다.

안녕하세요 __ 님 :) 토큰화 방식은 필요에 따라 다른 메서드를 활용하면 좋을 것 같다고 생각합니다.

조사한 내용을 공유 드립니다!

StringTokenizer는 빈 문자열을 토큰으로 인식하지 않지만 split는 빈 문자열을 토큰으로 인식하는 차이가 있습니다.

StringTokenizer는 결과값이 문자열이라면 split는 결과 값이 문자열 배열입니다.
따라서 StringTokenizer를 이용할 경우 전체 토큰을 보고싶다면 반복문을 이용해 하나하나 뽑을 수 밖에 없습니다.



참고자료 : https://dev-coco.tistory.com/94


'학습 내용 정리 > Computer Science' 카테고리의 다른 글

LLM 대형 언어 모델 (거대 언어 모델)  (0) 2023.10.26
웹 호환성 (Cross Browsing)  (0) 2023.10.12
웹표준 (Web Standards)  (0) 2023.10.12
웹 접근성 (Web Accessibility)  (2) 2023.10.12
시간 복잡도  (0) 2023.09.15