Skip to content

Latest commit

 

History

History
323 lines (203 loc) · 8.53 KB

File metadata and controls

323 lines (203 loc) · 8.53 KB

RegExp

정규 표현식이란?

문자열을 대상으로 패턴 매칭 기능을 제공하는 형식 언어.

정규 표현식을 사용하면 문자열을 반복문과 조건문 없이 패턴을 정의하고 테스트하는 것으로 간단히 체크할 수 있다.

정규 표현식의 생성

정규 표현식 객체를 생성하기 위해서는 정규표현식 리터럴과 RegExp 생성자 함수를 사용할 수 있다.

정규 표현식 리터럴 표현 방법은 다음과 같다.

Image

const target = 'Is this all there is?';

// 패턴: is
// 플래그: i => 대소문자를 구별하지 않고 검색한다.
const regexp = /is/i;

// test 메서드는 target 문자열에 대해 정규 표현식 regexp의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환한다.
regexp.test(target); // -> true

RegExp 생성자 함수를 사용하여 RegExp 객체를 생성할 수도 있다.

/**
* pattern: 정규 표현식의 패턴
* flags: 정규 표현식의 플래스(g, i, m, u, y)
*/

new RegExp(pattern[, flags])
const target = 'Is this all there is?';

const regexp = new RegExp(/is/i);

regexp.test(target); // -> true

RegExp 생성자 함수를 사용하면 변수를 사용해 동적으로 RegExp 객체를 생성할 수 있다.

RegExp 메서드

RegExp.prototpe.exec

인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환한다.
매칭 결과가 없는 경우 null 반환.

const target = 'Is this all there is?';
const regExp = /is/;

regExp.exec(target);
// -> ["is", index: 5, input: "Is this all there is?", groups: undefined]

문자열 내의 모든 패턴을 검색하는 g 플래그를 지정해도 첫 번째 매칭 결과만 반환.

RegExp.prototype.test

인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환한다.

String.prototype.match

String 표준 빌트인 객체가 제공하며 대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환한다.

const target = 'Is this all there is?';
const regExp = /is/;

target.match(regExp);
// -> ["is", index: 5, input: "Is this all there is?", groups: undefined]

문자열 내의 모든 패턴을 검색하는 g 플래그가 지정되면 모든 매칭 결과를 배열로 반환한다.

const target = 'Is this all there is?';
const regExp = /is/g;

target.match(regExp);
// -> ["is", "is"]

플래그

정규 표현식의 검색 방법을 설정하기 위해 사용.

플래그 의미 설명
i Ignore case 대소문자를 구별하지 않고 패턴을 검색
g Global 대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색
m Multi line 문자열의 행이 바뀌더라도 패턴 검색을 계속함

순서와 상관없이 하나 이상의 플래그를 동시에 설정할 수 있다.

패턴

정규 표현식의 패턴은 문자열의 일정한 규칙을 표현하기 위해 사용.

/로 열고 닫으며 문자열의 따옴표는 생략한다.

문자열 검색

정규 표현식의 패턴에 문자 또는 문자열을 지정하면 검색 대상 문자열에서 패턴으로 지정한 문자 또는 문자열을 검색한다.
RegExp 메서드를 사용하여 검색 대상 문자열과 정규 표현식의 매칭 결과를 구하면 검색이 수행된다.

임의의 문자열 검색

.은 임의의 문자열 한 개를 의미한다. 문자의 내용은 무엇이든 상관 없다.

const target = 'Is this all there is?'

// 임의의 3자리 문자열을 대소문자를 구별하여 전역 검색한다.
const regExp = /.../g;

target.match(regExp); // -> ["Is ", "thi", "s a", "ll ", "the", "re ", "is?"]

반복 검색

{m,n}은 앞선 패턴이 최소 m번, 최대 n번 반복되는 문자열을 의미한다.
콤마 뒤에 공백이 있으면 정상 동작하지 않으므로 주의해야 한다.

const target = 'A AA B BB Aa Bb AAA';

// 'A'가 최소 1번, 최대 2번 반복되는 문자열을 전역 검색한다.
const regExp = /A{1,2}/g;

target.match(regExp); // -> ["A", "AA", "A", "AA", "A"]

{n}은 앞선 패턴이 n번 반복되는 문자열을 의미한다.
{n,n}과 같다.

const target = 'A AA B BB Aa Bb AAA';

// 'A'가 2번 반복되는 문자열을 전역 검색한다.
const regExp = /A{2}/g;

target.match(regExp); // -> ["AA", "AA"]

{n,}은 앞선 패턴이 최소 n번 이상 반복되는 문자열을 의미한다.

const target = 'A AA B BB Aa Bb AAA';

// 'A'가 최소 2번 이상 반복되는 문자열을 전역 검색한다.
const regExp = /A{2,}/g;

target.match(regExp); // -> ["AA", "AAA"]

+는 앞선 패턴이 최소 한번 이상 반복되는 문자열을 의미한다.
즉, +는 {1,}과 같다.

const target = 'A AA B BB Aa Bb AAA';

// 'A'가 최소 한 번 이상 반복되는 문자열을 전역 검색한다.
const regExp = /A+/g;

target.match(regExp); // -> ["A", "AA", "A", "AAA"]

?는 앞선 패턴이 최대 한 번(0번 포함) 이상 반복되는 문자열을 의미한다.
즉, ?는 {0,1}과 같다.

const target = 'color colour';

// 'colo' 다음 'u'가 최대 한 번(0번 포함) 이상 반복되고 'r'이 이어지는 문자열 'color'와 'colour'를 전역 검색한다.
const regExp = /colu?r/g;

target.match(regExp); // -> ["color", "colour"]

OR 검색

|은 or의 의미를 갖는다.
/A|B/는 'A' 또는 'B'를 의미한다.

const target = 'A AA B BB Aa Bb';

const regExp = /A|B/g;

target.match(regExp); // -> ["A", "A", "A", "B", "B", "B", "A", "B"]

분해되지 않은 단어 레벨로 검색하기 위해서는 +를 함께 사용한다.

const target = 'A AA B BB Aa Bb';

// 'A' 또는 'B'가 한 번 이상 반복되는 문자열을 전역 검색한다.
const regExp = /A+|B+/g;

target.match(regExp); // -> ["A", "AA", "B", "BB", "A", "B"]

/A+|B+/를 대괄호 []로 묶어 /[AB]+/로 사용할 수 있다.

범위를 지정하려면 [] 내에 -를 사용한다.

const target = 'A AA B ZZ Aa Bb';

// 'A' ~ 'Z'가 한 번 이상 반복되는 문자열을 전역 검색한다.
const regExp = /A-Z/g;

target.match(regExp); // -> ["A", "AA", "B", "ZZ", "A", "B"]

대소문자를 구별하지 않고 알파벳을 검색하는 방법은 다음과 같다.

const target = 'AA BB Aa Bb 12';

const regExp = /A-Za-z/g;

target.match(regExp); // -> ["AA", "BB", "Aa", "Bb"]

숫자는 다음과 같이 검색한다.

const target = 'AA BB 12,345';

// '0' ~ '9'가 한 번 이상 반복되는 문자열을 전역 검색한다.
const regExp = /[0-9]+/g;

target.match(regExp); // ["12", "345"]

위 예제에서는 쉼표 때문에 매칭 결과가 분리되므로 쉼표를 패턴에 포함시킨다.

const target = 'AA BB 12,345';

// '0' ~ '9' 또는 ','가 한 번 이상 반복되는 문자열을 전역 검색한다.
const regExp = /[0-9,]+/g;

target.match(regExp); // ["12,345"]

위 예제를 간단히 \d로 표현할 수 있다.
\D는 숫자가 아닌 문자를 의미한다.

const target = 'AA BB 12,345';

// '0' ~ '9'가 한 번 이상 반복되는 문자열을 전역 검색한다.
let regExp = /[\d,]+/g;

target.match(regExp); // ["12,345"]

regExp = /[\D,]+/g;

target.match(regExp); // ["AA BB ", ","]

\w는 알파벳, 숫자, 언더스코어를 의미한다. 즉, [A-Za-z0-9_]와 같다.
\W는 알파벳, 숫자, 언더스코어가 아닌 문자를 의미한다.

const target = 'Aa Bb 12,345 _$%&';

let regExp = /[\w,]+/g;

target.match(regExp); // -> ["Aa", "Bb", "12,345", "_"]

regExp /[\W,]+/g;

target.match(regExp); // -> [" ", " ", ",", " $%&"]

NOT 검색

[...] 내의 ^은 not의 의미를 갖는다.

const target = 'AA BB 12 Aa Bb';

const regExp = /[^0-9]+/g;

target.match(regExp); // -> ["AA BB ", " Aa Bb"]

시작 위치로 검색

[...] 밖의 ^는 문자열의 시작을 의미한다.

const target = 'https://afdkfksdjfka.com';

const regExp = /^https/;

regExp.test(target); // -> true

마지막 위치로 검색

$는 문자열의 마지막을 의미한다.

const target = 'https://afdkfksdjfka.com';

const regExp = /com$/;

regExp.test(target); // -> true