🌱 Spring

자바 문자열에 섞여있는 HTML 코드 빼기

토심 2021. 10. 16. 00:01

예제 코드

package com.mylibrary;

import org.jsoup.Jsoup;

public class MyTest {
    public static void main(String[] args) {
        System.out.println(Jsoup.parse("<span class=\"blind\">검색</span>").text());
    }
}

출력

검색

 

 

 

사용법

(1) Jsoup을 사용한 방법으로 Jsoup 라이브러리가 추가되어있지 않다면 다운로드

https://jsoup.org/download

(2) 프로젝트 라이브러리에 다운로드한 jar 추가


(3) 사용

import org.jsoup.Jsoup;

public class MyTest {
    public static void main(String[] args) {
        System.out.println( Jsoup.parse(>>HTML코드를 빼버릴 문자열 입력<<).text() );
    }
}

Jsoup.parse(문자열).text() 을 한다는 것은 문자열에 속한 HTML 코드를 제외한 텍스트만 가져온다는 것

 

 

그럼 HTML 코드 밖에 문자열이 있다면?

package com.mylibrary;

import org.jsoup.Jsoup;

public class MyTest {
    public static void main(String[] args) {
        System.out.println("Test");

        System.out.println(Jsoup.parse("앞에도 될까? <span class=\"blind\">검색</span> 뒤에도 될까?").text());
    }
}

출력

HTML 코드를 제외한 모든 문자열이 추출 되었다.

 

 

 

 


커피 한 잔 후원하기