development

Java의 HTTP URL 주소 인코딩

big-blog 2020. 2. 29. 15:23
반응형

Java의 HTTP URL 주소 인코딩


Java 독립형 응용 프로그램은 사용자로부터 URL (파일을 가리키는)을 가져 와서 다운로드하여 다운로드해야합니다. 내가 직면 한 문제는 HTTP URL 주소를 올바르게 인코딩 할 수 없다는 것입니다 ...

예:

URL:  http://search.barnesandnoble.com/booksearch/first book.pdf

java.net.URLEncoder.encode(url.toString(), "ISO-8859-1");

나를 돌려줍니다 :

http%3A%2F%2Fsearch.barnesandnoble.com%2Fbooksearch%2Ffirst+book.pdf

하지만 내가 원하는 것은

http://search.barnesandnoble.com/booksearch/first%20book.pdf

(공간이 % 20으로 대체 됨)

URLEncoderHTTP URL을 인코딩하도록 설계되지 않은 것 같습니다 . JavaDoc에 "HTML 양식 인코딩을위한 유틸리티 클래스"라고 표시되어 있습니다. 다른 방법이 있습니까?


java.net.URI의의 클래스는 도움이 될 수 있습니다; 찾은 URL 문서에서

URI 클래스는 특정 상황에서 구성 요소 필드의 이스케이프를 수행합니다. URL 인코딩 및 디코딩 관리에 권장되는 방법은 URI를 사용하는 것입니다.

다음과 같이 둘 이상의 인수가있는 생성자 중 하나를 사용하십시오.

URI uri = new URI(
    "http", 
    "search.barnesandnoble.com", 
    "/booksearch/first book.pdf",
    null);
URL url = uri.toURL();
//or String request = uri.toString();

(URI의 단일 인수 생성자는 잘못된 문자를 이스케이프하지 않습니다)


위의 코드로 잘못된 문자 만 이스케이프 처리합니다. 비 ASCII 문자는 이스케이프하지 않습니다 (fathi의 설명 참조).
toASCIIString메소드는 US-ASCII 문자로만 문자열을 가져 오는 데 사용할 수 있습니다.

URI uri = new URI(
    "http", 
    "search.barnesandnoble.com", 
    "/booksearch/é",
    null);
String request = uri.toASCIIString();

과 같은 쿼리가있는 URL http://www.google.com/ig/api?weather=São Paulo의 경우 생성자의 5 매개 변수 버전을 사용하십시오.

URI uri = new URI(
        "http", 
        "www.google.com", 
        "/ig/api",
        "weather=São Paulo",
        null);
String request = uri.toASCIIString();

위의 답변 대부분이 부정확하다는 점에 유의하십시오.

URLEncoder클래스는, 이름이에도 불구하고, 여기에 필요한 것을 아니다. Sun이이 클래스를 그렇게 성가신 이름으로 명명 한 것은 유감입니다. URLEncoderURL 자체를 인코딩하는 것이 아니라 매개 변수로 데이터를 전달하기위한 것입니다.

즉, "http://search.barnesandnoble.com/booksearch/first book.pdf"URL입니다. 매개 변수는 예를 들어 "http://search.barnesandnoble.com/booksearch/first book.pdf?parameter1=this&param2=that"입니다. 매개 변수가 사용 URLEncoder됩니다.

다음 두 가지 예는이 두 가지의 차이점을 강조합니다.

다음은 HTTP 표준에 따라 잘못된 매개 변수를 생성합니다. 앰퍼샌드 (&) 및 더하기 (+)가 잘못 인코딩되었습니다.

uri = new URI("http", null, "www.google.com", 80, 
"/help/me/book name+me/", "MY CRZY QUERY! +&+ :)", null);

// URI: http://www.google.com:80/help/me/book%20name+me/?MY%20CRZY%20QUERY!%20+&+%20:)

다음은 쿼리가 올바르게 인코딩 된 올바른 매개 변수를 생성합니다. 공백, 앰퍼샌드 및 더하기 표시에 유의하십시오.

uri = new URI("http", null, "www.google.com", 80, "/help/me/book name+me/", URLEncoder.encode("MY CRZY QUERY! +&+ :)", "UTF-8"), null);

// URI: http://www.google.com:80/help/me/book%20name+me/?MY+CRZY+QUERY%2521+%252B%2526%252B+%253A%2529

여기에 Android 사용자를 대상으로 한 제안을 추가하겠습니다. 외부 라이브러리를 얻지 않아도되도록 할 수 있습니다. 또한 위의 답변 중 일부에서 제안 된 모든 검색 / 대체 문자 솔루션은 위험하므로 피해야합니다.

이것을 시도하십시오 :

String urlStr = "http://abc.dev.domain.com/0007AC/ads/800x480 15sec h.264.mp4";
URL url = new URL(urlStr);
URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef());
url = uri.toURL();

이 특정 URL에서 요청에 사용할 수 있도록 공백을 인코딩해야한다는 것을 알 수 있습니다.

Android 클래스에서 사용할 수있는 몇 가지 기능을 활용합니다. 첫째, URL 클래스는 URL을 적절한 구성 요소로 나눌 수 있으므로 문자열 검색 / 바꾸기 작업을 수행 할 필요가 없습니다. 둘째,이 방법은 단일 문자열이 아닌 구성 요소를 통해 URI를 구성 할 때 구성 요소를 올바르게 이스케이프 처리하는 URI 클래스 기능을 활용합니다.

이 방법의 장점은 유효한 URL 문자열을 가져 와서 특별한 지식 없이도 작동시킬 수 있다는 것입니다.


내가 개발하고 다른 솔루션보다 훨씬 안정적인 솔루션 :

public class URLParamEncoder {

    public static String encode(String input) {
        StringBuilder resultStr = new StringBuilder();
        for (char ch : input.toCharArray()) {
            if (isUnsafe(ch)) {
                resultStr.append('%');
                resultStr.append(toHex(ch / 16));
                resultStr.append(toHex(ch % 16));
            } else {
                resultStr.append(ch);
            }
        }
        return resultStr.toString();
    }

    private static char toHex(int ch) {
        return (char) (ch < 10 ? '0' + ch : 'A' + ch - 10);
    }

    private static boolean isUnsafe(char ch) {
        if (ch > 128 || ch < 0)
            return true;
        return " %$&+,/:;=?@<>#%".indexOf(ch) >= 0;
    }

}

URL이 있으면이 메소드에 url.toString ()을 전달할 수 있습니다. 이중 인코딩을 피하기 위해 먼저 디코딩합니다 (예를 들어, 공백을 인코딩하면 % 20이되고 백분율 기호를 인코딩하면 % 25가되므로 이중 인코딩은 공백을 % 2520으로 바꿉니다). 그런 다음 위에서 설명한대로 URL을 사용하여 URL의 모든 부분을 추가하십시오 (쿼리 매개 변수를 삭제하지 마십시오).

public URL convertToURLEscapingIllegalCharacters(String string){
    try {
        String decodedURL = URLDecoder.decode(string, "UTF-8");
        URL url = new URL(decodedURL);
        URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef()); 
        return uri.toURL(); 
    } catch (Exception ex) {
        ex.printStackTrace();
        return null;
    }
}

예, URL 인코딩은 해당 문자열을 인코딩하여 URL에서 최종 목적지로 올바르게 전달됩니다. 예를 들어 http://stackoverflow.com?url=http://yyy.com을 가질 수 없습니다 . 매개 변수를 UrlEncoding하면 해당 매개 변수 값이 수정됩니다.

그래서 두 가지 선택이 있습니다.

  1. 도메인과 다른 경로에 액세스 할 수 있습니까? 그렇다면 단순히 경로를 UrlEncode 할 수 있습니다. 그러나 그렇지 않은 경우 옵션 2가 적합 할 수 있습니다.

  2. commons-httpclient-3.1을 가져 오십시오. 여기에는 URIUtil 클래스가 있습니다.

    System.out.println (URIUtil.encodePath ( " http://example.com/x y", "ISO-8859-1"));

URI의 경로 부분 만 인코딩하므로 원하는 것을 정확하게 출력합니다.

참고로,이 메소드가 런타임에 작동하려면 commons-codec 및 commons-logging이 필요합니다.


Nitpicking : 정의에 따라 공백 문자가 포함 된 문자열은 URI가 아닙니다. 그래서 당신이 찾고있는 것은 RFC 3986 섹션 2.1에 정의 된 URI 이스케이프를 구현하는 코드입니다 .


불행히도, org.apache.commons.httpclient.util.URIUtil더 이상 사용되지 않으며, replacement org.apache.commons.codec.net.URLCodec실제 URL이 아닌 양식 게시물에 적합한 코딩 이 사용 됩니다. 따라서 단일 구성 요소를 수행하는 자체 함수를 작성해야했습니다 (? 및 &가있는 전체 쿼리 문자열에는 적합하지 않음)

public static String encodeURLComponent(final String s)
{
  if (s == null)
  {
    return "";
  }

  final StringBuilder sb = new StringBuilder();

  try
  {
    for (int i = 0; i < s.length(); i++)
    {
      final char c = s.charAt(i);

      if (((c >= 'A') && (c <= 'Z')) || ((c >= 'a') && (c <= 'z')) ||
          ((c >= '0') && (c <= '9')) ||
          (c == '-') ||  (c == '.')  || (c == '_') || (c == '~'))
      {
        sb.append(c);
      }
      else
      {
        final byte[] bytes = ("" + c).getBytes("UTF-8");

        for (byte b : bytes)
        {
          sb.append('%');

          int upper = (((int) b) >> 4) & 0xf;
          sb.append(Integer.toHexString(upper).toUpperCase(Locale.US));

          int lower = ((int) b) & 0xf;
          sb.append(Integer.toHexString(lower).toUpperCase(Locale.US));
        }
      }
    }

    return sb.toString();
  }
  catch (UnsupportedEncodingException uee)
  {
    throw new RuntimeException("UTF-8 unsupported!?", uee);
  }
}

프로젝트에 종속성을 추가하지 않으려는 경우 이러한 기능이 도움이 될 수 있습니다.

URL의 '경로'부분을 여기에 전달합니다. 전체 URL을 매개 변수로 전달하고 싶지 않을 것입니다 (쿼리 문자열에는 다른 이스케이프가 필요합니다).

/**
 * Percent-encodes a string so it's suitable for use in a URL Path (not a query string / form encode, which uses + for spaces, etc)
 */
public static String percentEncode(String encodeMe) {
    if (encodeMe == null) {
        return "";
    }
    String encoded = encodeMe.replace("%", "%25");
    encoded = encoded.replace(" ", "%20");
    encoded = encoded.replace("!", "%21");
    encoded = encoded.replace("#", "%23");
    encoded = encoded.replace("$", "%24");
    encoded = encoded.replace("&", "%26");
    encoded = encoded.replace("'", "%27");
    encoded = encoded.replace("(", "%28");
    encoded = encoded.replace(")", "%29");
    encoded = encoded.replace("*", "%2A");
    encoded = encoded.replace("+", "%2B");
    encoded = encoded.replace(",", "%2C");
    encoded = encoded.replace("/", "%2F");
    encoded = encoded.replace(":", "%3A");
    encoded = encoded.replace(";", "%3B");
    encoded = encoded.replace("=", "%3D");
    encoded = encoded.replace("?", "%3F");
    encoded = encoded.replace("@", "%40");
    encoded = encoded.replace("[", "%5B");
    encoded = encoded.replace("]", "%5D");
    return encoded;
}

/**
 * Percent-decodes a string, such as used in a URL Path (not a query string / form encode, which uses + for spaces, etc)
 */
public static String percentDecode(String encodeMe) {
    if (encodeMe == null) {
        return "";
    }
    String decoded = encodeMe.replace("%21", "!");
    decoded = decoded.replace("%20", " ");
    decoded = decoded.replace("%23", "#");
    decoded = decoded.replace("%24", "$");
    decoded = decoded.replace("%26", "&");
    decoded = decoded.replace("%27", "'");
    decoded = decoded.replace("%28", "(");
    decoded = decoded.replace("%29", ")");
    decoded = decoded.replace("%2A", "*");
    decoded = decoded.replace("%2B", "+");
    decoded = decoded.replace("%2C", ",");
    decoded = decoded.replace("%2F", "/");
    decoded = decoded.replace("%3A", ":");
    decoded = decoded.replace("%3B", ";");
    decoded = decoded.replace("%3D", "=");
    decoded = decoded.replace("%3F", "?");
    decoded = decoded.replace("%40", "@");
    decoded = decoded.replace("%5B", "[");
    decoded = decoded.replace("%5D", "]");
    decoded = decoded.replace("%25", "%");
    return decoded;
}

그리고 테스트 :

@Test
public void testPercentEncode_Decode() {
    assertEquals("", percentDecode(percentEncode(null)));
    assertEquals("", percentDecode(percentEncode("")));

    assertEquals("!", percentDecode(percentEncode("!")));
    assertEquals("#", percentDecode(percentEncode("#")));
    assertEquals("$", percentDecode(percentEncode("$")));
    assertEquals("@", percentDecode(percentEncode("@")));
    assertEquals("&", percentDecode(percentEncode("&")));
    assertEquals("'", percentDecode(percentEncode("'")));
    assertEquals("(", percentDecode(percentEncode("(")));
    assertEquals(")", percentDecode(percentEncode(")")));
    assertEquals("*", percentDecode(percentEncode("*")));
    assertEquals("+", percentDecode(percentEncode("+")));
    assertEquals(",", percentDecode(percentEncode(",")));
    assertEquals("/", percentDecode(percentEncode("/")));
    assertEquals(":", percentDecode(percentEncode(":")));
    assertEquals(";", percentDecode(percentEncode(";")));

    assertEquals("=", percentDecode(percentEncode("=")));
    assertEquals("?", percentDecode(percentEncode("?")));
    assertEquals("@", percentDecode(percentEncode("@")));
    assertEquals("[", percentDecode(percentEncode("[")));
    assertEquals("]", percentDecode(percentEncode("]")));
    assertEquals(" ", percentDecode(percentEncode(" ")));

    // Get a little complex
    assertEquals("[]]", percentDecode(percentEncode("[]]")));
    assertEquals("a=d%*", percentDecode(percentEncode("a=d%*")));
    assertEquals(")  (", percentDecode(percentEncode(")  (")));
    assertEquals("%21%20%2A%20%27%20%28%20%25%20%29%20%3B%20%3A%20%40%20%26%20%3D%20%2B%20%24%20%2C%20%2F%20%3F%20%23%20%5B%20%5D%20%25",
                    percentEncode("! * ' ( % ) ; : @ & = + $ , / ? # [ ] %"));
    assertEquals("! * ' ( % ) ; : @ & = + $ , / ? # [ ] %", percentDecode(
                    "%21%20%2A%20%27%20%28%20%25%20%29%20%3B%20%3A%20%40%20%26%20%3D%20%2B%20%24%20%2C%20%2F%20%3F%20%23%20%5B%20%5D%20%25"));

    assertEquals("%23456", percentDecode(percentEncode("%23456")));

}

유감스럽게도 URLEncoding은 HTTP URL을 올바르게 인코딩 할 수 있습니다. " http://search.barnesandnoble.com/booksearch/first book.pdf"에 전달한 문자열 은 URL 인코딩 형식으로 정확하고 완벽하게 인코딩되었습니다. URL에서 매개 변수로 얻은 gobbledigook의 전체 긴 문자열을 전달할 수 있으며 전달 한 문자열로 정확하게 디코딩 될 수 있습니다.

전체 URL을 매개 변수로 전달하는 것과는 조금 다른 것을하고 싶은 것 같습니다. 내가 수집 한 내용에서 " http://search.barnesandnoble.com/booksearch/whateverTheUserPassesIn " 과 같은 검색 URL을 만들려고합니다 . 인코딩해야하는 것은 "whateverTheUserPassesIn"비트뿐이므로 다음과 같이하면됩니다.

String url = "http://search.barnesandnoble.com/booksearch/" + 
       URLEncoder.encode(userInput,"UTF-8");

그것은 당신에게 더 유효한 것을 생산해야합니다.


URL에 인코딩 된 "/"(% 2F)가 있어도 여전히 문제가 있습니다.

RFC 3986-섹션 2.2에 따르면 : "URI 구성 요소의 데이터가 분리 문자로서 예약 된 문자의 목적과 충돌하는 경우, URI가 형성되기 전에 충돌하는 데이터를 백분율로 인코딩해야합니다." (RFC 3986-섹션 2.2)

그러나 Tomcat에 문제가 있습니다.

http://tomcat.apache.org/security-6.html-Apache Tomcat 6.0.10에서 수정되었습니다.

중요 : 디렉터리 통과 CVE-2007-0450

Tomcat은 '\', '% 2F'및 '% 5C'[...]을 허용합니다.

URL에서 경로 구분 기호 처리를 추가로 제어 할 수 있도록 Tomcat에 다음 Java 시스템 특성이 추가되었습니다 (두 옵션 모두 기본값은 false 임).

  • org.apache.tomcat.util.buf.UDecoder.ALLOW_ENCODED_SLASH : true | false
  • org.apache.catalina.connector.CoyoteAdapter.ALLOW_BACKSLASH : true | 거짓

모든 URL이 프록시 서버에서와 같이 Tomcat에 의해 처리되도록 보장 할 수 없으므로 Tomcat은 컨텍스트 액세스를 제한하는 프록시가 사용되지 않는 것처럼 항상 보안되어야합니다.

영향 : 6.0.0-6.0.9

따라서 % 2F 문자가 포함 된 URL이 있으면 Tomcat은 "400 Invalid URI : noSlash"를 반환합니다.

Tomcat 시작 스크립트에서 버그 수정을 전환 할 수 있습니다.

set JAVA_OPTS=%JAVA_OPTS% %LOGGING_CONFIG%   -Dorg.apache.tomcat.util.buf.UDecoder.ALLOW_ENCODED_SLASH=true 

이전 답변의 솔루션을 사용하여 제대로 작동하지 않을 수 있기 때문에 내 자신의 방법을 작성하기 위해 이전 답변을 읽었습니다. 나에게 좋을 것입니다. 그러나이 URL로 작동하지 않는 경우 알려주십시오.

public static URL convertToURLEscapingIllegalCharacters(String toEscape) throws MalformedURLException, URISyntaxException {
            URL url = new URL(toEscape);
            URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef());
            //if a % is included in the toEscape string, it will be re-encoded to %25 and we don't want re-encoding, just encoding
            return new URL(uri.toString().replace("%25", "%"));
}

매트에 동의합니다. 실제로 튜토리얼에서 잘 설명하지는 못했지만 한 가지 중요한 것은 URL 경로를 인코딩하는 방법과 매우 다른 방법은 URL에 추가 된 매개 변수 ( "? "기호). 그들은 비슷한 인코딩을 사용하지만 동일하지는 않습니다.

특히 공백 문자의 인코딩에 적합합니다. URL 경로는 % 20으로 인코딩되어야하지만 쿼리 부분은 % 20 및 "+"기호를 허용합니다. 가장 좋은 아이디어는 웹 브라우저를 사용하여 웹 서버에 대해 스스로 테스트하는 것입니다.

두 경우 모두 항상 COMPONENT BY COMPONENT를 인코딩 하지만 전체 문자열 은 인코딩 하지 않습니다. 실제로 URLEncoder는 쿼리 부분에서 URLEncoder를 허용합니다. 경로 부분의 경우 클래스 URI를 사용할 수 있지만이 경우 단일 구성 요소가 아닌 전체 문자열을 요청합니다.

어쨌든, 나는 이러한 문제를 피하는 가장 좋은 방법은 개인적인 비합리적인 디자인을 사용하는 것이라고 믿습니다 . 어떻게? 예를 들어, aZ, AZ, 0-9 및 _ 이외의 다른 문자를 사용하여 디렉토리 또는 매개 변수의 이름을 지정하지 않습니다. 이렇게하면 사용자 입력에서 올 수 있고 사용 된 문자를 알 수 없으므로 모든 매개 변수의 값을 인코딩하면됩니다.


org.springframework.web.util에서 UriUtils사용해 볼 수 있습니다.

UriUtils.encodeUri(input, "UTF-8")

GUAVA경로 이스케이프를 사용 하고 사용할 수도 있습니다 .UrlEscapers.urlFragmentEscaper().escape(relativePath)


Carlos Heuberger의 답변 외에도 기본값 (80)과 다른 것이 필요한 경우 7 매개 변수 생성자를 사용해야합니다.

URI uri = new URI(
        "http",
        null, // this is for userInfo
        "www.google.com",
        8080, // port number as int
        "/ig/api",
        "weather=São Paulo",
        null);
String request = uri.toASCIIString();

위의 내용을 가져 와서 조금 변경했습니다. 나는 긍정적 인 논리를 먼저 좋아하고 HashSet이 String을 통한 검색과 같은 다른 옵션보다 더 나은 성능을 제공 할 수 있다고 생각했습니다. 오토 박스 페널티가 가치가 있는지는 확실하지 않지만 컴파일러가 ASCII 문자를 최적화하면 권투 비용이 저렴합니다.

/***
 * Replaces any character not specifically unreserved to an equivalent 
 * percent sequence.
 * @param s
 * @return
 */
public static String encodeURIcomponent(String s)
{
    StringBuilder o = new StringBuilder();
    for (char ch : s.toCharArray()) {
        if (isSafe(ch)) {
            o.append(ch);
        }
        else {
            o.append('%');
            o.append(toHex(ch / 16));
            o.append(toHex(ch % 16));
        }
    }
    return o.toString();
}

private static char toHex(int ch)
{
    return (char)(ch < 10 ? '0' + ch : 'A' + ch - 10);
}

// https://tools.ietf.org/html/rfc3986#section-2.3
public static final HashSet<Character> UnreservedChars = new HashSet<Character>(Arrays.asList(
        'A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T','U','V','W','X','Y','Z',
        'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z',
        '0','1','2','3','4','5','6','7','8','9',
        '-','_','.','~'));
public static boolean isSafe(char ch)
{
    return UnreservedChars.contains(ch);
}

다음 표준 Java 솔루션을 사용하십시오 ( Web Plattform Tests에서 제공하는 약 100 개의 테스트 케이스를 통과 함 ).

0. URL이 이미 인코딩되어 있는지 테스트합니다 .

1. URL을 구조 부분으로 분할 하십시오 . java.net.URL그것을 위해 사용하십시오 .

2. 각 구조 부분을 올바르게 인코딩하십시오!

3. 사용 IDN.toASCII(putDomainNameHere)퓨니 코드는 호스트 이름을 인코딩!

4.java.net.URI.toASCIIString() NFC 인코딩 유니 코드를 퍼센트 인코딩하는 데 사용 합니다 (NFKC가 더 좋습니다).

자세한 내용은 https://stackoverflow.com/a/49796882/1485527를 참조하십시오.


HTTP URL을 구성하는 데 도움이되는 새 프로젝트를 만들었습니다. 라이브러리는 경로 세그먼트 및 쿼리 매개 변수를 자동으로 URL 인코딩합니다.

https://github.com/Widen/urlbuilder 에서 소스를보고 바이너리를 다운로드 할 수 있습니다.

이 질문의 예제 URL :

new UrlBuilder("search.barnesandnoble.com", "booksearch/first book.pdf").toString()

생산

http://search.barnesandnoble.com/booksearch/first%20book.pdf


나는 같은 문제가 있었다. unsing하여 이것을 해결했습니다.

android.net.Uri.encode(urlString, ":/");

문자열을 인코딩하지만 ":"및 "/"는 건너 뜁니다.


나는 이것을 사용한다

org.apache.commons.text.StringEscapeUtils.escapeHtml4("my text % & < >");

이 의존성을 추가

 <dependency>
        <groupId>org.apache.commons</groupId>
        <artifactId>commons-text</artifactId>
        <version>1.8</version>
    </dependency>

이 목적에 맞는 라이브러리를 개발합니다 : galimatias . 웹 브라우저와 동일한 방식으로 URL을 구문 분석합니다. 즉, URL이 브라우저에서 작동하면 galimatias에 의해 올바르게 구문 분석됩니다 .

이 경우 :

// Parse
io.mola.galimatias.URL.parse(
    "http://search.barnesandnoble.com/booksearch/first book.pdf"
).toString()

당신에게 줄 것이다 : http://search.barnesandnoble.com/booksearch/first%20book.pdf. 물론 이것은 가장 간단한 경우이지만, 그 이상으로도 작동 java.net.URI합니다.

https://github.com/smola/galimatias 에서 확인할 수 있습니다.


이와 같은 기능을 사용할 수 있습니다. 필요에 따라 작성하고 수정하십시오.

/**
     * Encode URL (except :, /, ?, &, =, ... characters)
     * @param url to encode
     * @param encodingCharset url encoding charset
     * @return encoded URL
     * @throws UnsupportedEncodingException
     */
    public static String encodeUrl (String url, String encodingCharset) throws UnsupportedEncodingException{
            return new URLCodec().encode(url, encodingCharset).replace("%3A", ":").replace("%2F", "/").replace("%3F", "?").replace("%3D", "=").replace("%26", "&");
    }

사용 예 :

String urlToEncode = ""http://www.growup.com/folder/intérieur-à_vendre?o=4";
Utils.encodeUrl (urlToEncode , "UTF-8")

결과 : http://www.growup.com/folder/int%C3%A9rieur-%C3%A0_vendre?o=4


String url = "" http://search.barnesandnoble.com/booksearch/ ;

이것은 일정하다고 생각하며 파일 이름 만 변하기 때문에 파일 이름을 얻습니다.

문자열 파일명; // 파일 이름을 얻습니다

String urlEnc = url + fileName.replace ( "", "% 20");


어때요?

공개 문자열 UrlEncode (문자열 in_) {

String retVal = "";

try {
    retVal = URLEncoder.encode(in_, "UTF8");
} catch (UnsupportedEncodingException ex) {
    Log.get().exception(Log.Level.Error, "urlEncode ", ex);
}

return retVal;

}

참고 URL : https://stackoverflow.com/questions/724043/http-url-address-encoding-in-java



반응형