logo

Klasa znaków Java

Klasa Character zazwyczaj zawija wartość wszystkich znaków typu pierwotnego w obiekt. Dowolny obiekt typu Character może zawierać pojedyncze pole typu char.

Wszystkie pola, metody i konstruktory klasy Character są określone w pliku danych Unicode, który jest w szczególności częścią bazy danych znaków Unicode i jest utrzymywany przez konsorcjum Unicode.

Zestaw znaków od U+0000 do U+FFFF jest czasami nazywany podstawową płaszczyzną wielojęzyczną (tj. BMP). Znaki, których liczba punktów kodowych jest większa niż U+FFFF, nazywane są znakami dodatkowymi. Język Java zazwyczaj używa metody kodowania UTF-16 do reprezentowania tablic znaków w łańcuchu lub buforze ciągów. W tego typu reprezentacji znaki dodatkowe są reprezentowane jako para znaków, pierwszy z zakresu o wysokim surogacie (uD800-uDBFF), a drugi z zakresu o niskim surogacie (uDc00- uDBFF).

Metody

metoda Opis
charCount(int codePoint) Określa liczbę wartości char wymaganych do reprezentowania danego znaku.
charWartość() Zwraca wartość danego obiektu Character.
codePointAt(char[]a, int indeks) Zwraca codePoint dla określonego indeksu danej tablicy.
codePointAt(char[]a, int indeks, int limit) Zwraca codePoint tablicy char o określonym indeksie, przy czym używane są tylko elementy tablicy o indeksie mniejszym niż określony limit.
codePointAt(CharSequence seq, int indeks) Zwraca codePoint pod określonym indeksem dla danego CharSequence.
codePointBefore(char[]a, int indeks) Zwraca codePoint dla danej tablicy w poprzednim indeksie.
codePointBefore(char[]a, int indeks, int start) Zwraca wartość codePoint dla danej tablicy w poprzednim indeksie, gdzie używane są tylko elementy tablicy o indeksie większym lub równym start.
codePointBefore(CharSequence, int indeks) Zwraca CodePoint dla danego CharSequence w poprzednim indeksie.
codePointCount(char[]a, int przesunięcie, int liczba) Zwraca całkowitą liczbę punktów kodowych Unicode w danej podtablicy argumentu tablicy znaków.
codePointCount(CharSequence seq, int BeginIndex, int endIndex) Zwraca liczbę punktów codePoints Unicode podanych w danym zakresie tekstu dla określonej sekwencji znaków.
codePointOf(nazwa ciągu) Zwraca wartość codePoint dla danego znaku Unicode określonego przez konkretną nazwę znaku.
porównaj (znak x, znak y) Porównuje numerycznie dwie wartości typów znaków.
porównaj do (znak inny znak) Porównuje numerycznie dwa obiekty typu Character.
cyfra(char ch, int radix) Zwraca wartość liczbową dla danego znaku w określonym indeksie.
cyfra(int codePoint, int radix) Zwraca wartość liczbową dla danego znaku w określonej podstawie.
równa się (obiekt obiektu) Porównuje dany obiekt z określonym obiektem.
forDigit(int cyfra, int podstawa) Określa prezentację znaku dla danej cyfry w podanej podstawie.
getDirectionality(char ch) Zwraca właściwość kierunkowości Unicode dla określonego znaku.
getDirectionality(int codePoint) Zwraca właściwość kierunkowości Unicode dla określonego codePoint.
getName(int codePoint) Zwraca nazwę Unicode dla danego codePoint lub może zwrócić wartość null, jeśli codePoint nie jest przypisany.
getNumericValue(znak) Zwraca wartość typu całkowitego określonego znaku Unicode.
getNumericValue(int codePoint) Zwraca wartość typu całkowitego określonego codePoint Unicode.
getType(char ch) Zwraca wartość wskazującą ogólną kategorię znaku.
getType(int codePoint) Zwraca wartość wskazującą ogólną kategorię znaku.
kod skrótu() Zwraca kod skrótu dla określonego znaku. Metoda ta jest równa wynikowi wywołania metody charValue().
hashcode (wartość znaku) Zwraca kod skrótu dla określonej wartości znaku.
highSurrogate(int codePoint) Zwraca wiodący punkt kodowy zastępczy określonej pary zastępczej, która reprezentuje znak dodatkowy w kodowaniu UTF-16.
isAlphabetic(int codePoint) Określa, czy podany znak jest alfabetem, czy nie.
isBmpCodePoint(int codePoint) Określa, czy dany znak należy do podstawowej płaszczyzny wielojęzycznej, czy nie.
isDefined(char ch) Określa, czy znak jest zdefiniowany w Unicode, czy nie.
isDefined(int codePoint) Określa, czy znak (punkt kodowy Unicode) jest zdefiniowany w Unicode, czy nie.
isDigit(znak ch) Określa, czy podany znak jest cyfrą, czy nie.
isDigit(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest cyfrą, czy nie.
isHighSurrogate(char ch) Określa, czy podane wartości znaków są punktem kodu zastępczego o dużej wartości zastępczej Unicode, czy nie.
isIndentifierIgnorable(char ch) Określa, czy dany znak jest uważany za znak ignorowany w identyfikatorze Java, czy nie.
isIndentifierIgnorable(int codePoint) Określa, czy dany znak (Unicode codePoint) jest uważany za znak możliwy do zignorowania w identyfikatorze Java, czy nie.
isIdeographic(int codePoint) Określa, czy określony znak jest ideogramem CJKV (chiński, japoński, koreański i wietnamski), czy nie.
isISOControl(char ch) Określa, czy dany znak jest znakiem kontrolnym ISO, czy nie.
isISOControl(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest znakiem kontrolnym ISO, czy nie.
isJavaIdentifierPart(char ch) Określa, czy dany znak jest częścią identyfikatora Java inną niż pierwszy znak, czy nie.
isJavaIdentifierPart(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest częścią identyfikatora Java inną niż pierwszy znak, czy nie.
isJavaIdentifierStart(char ch) Określa, czy dany znak jest dozwolony jako pierwszy znak w identyfikatorze Java, czy nie.
isJavaIdentifierStart(int codePoint) Określa, czy dany znak (punkt kodowy Unicode jest dozwolony jako pierwszy znak w identyfikatorze Java, czy nie.
isJavaLetter(char ch) Zastąpiony przez isJavaIdentifierStart(char).
isJavaLetterOrDigit(int codePoint) Zastąpiony przez isJavaIdentifierPart(char).
isLetter(char ch) Określa, czy określony znak jest literą, czy nie.
isLetter(int codePoint) Określa, czy określony znak (punkt kodowy Unicode) jest literą, czy nie.
isLetterOrDigit(char ch) Określa, czy określony znak jest literą, czy cyfrą, czy nie.
isLetterOrDigit(int codePoint) Określa, czy określony znak (punkt kodowy Unicode) jest literą czy cyfrą, czy nie.
isLowerCase(char ch) Określa, czy określony znak jest małą literą, czy nie.
isLowerCase(int codePoint) Określa, czy określony znak (punkt kodowy Unicode) jest małą literą, czy nie.
isLowSurrogate(char ch) Określa, czy dana wartość znaku jest jednostką kodu zastępczego o niskiej zawartości kodu zastępczego Unicode, czy nie.
isMirrored(char ch) Określa, czy znak jest dublowany, czy nie.
isMirrored(int codePoint) Określa, czy znak (punkt kodowy Unicode) jest dublowany, czy nie.
isSpace(znak ch) Zastąpiony metodą isWhiteSpace(char ch).
isSpaceChar(char ch) Określa, czy określony znak jest znakiem spacji Unicode, czy nie.
isSupplementaryCodePoint(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) należy do zakresu znaków dodatkowych, czy nie.
isSurrogate(char ch) Określa, czy dana wartość znaku jest jednostką kodu zastępczego Unicode.
isSurrogatePair(znak wysoki, char niski) Określa, czy dana para wartości char jest prawidłową parą zastępczą Unicode, czy nie.
isTitleCase(char ch) Określa, czy dany znak jest znakiem tytułu, czy nie.
isTitleCase(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest znakiem tytułu, czy nie.
isUnicodeIdentifierPart(char ch) Określa, czy dany znak jest częścią identyfikatora Unicode, czy nie.
isUnicodeIdentifierPart(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest częścią identyfikatora Unicode, czy nie.
isUnicodeIdentifierStart(char ch) Określa, czy dany znak jest dozwolony jako pierwszy znak w identyfikatorze Unicode, czy nie.
isUnicodeIdentifierStart(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest dozwolony jako pierwszy znak w identyfikatorze Unicode, czy nie.
isUpperCase(char ch) Określa, czy dany znak jest wielką literą, czy nie.
isUpperCase(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest wielką literą, czy nie.
isValidCodePoint(int codePoint) Określa, czy dany znak jest prawidłową wartością punktu kodowego Unicode, czy nie.
isWhitespace(char ch) Określa, czy dany znak jest spacją, czy nie.
isWhitespace(int codePoint) Określa, czy dany znak (punkt kodowy Unicode) jest spacją, czy nie.
lowSurrogate(int codePoint) Zwraca dolną jednostkę kodu zastępczego (tj. końcowy surogat) pary zastępczej, która reprezentuje znak dodatkowy w kodowaniu UTF-16.
offsetByCodePoints(char[]a, int początek, int liczba, int indeks, int codePointOffset) Zwraca indeks dla danej podtablicy char, który jest przesunięciem od danego indeksu o punkty kodowe codePointOffset.
offsetByCodePoints(CharSequence seq, int indeks, int codePointOffset) Zwraca indeks dla danej podtablicy char, który jest przesunięciem od danego indeksu o punkty kodowe codePointOffset.
ReverseBytes(char ch) Zwraca wartość uzyskaną przez odwrócenie kolejności podanych bajtów w określonych wartościach znaków.
toChars(int codePoint) Konwertuje określony znak (punkt kodowy Unicode) na jego reprezentację UTF-16, która jest przechowywana w tablicy char.
toChars(int codePoint, char[] dst, int dstIndex) Konwertuje określony znak (punkt kodowy Unicode) na jego reprezentację UTF-16.
toCodePoint(znak wysoki, znak niski) Konwertuje daną parę zastępczą na odpowiadającą jej wartość dodatkowego punktu kodowego.
toLowerCase(char ch) Konwertuje argument typu znaku na małe litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode.
toLowerCase(int codePoint) Konwertuje argument typu znaku (punkt kodowy Unicode) na małe litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode.
doString() Zwraca obiekt typu String, który reprezentuje wartość znaku.
toString(char ch) Zwraca obiekt typu String, który reprezentuje określony znak
toTitleCase(char ch) Konwertuje argument typu znakowego na wielkość liter, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode.
toTitleCase(int codePoint) Konwertuje argument typu znaku (punkt kodowy Unicode) na małe litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode.
toUpperCase(char ch) Konwertuje argument typu znakowego na wielkie litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode.
toUpperCase(int codePoint) Konwertuje argument typu znaku (punkt kodowy Unicode) na wielkie litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode.
wartość(znak c) Zwraca instancję Character, która reprezentuje określoną wartość znaku.

Przykład 1

 import java.util.Scanner; public class JavaCharacterExample1 { public static void main(String[] args) { // Ask the user for the first input. System.out.print('Enter the first input:'); // Use the Scanner class to get the user input. Scanner scanner = new Scanner(System.in); // Gets the user input. char[] value1 = scanner.nextLine().toCharArray(); int result1 = 0; // Count the characters for a specific character. for (char ch1 : value1) { result1 = Character.charCount(ch1); } // Print the result. System.out.print('The value comes to: '+result1+'
'); System.out.print('Enter the second input:'); char[] value2 = scanner.nextLine().toCharArray(); for (char ch2 : value2) { int result2 = Character.hashCode(ch2); System.out.print('The hash code for the character ''+ch2+'' is given as:'+result2+'
'); } System.out.print('Enter the third input:'); char[] value3 = scanner.nextLine().toCharArray(); for (char ch3 : value3) { boolean result3 = Character.isDigit(ch3); if(result3){ System.out.println('The character '' + ch3 + '' is a digit. '); } else{ System.out.println('The character '' + ch3 + '' is not a digit.'); } System.out.print('Enter the fourth input:'); char[] value4 = scanner.nextLine().toCharArray(); for (char ch4 : value4) { boolean result4 = Character.isISOControl(ch4); System.out.println('The fourth character ''+ch4+'' is an ISO Control:'+result4); } } } } 

Wyjście:

 Enter the first input:89 The value comes to: 1 Enter the second input:J The hash code for the character 'J' is given as:74 Enter the third input:5 The character '5' is a digit. Enter the fourth input:h The fourth character 'h' is an ISO Control:false 

Przykład 2

 public class JavaCharacterExample2{ public static void main(String[] args) { // Create four char primitives ch1, ch2, ch3 and ch4. char ch1, ch2, ch3, ch4; // Assign the values to ch1, ch2, ch3 and ch4. ch1 = 'T'; ch2 = 'k'; ch3 = '
'; ch4 = 'G'; // Create four boolean primitives b1, b2, b3 and b4. boolean b1, b2, b3,b4; // Assign the results to b1, b2, b3 and b4. b1 = Character.isLetter(ch1); b2 = Character.isLowerCase(ch2); b3 = Character.isSpace(ch3); b4 = Character.isDefined(ch3); String str1 = ' The first character is a letter: ' + b1; String str2 = ' The second character is a lower-case: ' + b2; String str3 = ' The third character is for space: ' + b3; String str4 = ' The fourth character is defined in Java identifier: ' + b3; // Print the values of b1, b2, b3 and b4. System.out.println( str1 ); System.out.println( str2 ); System.out.println( str3 ); System.out.println( str3 ); } } 
Przetestuj teraz

Wyjście:

 The first character is a letter: true The second character is a lower-case: true The third character has a space: true The third character has a space: true