Klasa Character zazwyczaj zawija wartość wszystkich znaków typu pierwotnego w obiekt. Dowolny obiekt typu Character może zawierać pojedyncze pole typu char.
Wszystkie pola, metody i konstruktory klasy Character są określone w pliku danych Unicode, który jest w szczególności częścią bazy danych znaków Unicode i jest utrzymywany przez konsorcjum Unicode.
Zestaw znaków od U+0000 do U+FFFF jest czasami nazywany podstawową płaszczyzną wielojęzyczną (tj. BMP). Znaki, których liczba punktów kodowych jest większa niż U+FFFF, nazywane są znakami dodatkowymi. Język Java zazwyczaj używa metody kodowania UTF-16 do reprezentowania tablic znaków w łańcuchu lub buforze ciągów. W tego typu reprezentacji znaki dodatkowe są reprezentowane jako para znaków, pierwszy z zakresu o wysokim surogacie (uD800-uDBFF), a drugi z zakresu o niskim surogacie (uDc00- uDBFF).
Metody
metoda | Opis |
---|---|
charCount(int codePoint) | Określa liczbę wartości char wymaganych do reprezentowania danego znaku. |
charWartość() | Zwraca wartość danego obiektu Character. |
codePointAt(char[]a, int indeks) | Zwraca codePoint dla określonego indeksu danej tablicy. |
codePointAt(char[]a, int indeks, int limit) | Zwraca codePoint tablicy char o określonym indeksie, przy czym używane są tylko elementy tablicy o indeksie mniejszym niż określony limit. |
codePointAt(CharSequence seq, int indeks) | Zwraca codePoint pod określonym indeksem dla danego CharSequence. |
codePointBefore(char[]a, int indeks) | Zwraca codePoint dla danej tablicy w poprzednim indeksie. |
codePointBefore(char[]a, int indeks, int start) | Zwraca wartość codePoint dla danej tablicy w poprzednim indeksie, gdzie używane są tylko elementy tablicy o indeksie większym lub równym start. |
codePointBefore(CharSequence, int indeks) | Zwraca CodePoint dla danego CharSequence w poprzednim indeksie. |
codePointCount(char[]a, int przesunięcie, int liczba) | Zwraca całkowitą liczbę punktów kodowych Unicode w danej podtablicy argumentu tablicy znaków. |
codePointCount(CharSequence seq, int BeginIndex, int endIndex) | Zwraca liczbę punktów codePoints Unicode podanych w danym zakresie tekstu dla określonej sekwencji znaków. |
codePointOf(nazwa ciągu) | Zwraca wartość codePoint dla danego znaku Unicode określonego przez konkretną nazwę znaku. |
porównaj (znak x, znak y) | Porównuje numerycznie dwie wartości typów znaków. |
porównaj do (znak inny znak) | Porównuje numerycznie dwa obiekty typu Character. |
cyfra(char ch, int radix) | Zwraca wartość liczbową dla danego znaku w określonym indeksie. |
cyfra(int codePoint, int radix) | Zwraca wartość liczbową dla danego znaku w określonej podstawie. |
równa się (obiekt obiektu) | Porównuje dany obiekt z określonym obiektem. |
forDigit(int cyfra, int podstawa) | Określa prezentację znaku dla danej cyfry w podanej podstawie. |
getDirectionality(char ch) | Zwraca właściwość kierunkowości Unicode dla określonego znaku. |
getDirectionality(int codePoint) | Zwraca właściwość kierunkowości Unicode dla określonego codePoint. |
getName(int codePoint) | Zwraca nazwę Unicode dla danego codePoint lub może zwrócić wartość null, jeśli codePoint nie jest przypisany. |
getNumericValue(znak) | Zwraca wartość typu całkowitego określonego znaku Unicode. |
getNumericValue(int codePoint) | Zwraca wartość typu całkowitego określonego codePoint Unicode. |
getType(char ch) | Zwraca wartość wskazującą ogólną kategorię znaku. |
getType(int codePoint) | Zwraca wartość wskazującą ogólną kategorię znaku. |
kod skrótu() | Zwraca kod skrótu dla określonego znaku. Metoda ta jest równa wynikowi wywołania metody charValue(). |
hashcode (wartość znaku) | Zwraca kod skrótu dla określonej wartości znaku. |
highSurrogate(int codePoint) | Zwraca wiodący punkt kodowy zastępczy określonej pary zastępczej, która reprezentuje znak dodatkowy w kodowaniu UTF-16. |
isAlphabetic(int codePoint) | Określa, czy podany znak jest alfabetem, czy nie. |
isBmpCodePoint(int codePoint) | Określa, czy dany znak należy do podstawowej płaszczyzny wielojęzycznej, czy nie. |
isDefined(char ch) | Określa, czy znak jest zdefiniowany w Unicode, czy nie. |
isDefined(int codePoint) | Określa, czy znak (punkt kodowy Unicode) jest zdefiniowany w Unicode, czy nie. |
isDigit(znak ch) | Określa, czy podany znak jest cyfrą, czy nie. |
isDigit(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest cyfrą, czy nie. |
isHighSurrogate(char ch) | Określa, czy podane wartości znaków są punktem kodu zastępczego o dużej wartości zastępczej Unicode, czy nie. |
isIndentifierIgnorable(char ch) | Określa, czy dany znak jest uważany za znak ignorowany w identyfikatorze Java, czy nie. |
isIndentifierIgnorable(int codePoint) | Określa, czy dany znak (Unicode codePoint) jest uważany za znak możliwy do zignorowania w identyfikatorze Java, czy nie. |
isIdeographic(int codePoint) | Określa, czy określony znak jest ideogramem CJKV (chiński, japoński, koreański i wietnamski), czy nie. |
isISOControl(char ch) | Określa, czy dany znak jest znakiem kontrolnym ISO, czy nie. |
isISOControl(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest znakiem kontrolnym ISO, czy nie. |
isJavaIdentifierPart(char ch) | Określa, czy dany znak jest częścią identyfikatora Java inną niż pierwszy znak, czy nie. |
isJavaIdentifierPart(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest częścią identyfikatora Java inną niż pierwszy znak, czy nie. |
isJavaIdentifierStart(char ch) | Określa, czy dany znak jest dozwolony jako pierwszy znak w identyfikatorze Java, czy nie. |
isJavaIdentifierStart(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode jest dozwolony jako pierwszy znak w identyfikatorze Java, czy nie. |
isJavaLetter(char ch) | Zastąpiony przez isJavaIdentifierStart(char). |
isJavaLetterOrDigit(int codePoint) | Zastąpiony przez isJavaIdentifierPart(char). |
isLetter(char ch) | Określa, czy określony znak jest literą, czy nie. |
isLetter(int codePoint) | Określa, czy określony znak (punkt kodowy Unicode) jest literą, czy nie. |
isLetterOrDigit(char ch) | Określa, czy określony znak jest literą, czy cyfrą, czy nie. |
isLetterOrDigit(int codePoint) | Określa, czy określony znak (punkt kodowy Unicode) jest literą czy cyfrą, czy nie. |
isLowerCase(char ch) | Określa, czy określony znak jest małą literą, czy nie. |
isLowerCase(int codePoint) | Określa, czy określony znak (punkt kodowy Unicode) jest małą literą, czy nie. |
isLowSurrogate(char ch) | Określa, czy dana wartość znaku jest jednostką kodu zastępczego o niskiej zawartości kodu zastępczego Unicode, czy nie. |
isMirrored(char ch) | Określa, czy znak jest dublowany, czy nie. |
isMirrored(int codePoint) | Określa, czy znak (punkt kodowy Unicode) jest dublowany, czy nie. |
isSpace(znak ch) | Zastąpiony metodą isWhiteSpace(char ch). |
isSpaceChar(char ch) | Określa, czy określony znak jest znakiem spacji Unicode, czy nie. |
isSupplementaryCodePoint(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) należy do zakresu znaków dodatkowych, czy nie. |
isSurrogate(char ch) | Określa, czy dana wartość znaku jest jednostką kodu zastępczego Unicode. |
isSurrogatePair(znak wysoki, char niski) | Określa, czy dana para wartości char jest prawidłową parą zastępczą Unicode, czy nie. |
isTitleCase(char ch) | Określa, czy dany znak jest znakiem tytułu, czy nie. |
isTitleCase(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest znakiem tytułu, czy nie. |
isUnicodeIdentifierPart(char ch) | Określa, czy dany znak jest częścią identyfikatora Unicode, czy nie. |
isUnicodeIdentifierPart(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest częścią identyfikatora Unicode, czy nie. |
isUnicodeIdentifierStart(char ch) | Określa, czy dany znak jest dozwolony jako pierwszy znak w identyfikatorze Unicode, czy nie. |
isUnicodeIdentifierStart(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest dozwolony jako pierwszy znak w identyfikatorze Unicode, czy nie. |
isUpperCase(char ch) | Określa, czy dany znak jest wielką literą, czy nie. |
isUpperCase(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest wielką literą, czy nie. |
isValidCodePoint(int codePoint) | Określa, czy dany znak jest prawidłową wartością punktu kodowego Unicode, czy nie. |
isWhitespace(char ch) | Określa, czy dany znak jest spacją, czy nie. |
isWhitespace(int codePoint) | Określa, czy dany znak (punkt kodowy Unicode) jest spacją, czy nie. |
lowSurrogate(int codePoint) | Zwraca dolną jednostkę kodu zastępczego (tj. końcowy surogat) pary zastępczej, która reprezentuje znak dodatkowy w kodowaniu UTF-16. |
offsetByCodePoints(char[]a, int początek, int liczba, int indeks, int codePointOffset) | Zwraca indeks dla danej podtablicy char, który jest przesunięciem od danego indeksu o punkty kodowe codePointOffset. |
offsetByCodePoints(CharSequence seq, int indeks, int codePointOffset) | Zwraca indeks dla danej podtablicy char, który jest przesunięciem od danego indeksu o punkty kodowe codePointOffset. |
ReverseBytes(char ch) | Zwraca wartość uzyskaną przez odwrócenie kolejności podanych bajtów w określonych wartościach znaków. |
toChars(int codePoint) | Konwertuje określony znak (punkt kodowy Unicode) na jego reprezentację UTF-16, która jest przechowywana w tablicy char. |
toChars(int codePoint, char[] dst, int dstIndex) | Konwertuje określony znak (punkt kodowy Unicode) na jego reprezentację UTF-16. |
toCodePoint(znak wysoki, znak niski) | Konwertuje daną parę zastępczą na odpowiadającą jej wartość dodatkowego punktu kodowego. |
toLowerCase(char ch) | Konwertuje argument typu znaku na małe litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode. |
toLowerCase(int codePoint) | Konwertuje argument typu znaku (punkt kodowy Unicode) na małe litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode. |
doString() | Zwraca obiekt typu String, który reprezentuje wartość znaku. |
toString(char ch) | Zwraca obiekt typu String, który reprezentuje określony znak |
toTitleCase(char ch) | Konwertuje argument typu znakowego na wielkość liter, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode. |
toTitleCase(int codePoint) | Konwertuje argument typu znaku (punkt kodowy Unicode) na małe litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode. |
toUpperCase(char ch) | Konwertuje argument typu znakowego na wielkie litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode. |
toUpperCase(int codePoint) | Konwertuje argument typu znaku (punkt kodowy Unicode) na wielkie litery, korzystając z informacji o mapowaniu wielkości liter uzyskanych z pliku danych Unicode. |
wartość(znak c) | Zwraca instancję Character, która reprezentuje określoną wartość znaku. |
Przykład 1
import java.util.Scanner; public class JavaCharacterExample1 { public static void main(String[] args) { // Ask the user for the first input. System.out.print('Enter the first input:'); // Use the Scanner class to get the user input. Scanner scanner = new Scanner(System.in); // Gets the user input. char[] value1 = scanner.nextLine().toCharArray(); int result1 = 0; // Count the characters for a specific character. for (char ch1 : value1) { result1 = Character.charCount(ch1); } // Print the result. System.out.print('The value comes to: '+result1+' '); System.out.print('Enter the second input:'); char[] value2 = scanner.nextLine().toCharArray(); for (char ch2 : value2) { int result2 = Character.hashCode(ch2); System.out.print('The hash code for the character ''+ch2+'' is given as:'+result2+' '); } System.out.print('Enter the third input:'); char[] value3 = scanner.nextLine().toCharArray(); for (char ch3 : value3) { boolean result3 = Character.isDigit(ch3); if(result3){ System.out.println('The character '' + ch3 + '' is a digit. '); } else{ System.out.println('The character '' + ch3 + '' is not a digit.'); } System.out.print('Enter the fourth input:'); char[] value4 = scanner.nextLine().toCharArray(); for (char ch4 : value4) { boolean result4 = Character.isISOControl(ch4); System.out.println('The fourth character ''+ch4+'' is an ISO Control:'+result4); } } } }
Wyjście:
Enter the first input:89 The value comes to: 1 Enter the second input:J The hash code for the character 'J' is given as:74 Enter the third input:5 The character '5' is a digit. Enter the fourth input:h The fourth character 'h' is an ISO Control:false
Przykład 2
public class JavaCharacterExample2{ public static void main(String[] args) { // Create four char primitives ch1, ch2, ch3 and ch4. char ch1, ch2, ch3, ch4; // Assign the values to ch1, ch2, ch3 and ch4. ch1 = 'T'; ch2 = 'k'; ch3 = ' '; ch4 = 'G'; // Create four boolean primitives b1, b2, b3 and b4. boolean b1, b2, b3,b4; // Assign the results to b1, b2, b3 and b4. b1 = Character.isLetter(ch1); b2 = Character.isLowerCase(ch2); b3 = Character.isSpace(ch3); b4 = Character.isDefined(ch3); String str1 = ' The first character is a letter: ' + b1; String str2 = ' The second character is a lower-case: ' + b2; String str3 = ' The third character is for space: ' + b3; String str4 = ' The fourth character is defined in Java identifier: ' + b3; // Print the values of b1, b2, b3 and b4. System.out.println( str1 ); System.out.println( str2 ); System.out.println( str3 ); System.out.println( str3 ); } }Przetestuj teraz
Wyjście:
The first character is a letter: true The second character is a lower-case: true The third character has a space: true The third character has a space: true