Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonUnicodeデータベース


unicodedataモジュールは、Unicode文字データベースを使用してすべてのUnicode文字にアクセスするために使用されます。このデータベースには、すべてのキャラクターのキャラクタープロパティがあります。

このモジュールを使用するには、 unicodedataをインポートする必要があります コード内のモジュール。

import unicodedata

Unicodeデータベースメソッド

ここでは、unicodedataモジュールのいくつかのモジュールについて説明します。

モジュール(unicodedata.lookup(name))-

このメソッドは、名前で文字を検索するために使用されます。名前が有効な場合は、文字を返す必要があります。そうしないと、KeyErrorが発生します。

モジュール(unicodedata.name(chr [、default]))-

このメソッドは、指定された文字の名前を文字列として返すために使用されます。デフォルト値が指定されている場合、その文字がデータベースに存在しない場合はデフォルトを返す可能性があり、そうでない場合はValueErrorが発生します。

モジュール(unicodedata.digit(chr [、default]))-

このメソッドは、指定された文字の整数桁を返すために使用されます。デフォルト値が指定されている場合、文字がデータベースに存在しないか、データベースに正しく存在しない場合、デフォルトを返す可能性があります。そうでない場合、ValueErrorが発生します。

モジュール(unicodedata.category(chr))-

このメソッドは、文字が割り当てられている一般的なカテゴリを返すために使用されます。文字の場合は「L」を返し、大文字の場合は「u」を返し、開き角かっこの場合はPs(句読点の開始)などを返します。

モジュール(unicodedata.mirrored(chr))-

このメソッドは、文字にミラーリングされた文字があるかどうかを確認するために使用されます。一部の文字には、「(」や「)」などのミラーリングされた文字があります。ミラーリングされた文字と一致する場合は1を返し、それ以外の場合は0を返します。

サンプルコード

import unicodedata as ud
print(ud.lookup('ASTERISK'))
print(ud.lookup('Latin Capital letter G'))

#The Unicode name from the characters
print(ud.name(u'x'))
print(ud.name(u'°'))

#The Unicode character to decimal and numerics
print(ud.decimal(u'6'))
print(ud.numeric(u'9'))

#The Unicode character categoty
print(ud.category(u'A'))
print(ud.category(u'9'))
print(ud.category(u'[')) #Punctuation Start

#Unicode character to check whether mirrored or not
print(ud.mirrored(u'A'))
print(ud.mirrored(u'<'))

出力

*
G
LATIN SMALL LETTER X
DEGREE SIGN
6
9.0
Lu
Nd
Ps
0
1

  1. Pythonで整数を文字に変換する方法は?

    Pythonの組み込み関数chr(​​)は、0〜0x10ffffの整数に相当するsunicode文字を返します。 >>> chr(a) 'd' >>> chr(300) 'Ĭ' >>> chr(65) 'A'

  2. Pythonで整数をUnicode文字に変換する方法は?

    Pythonライブラリのchr()関数は、0から0x10ffffまでの整数に関連付けられたUnicode文字を変換します。 >>> chr(36) '$' >>> chr(97) 'a' >>> chr(81) 'Q'