UTF-8 Python のログ記録ではどうすればよいですか? 質問する

Question

次のようなコードがあるとします:

raise Exception(u'щ')

原因:

  File "/usr/lib/python2.7/logging/__init__.py", line 467, in format
    s = self._fmt % record.__dict__
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128)

これは、フォーマット文字列がバイト文字列であるのに対し、フォーマット文字列引数の一部が非 ASCII 文字を含む Unicode 文字列であるために発生します。

>>> "%(message)s" % {'message': Exception(u'\u0449')}
*** UnicodeEncodeError: 'ascii' codec can't encode character u'\u0449' in position 0: ordinal not in range(128)

フォーマット文字列を Unicode にすると、問題は解決します。

>>> u"%(message)s" % {'message': Exception(u'\u0449')}
u'\u0449'

したがって、ログ設定では、すべてのフォーマット文字列を Unicode にします。

'formatters': {
    'simple': {
        'format': u'%(asctime)-s %(levelname)s [%(name)s]: %(message)s',
        'datefmt': '%Y-%m-%d %H:%M:%S',
    },
 ...

loggingそして、 Unicode フォーマット文字列を使用するようにデフォルトのフォーマッタにパッチを適用します。

logging._defaultFormatter = logging.Formatter(u"%(message)s")

Answer 1