iconv
utf-8 文字列を通常のASCII文字列に「変換」するコマンドを使用して、文字を最も近いASCII文字に置き換えることができます。しかし、私の問題は、含める結果文字列が必要であることです。まったく同じ文字数(コードポイント)をソース文字列として使用します。たとえば、ポンド(£
)文字は3桁の文字()または2桁の文字に置き換えられますGBP
。代わりにこの文字を次に変更したいと思います。æ
ae
一つ文字(例えば、L
または?
またはa
)e
。どのような方法/オプションがありますか?
概要
私はラテン語ベースのテキスト用の「ASCIIベースの」ルックアップルーチンを開発したいと思います。たとえば、位置3は5(1文字ではなく3文字に拡張されるfind 'uco' in '£Húçôz'
ため)の代わりに返される必要があります(最初の位置である1から計算を開始します)。£
私が開発したいのははるかに複雑です。ここでは、問題をできるだけ単純化しようとしています。
また、これを参照してください探すASCII以外のラテン語ベースのテキスト文字列を一致させる場合、ルーチンは完璧である必要はありませんが、一致(存在する場合)の(最初の)位置は正しい文字(コードポイント)の位置を指す必要があります。