JavaScript で文字列内のアクセント記号/分音記号を削除する質問する

Question

ES2015/ES6の場合文字列.prototype.normalize()、

const str = "Crème Brûlée"
str.normalize("NFD").replace(/[\u0300-\u036f]/g, "")
> "Creme Brulee"

注: ( )NFKDのようなものを( に) 正規化したい場合はを使用します。\uFB01ﬁfi

ここでは 2 つのことが起こっています。

normalize()を Unicode 正規形に変換すると、NFD結合された書記素が単純な書記素の組み合わせに分解されます。はè+としてCrème表現されます。e ̀
正規表現の使用文字クラスU+0300 → U+036Fの範囲に一致させるために、Unicode標準で便宜上「発音区別符号の結合Unicode ブロック。

2021年現在、Unicodeプロパティエスケープ:

str.normalize("NFD").replace(/\p{Diacritic}/gu, "")

パフォーマンステストについてはコメントを参照してください。

あるいは、並べ替えだけをしたい場合

国際コレーター十分なサポートがある現在約95%ポリフィルも利用可能ここしかし、私はそれをテストしていません。

const c = new Intl.Collator();
["creme brulee", "crème brûlée", "crame brulai", "crome brouillé",
"creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare)
[ 'crame brulai', 'creme brulay', 'creme bruléa', 'creme brulee', 'crème brûlée', 'creme brulfé', 'crome brouillé']


["crème brûlée", "crame brulai", "creme brulee", "crexe brulee", "crome brouillé"].sort()
[ 'crame brulai', 'creme brulee', 'crexe brulee', 'crome brouillé', 'crème brûlée']

["crème brûlée", "crame brulai", "creme brulee", "crexe brulee", "crome brouillé"].sort((a,b) => a.localeCompare(b))
[ 'crame brulai', 'creme brulee', 'crème brûlée', 'crexe brulee', 'crome brouillé']

Answer 1

ES2015/ES6の場合文字列.prototype.normalize()、

const str = "Crème Brûlée"
str.normalize("NFD").replace(/[\u0300-\u036f]/g, "")
> "Creme Brulee"

注: ( )NFKDのようなものを( に) 正規化したい場合はを使用します。\uFB01ﬁfi

ここでは 2 つのことが起こっています。

normalize()を Unicode 正規形に変換すると、NFD結合された書記素が単純な書記素の組み合わせに分解されます。はè+としてCrème表現されます。e ̀
正規表現の使用文字クラスU+0300 → U+036Fの範囲に一致させるために、Unicode標準で便宜上「発音区別符号の結合Unicode ブロック。

2021年現在、Unicodeプロパティエスケープ:

str.normalize("NFD").replace(/\p{Diacritic}/gu, "")

パフォーマンステストについてはコメントを参照してください。

あるいは、並べ替えだけをしたい場合

国際コレーター十分なサポートがある現在約95%ポリフィルも利用可能ここしかし、私はそれをテストしていません。

const c = new Intl.Collator();
["creme brulee", "crème brûlée", "crame brulai", "crome brouillé",
"creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare)
[ 'crame brulai', 'creme brulay', 'creme bruléa', 'creme brulee', 'crème brûlée', 'creme brulfé', 'crome brouillé']


["crème brûlée", "crame brulai", "creme brulee", "crexe brulee", "crome brouillé"].sort()
[ 'crame brulai', 'creme brulee', 'crexe brulee', 'crome brouillé', 'crème brûlée']

["crème brûlée", "crame brulai", "creme brulee", "crexe brulee", "crome brouillé"].sort((a,b) => a.localeCompare(b))
[ 'crame brulai', 'creme brulee', 'crème brûlée', 'crexe brulee', 'crome brouillé']

JavaScript で文字列内のアクセント記号/分音記号を削除する質問する

ベストアンサー1

おすすめ記事