UnicodeとUTF-8の違い

Anonim

Unicode vs UTF Unicodeの開発は、今日使用されている大多数の言語の文字と、それほど重要ではないがテキストの作成に必要な他の文字とをマッピングするための新しい標準を作成することを目的としていました。 UTF-8は、ファイル内の文字をUnicodeにエンコードできる多くの方法があるため、ファイルをエンコードできる多くの方法の1つに過ぎません。

<! - 1 - >

UTF-8は互換性を考慮して開発されました。 ASCIIは非常に顕著な標準であり、すでにASCII規格でファイルを持っていた人は、現在のシステムを壊す可能性があるため、Unicodeを採用するのを躊躇するかもしれません。 UTF-8は、ASCII文字コードの文字のみを持つコード化されたファイルは、ASCIIコード化されているかのように、同じファイルになるため、この問題を解決しました。これにより、ファイルを変換したり、Unicode標準を知らなかった現在のレガシーソフトウェアを変更することなく、Unicodeを採用することができました。 Unicodeのための他のマッピング方法のどれもがASCIIとの互換性を壊し、人々に彼らのシステムを変換させるでしょう。

<! UTF-8のASCIIへの互換性の遵守は、ほとんどの場合、使用されているすべての文字がASCII文字セットに含まれているワードプロセッサに理想的な副作用をもたらします。 UTF-8は、すべてのコードポイントを表すバイトのみを使用します。ファイルサイズは、UTF-16でエンコードされたファイルの半分で2バイト、UTF-32でエンコードされたファイルの4分の1です。

<! - 3 - >

UTF-8は、スペース効率とバイト指向性の両方を備えているため、World Wide Webで採用されています。 Webページは、多くの場合、通常ASCII文字セットの外にある文字を含まない単純なテキストファイルです。他のエンコーディング方法を使用すると、ネットワークの負荷が増加するだけです。電子メール転送システムでさえ、UTF-8はまだ使用されている古いエンコーディングシステムの代わりとしてゆっくりだが確かに採用されている。要約:

1。 Unicodeは、コンピュータがテキストを表示および操作するための標準であり、UTF-8はUnicode

2の多くのマッピング方法の1つです。 UTF-8は、古いASCII

3との互換性を保持するマッピング方法です。 UTF-8は、他のエンコーディング方法と比較して、Unicodeのための最もスペース効率のよいマッピング方法です。

4 UTF-8は、Webで最もよく使われるUnicode規格です。