https://hardsoft.at.webry.info/202106/article_1.html
UTF-8
2021/7/23 16:23:00
String
が複雑なデータ構造であることhttps://doc.rust-jp.rs/book-ja/ch08-02-strings.html#文字列でutf-8でエンコードされたテキストを保持する
どこかで聞いたかしてUnicode Transformation Format-8の略だと思っていたが,規格票を見るに違うようだ。
https://www.unicode.org/versions/Unicode13.0.0/ch03.pdf#G31703
SWITCH
cp ∈ [ U+0000, U+007F ] ⇒ [ 00₁₆..7F₁₆ ]
cp ∈ [ U+0080, U+07FF ] ⇒ [ C2₁₆..DF₁₆, 80₁₆..FB₁₆ ]
cp ∈ [ U+0080, U+00FB ] ⇒ [ C2₁₆, 80₁₆..FB₁₆ ]