UniCode

出自KMU Wiki

跳轉到: 導航, 搜索
  • UTF-32: 最簡單的編碼方式,直接使用32-bit 對code points編碼,使得UTF-32碼與code point 形成 1 對 1對應.
    • 每個字都要使用 4-byte 存檔
  • UTF-16: 範圍在 U+0000 ... U+FFFF 以內的code points等常用字, 直接使用兩個byte編碼, 對於剩下的 U+10000 ... U+10FFFF,則使用較多的4個byte編碼.其中NotePad 存檔選項使用的 Unocide 選項存檔就是這種編碼方式.
    • 常用字用 2 bytes 表示, 少用的字用 4 bytes 表示
  • UTF-8: 為可變長度編碼(及每個字的編碼長度不固定), 為一串 8-bit 編碼單元(code units)所組成.與ASCII 相容
    • 使用可變長度編碼, 最節省空間

Windows 處理中文"高雄醫學大學" --> [轉成 Unicode] --> 呼叫 Win32API --> [轉成Big5] --> 顯示在 consol 視窗中


References: