13.沈慧鈞 / Unicode / UTF-8 字元碼 / 資料型態

UTF-8

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一種字首碼。

UTF-8的編碼方式

UTF-8是UNICODE的一種變長度的編碼表達方式〈一般UNICODE為雙位元組(指UCS2)〉,以8位元為單元對UCS進行編碼,而UTF-8不使用大尾序和小尾序的形式,每個使用UTF-8儲存的字元,除了第一個位元組外,其餘位元組的頭兩個位元都是以"10"開始,使文字處理器能夠較快地找出每個字元的開始位置。

 △ Unicode與UTF-8的轉換


 △ Google所記錄的2001年至2012年主要編碼方法的使用情況

資料來源:維基百科

劉任昌的教學影片102

留言

張貼留言

這個網誌中的熱門文章

18.名稱管理員 / EXCEL 函數 / TRANSPOSE 矩陣轉置 / INDIRECT 間接定址

09.公開資訊觀測站 / 基本資料 / 簽證會計師 / 產業類別

22.將上次的成果利用VS Code編輯為解答欄加上表格 / 原始碼@2634-2841