13.沈慧鈞 / Unicode / UTF-8 字元碼 / 資料型態
UTF-8
UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一種字首碼。
UTF-8的編碼方式
UTF-8是UNICODE的一種變長度的編碼表達方式〈一般UNICODE為雙位元組(指UCS2)〉,以8位元為單元對UCS進行編碼,而UTF-8不使用大尾序和小尾序的形式,每個使用UTF-8儲存的字元,除了第一個位元組外,其餘位元組的頭兩個位元都是以"10"開始,使文字處理器能夠較快地找出每個字元的開始位置。
△ Unicode與UTF-8的轉換
△ Google所記錄的2001年至2012年主要編碼方法的使用情況
資料來源:維基百科
做得超優,可以成為大家學習的範本。
回覆刪除