05.使用EXCEL內建函數Find,Left,Mid,Concatenate將半結構化資料轉換為結構化資料
使用Excel內建函數將半結構化資料轉換為結構化資料 1.先至維基百科(關鍵字:DAX index wiki)複製「 DAX指數的組成公司」的項目。 *除了按右鍵複製,也可直接按快捷鍵Ctrl+C複製。 2.開啟一個新的Excel檔案,在 A2 欄按右鍵「選擇性貼上」。 3.選擇貼上成為「文字」,按確定。 4.貼上完成後,在A1-D1欄輸入標題名稱。 5.下圖可看到,第16列的資料格式與其他資料並不相同,為了避免下面步驟出錯,現在先手動更動,排解錯誤。 將「 E.ON(E.ON AG能源) 」改為「 意昂集團(E.ON AG,能源) 」。 6.接下來要建立資料表,到資料標籤點選「從表格/資料」。 7.對話框跳出後,記得勾選「 我的表格有標題 」,再按確定。 8.直接關閉跳出的Power Query編輯器。 9.接下來要使用 find函數 計算 左括號、逗號及右括號 在字串中的位置。 B2=FIND("(",[@原來]) C2=FIND(",",[@原來]) D2=FIND(")",[@原來]) *記住! "雙引號"內的標點符號為 全形 ; 輸入 函式 的標點符號則為 半形 。 10.計算結果如下。 11.進入下一步驟前,請先新增三欄: E=中文 F=原文 G=產業類別 12.找出字串分隔符號的位置後,接下來要使用 left及mid函數 單獨抓出中文、原文及產業類別的名稱。 函數介紹: Left_從左數幾個字元 Right_ 從右數幾個字元 Mid_從第n個開始數,共數幾個字元 在儲存格中輸入: E2=中文=LEFT([@原來],[@左括號]-1) F2=原文=MID([@原來],[@左括號]+1,[@逗號]-[@左括號]-1) G2=產業類別=MID([@原來],[@逗號]+1,[@右括號]-[@逗號]-1) 函式說明: E2=中文=LEFT([@原來],從左括號的左邊一個字元開始數起) F2=原文=MID([@原來], 從左括號的右邊一個字元開始數起 ,數逗號跟左括號 之間的 字元) G2=產業類別=MID([@原來], 從逗號的右邊一個字元開始數起 , 數右括號跟逗號 之間的 字元 ) 完成圖如下。 13.接下來統整一下以上的函數。 14.接下來因為要將資料做成表格並貼至網頁,因此需...