05.使用EXCEL內建函數Find,Left,Mid,Concatenate將半結構化資料轉換為結構化資料

使用Excel內建函數將半結構化資料轉換為結構化資料

1.先至維基百科(關鍵字:DAX index wiki)複製「DAX指數的組成公司」的項目。
*除了按右鍵複製,也可直接按快捷鍵Ctrl+C複製。

2.開啟一個新的Excel檔案,在A2欄按右鍵「選擇性貼上」。


3.選擇貼上成為「文字」,按確定。


4.貼上完成後,在A1-D1欄輸入標題名稱。


5.下圖可看到,第16列的資料格式與其他資料並不相同,為了避免下面步驟出錯,現在先手動更動,排解錯誤。
將「E.ON(E.ON AG能源)」改為「意昂集團(E.ON AG,能源)」。



6.接下來要建立資料表,到資料標籤點選「從表格/資料」。


7.對話框跳出後,記得勾選「我的表格有標題」,再按確定。


8.直接關閉跳出的Power Query編輯器。


9.接下來要使用find函數計算左括號、逗號及右括號在字串中的位置。

B2=FIND("(",[@原來])
C2=FIND(",",[@原來])
D2=FIND(")",[@原來])

*記住!"雙引號"內的標點符號為全形輸入函式的標點符號則為半形


10.計算結果如下。


11.進入下一步驟前,請先新增三欄:

E=中文
F=原文
G=產業類別


12.找出字串分隔符號的位置後,接下來要使用left及mid函數單獨抓出中文、原文及產業類別的名稱。

函數介紹:
Left_從左數幾個字元
Right_從右數幾個字元
Mid_從第n個開始數,共數幾個字元

在儲存格中輸入:
E2=中文=LEFT([@原來],[@左括號]-1)
F2=原文=MID([@原來],[@左括號]+1,[@逗號]-[@左括號]-1)
G2=產業類別=MID([@原來],[@逗號]+1,[@右括號]-[@逗號]-1)

函式說明:
E2=中文=LEFT([@原來],從左括號的左邊一個字元開始數起)
F2=原文=MID([@原來],從左括號的右邊一個字元開始數起,數逗號跟左括號之間的字元)
G2=產業類別=MID([@原來],從逗號的右邊一個字元開始數起,數右括號跟逗號之間的字元)

完成圖如下。


13.接下來統整一下以上的函數。


14.接下來因為要將資料做成表格並貼至網頁,因此需要先統一輸入表格語法。

以下介紹兩種方法:

(1)直接將表格語法和文字以"&"連在一起。

H2="<tr><td>"&[@中文]&"</td><td>"&[@原文]&"</td><td>"&[@產業類別]&"</td></tr>"


(2)使用CONCATENATE將多組字串組合成單一字串。

*此函數是用逗號將語法及欄位名稱連結在一起。
H2=CONCATENATE("<tr><td>",[@中文],"</td><td>",[@原文],"</td><td>",[@產業類別],"</td></tr>")


兩種方法,相同結果,只要選擇自己理解的方法擇一輸入即可。

15.接下來將H欄的資料全選並複製至編輯器,並用<table></table>標籤包住即可。

<table border="1"></table>
*border 屬性可設定表格框線。


16.完成表格如下。

德國 DAX 30 成分股

沈慧鈞整理
中文原文產業類別
愛迪達Adidas AG體育用品
安聯Allianz SE保險
巴斯夫BASF SE化工
拜耳Bayer AG醫藥
西門子能源股份公司Siemens Energy AG能源
寶馬Bayerische Motoren Werke AG汽車製造
大陸集團Continental AG運輸行業製造
科思創Covestro AG聚合物材料
戴姆勒賓士汽車公司Daimler AG汽車製造
德意志銀行Deutsche Bank AG金融
德國證券交易所Deutsche Borse AG金融
德國郵政Deutsche Post AG物流
德國電信Deutsche Telekom AG電信
德國住宅公司Deutsche Wohnen SE房地產
意昂集團E.ONAG能源
費森尤斯集團Fresenius SE健康,醫院
費森尤斯醫療Fresenius Medical Care AG & Co. KGaA腎透析產品和服務,Fresenius SE的子公司
漢高Henkel化工
英飛凌Infineon Technologies AG半導體製造
林德Linde AG化工
默克集團Merck KGaA化工製藥
MTU航空發動機公司MTU Aero Engines AG飛機發動機製造
麥德龍Metro AG商品零售
慕尼黑再保險 Munchener Ruckversicherungs-Ges. AG保險
萊茵集團RWE AG能源
SAP公司SAP AG企業管理軟體與解決方案供應商
西門子Siemens AG電器製造
大眾汽車Volkswagen AG汽車製造
沃諾維亞Vonovia SE房地產
Delivery HeroDelivery Hero SE網際網路訂餐服務

劉任昌的教學影片 075

留言

這個網誌中的熱門文章

09.公開資訊觀測站 / 基本資料 / 簽證會計師 / 產業類別

18.名稱管理員 / EXCEL 函數 / TRANSPOSE 矩陣轉置 / INDIRECT 間接定址

22.將上次的成果利用VS Code編輯為解答欄加上表格 / 原始碼@2634-2841