05.使用EXCEL內建函數Find,Left,Mid,Concatenate將半結構化資料轉換為結構化資料
使用Excel內建函數將半結構化資料轉換為結構化資料
1.先至維基百科(關鍵字:DAX index wiki)複製「DAX指數的組成公司」的項目。
*除了按右鍵複製,也可直接按快捷鍵Ctrl+C複製。
3.選擇貼上成為「文字」,按確定。
4.貼上完成後,在A1-D1欄輸入標題名稱。
5.下圖可看到,第16列的資料格式與其他資料並不相同,為了避免下面步驟出錯,現在先手動更動,排解錯誤。
將「E.ON(E.ON AG能源)」改為「意昂集團(E.ON AG,能源)」。
6.接下來要建立資料表,到資料標籤點選「從表格/資料」。
7.對話框跳出後,記得勾選「我的表格有標題」,再按確定。
8.直接關閉跳出的Power Query編輯器。
9.接下來要使用find函數計算左括號、逗號及右括號在字串中的位置。
B2=FIND("(",[@原來])
C2=FIND(",",[@原來])
D2=FIND(")",[@原來])
*記住!"雙引號"內的標點符號為全形;輸入函式的標點符號則為半形。
10.計算結果如下。
11.進入下一步驟前,請先新增三欄:
E=中文
F=原文
G=產業類別
12.找出字串分隔符號的位置後,接下來要使用left及mid函數單獨抓出中文、原文及產業類別的名稱。
函數介紹:
Left_從左數幾個字元
Right_從右數幾個字元
Mid_從第n個開始數,共數幾個字元
在儲存格中輸入:
E2=中文=LEFT([@原來],[@左括號]-1)
F2=原文=MID([@原來],[@左括號]+1,[@逗號]-[@左括號]-1)
G2=產業類別=MID([@原來],[@逗號]+1,[@右括號]-[@逗號]-1)
函式說明:
E2=中文=LEFT([@原來],從左括號的左邊一個字元開始數起)
F2=原文=MID([@原來],從左括號的右邊一個字元開始數起,數逗號跟左括號之間的字元)
G2=產業類別=MID([@原來],從逗號的右邊一個字元開始數起,數右括號跟逗號之間的字元)
完成圖如下。
13.接下來統整一下以上的函數。
14.接下來因為要將資料做成表格並貼至網頁,因此需要先統一輸入表格語法。
以下介紹兩種方法:
(1)直接將表格語法和文字以"&"連在一起。
H2="<tr><td>"&[@中文]&"</td><td>"&[@原文]&"</td><td>"&[@產業類別]&"</td></tr>"
(2)使用CONCATENATE將多組字串組合成單一字串。
*此函數是用逗號將語法及欄位名稱連結在一起。
H2=CONCATENATE("<tr><td>",[@中文],"</td><td>",[@原文],"</td><td>",[@產業類別],"</td></tr>")
15.接下來將H欄的資料全選並複製至編輯器,並用<table></table>標籤包住即可。
<table border="1"></table>
*border 屬性可設定表格框線。
16.完成表格如下。
德國 DAX 30 成分股
沈慧鈞整理 | ||
中文 | 原文 | 產業類別 |
愛迪達 | Adidas AG | 體育用品 |
安聯 | Allianz SE | 保險 |
巴斯夫 | BASF SE | 化工 |
拜耳 | Bayer AG | 醫藥 |
西門子能源股份公司 | Siemens Energy AG | 能源 |
寶馬 | Bayerische Motoren Werke AG | 汽車製造 |
大陸集團 | Continental AG | 運輸行業製造 |
科思創 | Covestro AG | 聚合物材料 |
戴姆勒賓士汽車公司 | Daimler AG | 汽車製造 |
德意志銀行 | Deutsche Bank AG | 金融 |
德國證券交易所 | Deutsche Borse AG | 金融 |
德國郵政 | Deutsche Post AG | 物流 |
德國電信 | Deutsche Telekom AG | 電信 |
德國住宅公司 | Deutsche Wohnen SE | 房地產 |
意昂集團 | E.ON | AG能源 |
費森尤斯集團 | Fresenius SE | 健康,醫院 |
費森尤斯醫療 | Fresenius Medical Care AG & Co. KGaA | 腎透析產品和服務,Fresenius SE的子公司 |
漢高 | Henkel | 化工 |
英飛凌 | Infineon Technologies AG | 半導體製造 |
林德 | Linde AG | 化工 |
默克集團 | Merck KGaA | 化工製藥 |
MTU航空發動機公司 | MTU Aero Engines AG | 飛機發動機製造 |
麥德龍 | Metro AG | 商品零售 |
慕尼黑再保險 | Munchener Ruckversicherungs-Ges. AG | 保險 |
萊茵集團 | RWE AG | 能源 |
SAP公司 | SAP AG | 企業管理軟體與解決方案供應商 |
西門子 | Siemens AG | 電器製造 |
大眾汽車 | Volkswagen AG | 汽車製造 |
沃諾維亞 | Vonovia SE | 房地產 |
Delivery Hero | Delivery Hero SE | 網際網路訂餐服務 |
留言
張貼留言