• 2

[ 已解決 ] TxT檔匯入EXCEL 資料剖析問題

各位01神人大家好

由於網路設備的資料庫不能用UI的方式表現
只能用終端機軟體連線
打指令把資料庫顯示出來
並用複製貼上的方式貼到TXT上
再將TXT放入EXCEL做資料處裡
但這過程中發生了一些問題
想請教各位


TXT簡單呈現如下圖

[ 已解決 ] TxT檔匯入EXCEL 資料剖析問題


欄位的顯示方式為
Name (N空白) Group (N空白) type (固定N空白) IP address (固定N空白) Status (固定N空白) ...

Name和Group的欄位
由使用者自行命名
有較多種方式呈現

(1) 數字
(2) 數字-英文
(3) 數字-英文(空白)英文
(4) 數字-英文(空白)英文(空白)英文...等




把TXT丟入Excel用資料剖析
由於空白的原因
剖析結果會有如下

99.8.1 | DF_clean | Room | 61 | ...等
99.1.18-IAH | office | DF_office | 92 | ...等


*Name(紅色)Group(綠色)



欄位全都使跑掉
如果資料少微調一下還OK
資料量大就要花長時間的精力在上面


想請問01各位神人
有什麼良藥可以解決現在的囧況








===============解決方式================

首先找出規律:2個以上空白為分欄規則
用個進階一點的文字編輯器先處理
然後用搜尋取代,搭配 regexp 功能(解釋)

尋找目標:\s{2,} ( 找出兩個以上連續空白)
取代成:tab鍵/分號/逗點

[ 已解決 ] TxT檔匯入EXCEL 資料剖析問題


在進入資料Excel資料剖析,就能分割較正確

[ 已解決 ] TxT檔匯入EXCEL 資料剖析問題









先跟大家道歉
一開始表達得不是很好
造成閱讀上的困擾
最後感謝大家熱情的指導3Q
2016-01-05 20:52 發佈
那個衛 wrote:
我手上有個txt檔


TXT 檔內容應該是從其它原始資料轉存的吧?!
建議從最原始的資料下手!
My Interior Knowledge is Extraordinaire
Mystique Hsiao wrote:
TXT 檔內容應該是...(恕刪)


感謝M大建議

一開始也是打算朝您建議的方向著手
但原始資料無法從介面上顯示
必須用指令的方式才能顯示出來

那個衛 wrote:
一開始也是打算朝您建議的方向著手
但原始資料無法從介面上顯示
必須用指令的方式才能顯示出來


所以原始資料的檔案格式是?
My Interior Knowledge is Extraordinaire
應該是sql查詢結果,看是否能把輸出檔案格式從plaintext改為csv或是excel..
那個衛 wrote:
但原始資料無法從介面上顯示
必須用指令的方式才能顯示出來
以 tab 作為分隔字元解析看看
那個衛 wrote:
各位01神人大家好...(恕刪)
對一般的資料處理都不會建議用 逗號、或是空白作分隔,比較好的作法是用TAB 作分隔比較不會有誤判的情形。

找找看看原始資料在另存成新檔輸出時能選擇用 TAB 輸出的好像是CSV檔類型有 TAB
Mystique Hsiao wrote:
所以原始資料的檔案格...(恕刪)

nwcs wrote:
應該是sql查詢結果...(恕刪)


是終端機軟體,只能對介面的文字複製貼上


swearss wrote:
對一般的資料處理都不...(恕刪)

Wei_1144 wrote:
以 tab 作為分隔...(恕刪)


請問有什麼方法能轉tab?
Select col1+'l'+col2+'|'+col3 From table

假如不在db裡
是TUI的output
可以試看看去調指令本身的output方式
有些是固定欄寬,有些可以控制輸出的欄位數
再用shell去sed cut awk grep

Btw
最近幾版的excel接外部資料能力非常強大
Google power query plz
系統跑出來的,表示這些文字應該有重複性,或規則性,不會是亂數

一般這種問題,我來處理,我會先看資料的規則性,

你給的資訊太少,所以只能以這兩行來猜


依你的資料來看,前兩欄有問題,最後一欄ok

所以我會用 ultraedit 尋找取代,將 " " 換成 TabTabTabTabTab(換五個,拉開40格空間。)

然後靠右對齊,行列模式,這樣就能取出最後一欄。

再來關鍵字是 air/ room ,我會尋找 ^t^t^t^t^tAir 換成 " Air"

尋找 ^T^T^T^T^Troom 換成 " Room"

^T 是 tab

這樣前後兩欄就會被 ^T^T^T^T^T 分開 ,行列模式,就能取出第一欄、和第二欄


※從源頭下手是最好的對策(上述的上式,熟軟體操作,也是很快的)
  • 2
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?