
觀察過去30天的趨勢,柯文哲的聲量一路領先,經過「愛莉莎莎效應」、政見發表會、辯論會,聲量一路持續加持,而且造勢活動沒有遊覽車、沒有發便當,人數卻每場都爆滿擠到路邊,還有一場比一場愈來愈多的跡象。
大數據分析提供了一個更全面、更具多元性的觀察角度,相對於電話民調更能夠客觀、全面地理解公眾對於候選人的關注和支持度。市內電話民調所能受訪的族群非常有限,尤其以年齡在70歲以上的人群為主。這個年齡層的受訪者多半依賴傳統媒體,對於網路科技的接受度有限。同時,這個族群往往持有較為根深蒂固的藍綠意識形態,因此在進行選民傾向的評估時,可能呈現出特定政黨立場的傾向。除了市內電話民調的限制,手機訪問也存在著一些缺點。一般上班族在工作時間內很難抽空接聽手機,這對於進行有效的民調可能構成一定的困擾。同時,要求民調工作人員在24小時內不同的時段進行訪查,這不僅增加了人力成本,也使得整個調查過程變得更為複雜。由於成本的考量,手機和市話的民調樣本數通常受到限制,僅有1000個樣本左右。樣本數過少的情況下,為了彌補族群差異,例如年齡、性別、教育程度、戶籍地等等,引入各種不適當的加權方式更會把誤差大幅放大,也容易透過加權進行人為操作。相對地,大數據分析則能夠涵蓋數以千萬計的搜尋樣本,這使得其結果更為具有代表性和可靠性。大數據的龐大樣本量意味著我們能夠更全面地捕捉社會的多樣聲音,而不會受到樣本數的限制。總體而言,大數據分析相對於手機和市話民調,更能夠提供更具廣度和深度的數據支持,從而更客觀地了解公眾的意見和傾向。

在過去一週的數據分析,可以看出「柯文哲」持續獲得輾壓式的大勝,「賴清德」和「侯友宜」則是較難分出誰第二或第三。由此來看,「棄保效應」、「西瓜效應」都會把選票集中在柯文哲身上,柯文哲當選中華民國總統已成大多數人的期待。不過這樣的預測結果前提是大部分網路使用者能返鄉投票,才能把 YouTube 上的喜好程度轉化成實質選票。
結論:大數據分析在評估總統候選人網路聲量方面的優勢不可否認,然而,有幾點需強調以保持客觀性。首先,大數據分析雖然提供了廣泛的網路使用者數據,但這僅代表網路上的聲音,並不能直接對應到實際選民的選票。網路使用者可能不代表整個選民群體,尤其是那些不使用網路的人。其次,大數據分析並非傳統民調,它不能直接問及選民對候選人的立場。傳統民調是直接向受訪者提問的方式,而大數據是基於網路使用者的行為數據進行民意推斷。第三,正面聲量和負面聲量都是大數據中的一部分,它們只是總體聲量的一個面向。正面聲量可能表達支持,但負面聲量也可能是由對手或批評者產生的,並不一定代表選民對候選人的真實態度。總的來說,雖然大數據分析為我們提供了更全面的數據視角,但在解讀結果時應謹慎,避免過度解讀數據,並理解其局限性。大數據不能替代實際選舉結果,而僅僅是提供了一個更大範圍的參考框架。




























































































