不過兩者都有瓶頸,如果AI有足夠的智慧,你應該很早就可以在各大火車站跟機場看到
只要說出目的地或者以交談的方式訂票應該就已經出現了,可是並沒有
顯然在準確度上是有一定程度的問題,apple把它放上來應該是增加iOS豐富程度
當機器做出不合乎人類預期的行為時,手機用戶會修正他
可是如果在訂票系統出問題呢?使用者可能就要重來一次,那時候很多使用者應該"瑟瑟念"
"該死!一早用按鈕的就好,講了一大堆,結果還給我搞錯,又要重來"
"怎麼這麼難用!雖然到達目的地,可是要多轉機好幾次,好久"
不要對它有太大期待,那就會好一點,放到iOS上,的確有時候真的還蠻有趣的
denny_kf wrote:
你太小看數位訊號處理了,人說話的聲音有特定的頻率範圍和型態,是可以分離得出來的,雖然多少還是會有所影響,但沒有你想像的那麼跨張。再者,你怎麼就認為你想到的問題別人都沒想到?事實上,這部分跟本不是我們要替他擔心的部分,語意的分析和server端的AI程度才是瓶頸
那你也太樂觀了,人在吵雜的環境中和一個人面對面的講話(這表示看著對方,可以利用表情輔助理解)都會發生聽不懂的狀況,更何況是電腦單憑聲音識別。沒錯,現在是有很多種去噪的技術,而且早就廣泛的應用在手機通訊當中了。但是我們在講手機時還是時常會遇到聽不清楚的狀況。這不就代表了目前的技術尚有其極限。
不知道您知不知道在數位訊號處理當中,有一項參數叫做S/N ratio,當雜訊(背景噪音)遠大過訊號(使用者的語音),電腦就無法判別真正的訊號內容為何了。即使有去噪技術,但去噪技術不可能100%完全精準的抓出屬於噪音的部分,所以即使用近似的噪音去還原,也因SN ratio太大,而造成訊號嚴重的失真。
若我們對訊號還原的技術這麼強大,那麼小DC都可以當天文望遠鏡來用了。
科技的發展的確是不可限量,誰都說不準,但也別因此對現有科技有太不切實際的幻想。
內文搜尋
X




























































































