Apache Kafka 快速的兩個主因：循序 I/O 與 Zero-Copy

Alex Xu 在影片中說明兩個為什麼 Apache Kafka 能夠提供高流量傳輸大量紀錄的特性：

1. 循序 I/O

以 C 來說，當使用 fopen() 需要開啟一個檔案為 append 模式，file pointer 會直接在檔案尾端準備以新增方式繼續加入新資料，會比每次加入資料需要移動 Pointer 到特定位置再寫入來的快速。如果用硬碟的循序讀寫與隨機讀寫，會更容易理解。

在 File-based Database，例如 dBASE, COBOL + ISAM, Paradox，也是直接將新紀錄寫在檔案後方。可以用 PC-Tools 打開檔案觀察 HEX Code 確認。風險在於如果來不及寫入 EOL，沒有順利關閉檔案，就會造成檔案損毀與資料遺失。

刪除紀錄也只是在記錄上做個標記，並不會真正刪除，需要等到執行 compact database 才會真正刪除。因此我在設計需要確實刪除客戶個人資料時，會以無意義的字串覆蓋，直接刪除其實只是標記，資料還在。

2. Zero Copy

避開將相同資料在不同記憶體區塊再次複製後移動，縮短傳送路徑。例如在提供 DMA 模式情況下，讓系統函數直接將讀取已經被讀入記憶體緩衝區的資料放入網卡 NIC 緩衝區開始傳送，省略 Socket Buffer 路徑。