
Intel Panther Lake 處理器。
在看完 Intel 這次針對 Panther Lake 處理器的整體架構介紹,在這篇文章中就來看 Intel 這次兩款新的處理核心:Cougar Cove(P-Core 效能核心)以及 Darkmont(E-Core 效率核心),以及混合上述兩者的架構設計以及軟體資源調度等設計。
更多 Intel ITT 2025 文章:
總覽:
Intel 反攻號角吹響?Tech Tour 2025 活動展示 18A 製程、Fab 52 晶圓廠、以及最新筆電 Panther Lake 處理器!
Panther Lake 處理器整體架構解析
Intel ITT 2025:Panther Lake 處理器整體架構解析 以自家 18A 製程達成高效能低功耗的平衡表現
Intel ITT 2025:Panther Lake 處理器架構解析 GPU 篇:採用最新 Xe 3 架構的 12 核心內顯登場!
Intel ITT 2025:Panther Lake 處理器架構解析 NPU 篇:以精簡架構達成同效能更低功耗表現
Intel ITT 2025:Panther Lake 處理器架構解析 IPU 篇:以整合設計提供更清晰真實的視訊畫質
18A 製程
Intel ITT 2025:以 RibbonFET 與 PowerVia 組合 18A 製程重回頂尖晶圓製造能力
Fab 52 晶圓廠參訪
Intel ITT 2025:最新 Fab 52 晶圓廠參訪 一探 18A 製程的先進製造基地
AI 發展策略
Intel ITT 2025:迎接 Agentic AI 時代到來!新 Intel 正在加速趕上

這部分由 Intel CPU 主要架構工程師兼 Intel 院士 Stephen Robinson 所主講,不過同樣的因為 Intel 這次的保密協定,所以這部分的內容還是以 Intel 所提供的簡報內容為主。

在這個部分將會針對這次 Panther Lake 處理器架構的四大部分:18A 製程的電路設計、怎麼兼顧功耗與效能、P-Core 與 E-Core 的微架構、整體 SOC 在運算時的功耗效能平衡設計進行介紹。

這次 Panther Lake 處理器可說是從核心 IP 設計到作業系統面都進行了最佳化設計,包括了核心 IP、SOC 架構、工作負載排程、作業系統端的電源管理等等。

首先來看核心 IP 設計部分。

這次 Panther Lake 持續沿用這幾年 Intel 的混合核心配置,以 P-Core 效能核心(主攻單核效能)、E-Core 效率核心(主攻多核效能)以及 LP E-Core 低功耗效率核心( 主攻能源效率)組成。

這張簡報可以看出這幾年 Intel 在混合架構上的配置演進,也可看出 Intel 在混合架構的運作思維,因應不同的產品目標也在不停地調整中,像是在 2024 年就因應不同的產品需求,以相同的核心組合成不同的產品(Arrow Lake 處理器跟 Lunar Lake 處理器),在封裝設計上也有所不同。

在這次 Panther Lake 處理器的基礎核心部分,就是以目前 Intel 最新的 18A 製程所製作,在電晶體密度、供電設計、訊號傳遞上都有更新的設計,這部分可以參考第一天晚上所簡報的內容,Stephen Robinson 表示,這次 18A 的 Power Via 背部供電設計,讓整個電路的設計完全不同,在電源供應端因為跟訊號線路隔離,所以有了更好的電源供應設計,也減少了電源供應的損耗,相對的也讓電源的需求降低(功耗降低),電路的設計密度也提升。
不過這樣的做法也不是沒有缺點,在過往因為電源線路跟訊號線路混合的設計,訊號線路受到電源線路的保護,受到干擾的狀況比較少,可以用較高的時脈運作,但是現在訊號線路與電源線路分離,相對的就要在抗干擾部分做出額外的設計,像是間隔較大的佈線配置等等,不過 Stephen Robinson 表示這並不算是太大的問題。

接著來看實際核心的設計,首先來看 Cougar Cove,也就是新的 P-Core 效率核心的部分,基本上這次 Cougar Cove 的設計大致以先前 Arrow Lake/Lunar Lake 中的 Lion Cove 為基礎,但是透過導入 18A 製程,讓整體的電路密度擴大,這也讓架構設計師可以放進去一些加速效率的新設計,像是可加速快取處理的 TLB 設計、更大的 L3 快取(跟 E-Core 叢集共用)等等。

另外在 Cougar Cove 本身也加入了 記憶體消歧(Memory Dismbiguation)以及改進版本的分支預測架構等,增加核心本身的 IPC 效能,並且透過更新的底層演算法以及多級預測器來減少延遲。

在分支預測單元部分也採用更新設計,在原有 Lunar Lake 的 novel BPU scheme 上提高正確率,增加結構容量來減少延遲,另外在電源效率部分也進一步的改善。

接著是 E-Core Darkmont 的部分,跟 Cougar Cove 相同,Darkmont 也是由前一代 Skymont 基礎上,透過18A 製程的優勢改良而來。

透過底層演算法跟分支預測的改進,提升了 Darkmont 在 Nanocode 編解碼上的效能,同時節省了晶片面積、使用頻寬、減少延遲。另外 Darkmont 也跟 Cougar Cove 一樣加入了記憶體消歧以及改進分支預測等設計,提高核心本身效能。

所以接下來就來看組合後的結果,跟 Arrow Lake-H 處理器以及 Lunar Lake 處理器相比,Panther Lake 處理器在單核心效能部分,在同樣的效能設定下功耗節省了 40% 以上,而在接近的功耗設定下則是要多出 10% 的效能表現。

至於在多核心效能部分,在接近的功耗設定下,Panther Lake 處理器比起 Lunar Lake 處理器要高出 50% 以上的多核心效能,而跟 Arrow Lake-H 處理器相比, 在同樣的效能設定下,Panther Lake 處理器所需要的功耗減低了 30% 以上。

接著談到混合核心架構的設計部分。

從這張圖可以看出 4P+4E 的 Panther Lake 處理器主要是要來接替 Lunar Lake 處理器的角色,這邊的核心配置比較接近,P-Core 跟 E-Core 為在同樣的 Compute Tile 當中,在同樣的 Ring 上,採用共享的 L3 快取記憶體。而 4P+8E+4LP-E 的設計則是接近 Arrow Lake-H 處理器的定位,但是在核心配置上,則是跟 Arrow Lake-H 處理器的 6P+8E+2LP-E 配置不同,減少了 2 組 P-Core 改為 2 組 LP E-Core,並且將 LP E-Core 移至 Compute Tile 中,增加整體多核心的算力,並且以叢集的方式進行配置。

在快取跟記憶體次系統的部分,這次 Panther Lake 處理器讓 E-Core 也能存取 Compute Tile 裡面的 L3 快取,這也讓 E-Core 可以以更高的時脈運作,最高可以來到 3.5 GHz,代表說就可以用 E-Core 執行更多的工作負載,在性能提高的同時降低延遲以及所需功耗。另外 LP E-Core 具備了更大的 L2 快取,為 Meteor Lake/Arrow Lake 處理器的一倍,並且透過 Memory-side 快取,提高頻寬與降低延遲以及電力需求。

接著由 Intel 客戶運算事業群效能與能耗優化院士 Rajshree Chabukswar 上台講述這次 Panther Lake 處理器在電源管理跟任務排程部分的設計。包括核心調度、電源管理系統最佳化以及平台軟體最佳化等等。

這次 Intel 在 Panther Lake 處理器上仍然採用由 Alder Lake 處理器發展而來的 Thread Director 技術,作為引導作業系統進行工作分配的基礎,像是哪一種情形需要使用性能最好的核心,哪一種情形需要使用電源效率最好的核心等等,不過 Rajshree Chabukswar 表示最終仍然是由作業系統的排程器 Scheduler 來決定分配。
從上面的圖可以看出,基本上整個架構分為三層:核心、Intel Thread Director 以及作業系統的排程器,核心會提供給 Thread Director 各個核心的分級,以及目前各個核心運作狀態的遙測數據,而根據這些數據, Thread Director 會形成一個會動態更新、具備每個核心電源效率以及效能表現的硬體回饋介面表(HFI),提供給作業系統的排程器來讀取,讓作業系統可以依照負載以及電源模式需要選擇調用哪個核心。

雖然說這個設計從 Arrow Lake 處理器就具備,但是隨著不同處理器世代的微架構改進,例如所帶來的 IPC 效能提升,讓 Intel 也持續針對 Thread Director 的分類模型進行更新,Rajshree Chabukswar 也表示應對了 Panther Lake 處理器效能的提升,Intel 在內部也進行了大量的工作,包括針對分類模型進行重新訓練,在核心端的遙測數據也加以更新等等。

接著這張投影片可以看到從 Raptor Lake 到 Panther Lake 處理器以來,不同核心配置所帶來的 Thread Director 核心排程改變,Rajshree Chabukswar 也在接下來的簡報中以實際上不同程式的執行狀態,來顯示 Panther Lake 處理器核心負載分配的情形:

在重視在電源效率的微軟 Teams 視訊會議(含效果包)中,大部分都使用 LP E-Core 進行處理、E-Core 跟 P-Core 基本上都是在休息狀態。

而在具備電源效率以及混合運算,運用微軟 Office 應用軟體的 UL Procyon 辦公室生產力效能測試中,可以可以看到會依照負載作業的不同,在 LP E-Core 跟 P-Core 間進行切換,作業系統排程器在判斷到需要更高的單核心效能需求時(Office 相關應用),就會立刻將工作負載由 LP E-Core 直接拉到 P-Core。

在全核心效能需求的 Cinebench 2024 多核心運算中,可以看到幾乎是全部核心都進行運作狀態,可以看到在 Cinebench 2024 效能測試初期的設定過程中,主要仍由單一 LP E-Core 進行處理,但是在正式進入效能測試階段後,幾乎是所有核心都進入全時脈運作階段。

接著看 GPU 瓶頸的遊戲效能表現部分,在這邊是以 DirectX12 的遊戲《控制》作為範例。

在原本的基礎 Thread Director 設計下,以使用 AC 電源的狀態時,可以看到在遊戲執行上主要會是透過兩個 P-Core 來進行,提供遊戲效能表現,而若是有多的平行運算需求,則是會透過 E-Core 來提供這部分的效能,但是仍然有一部分工作會使用效能比較低的 LP E-Core 來處理。

但是這次 Panther Lake 處理器在這邊做出了一些改變,由於將 E-Core 整合到 Compute Tile 中,所以在這次 Panther Lake 處理器的 Thread Director 中,會將大部分工作交給 E-Core 來進行,只有在超出 E-Core 負載的時候才會轉向 P-Core,這樣的好處是在有限的電力供應下,可以將更多的電源供給給 GPU,提供更高的畫面顯示幀率,並且透過提高時脈後的 E-Core 核心以及共享的 L3 記憶體,來減少由 E-Core 替代 P-Core 的效能損失(畢竟在遊戲中還是 GPU 的效能比較重要)。另外這次 Intel 在 Panther Lake 處理器上導入了 Graphics Intelligence Bias Control 設計,可以讓 GPU 有更長的時間發揮其 100% 的效能(這個在 GPU 篇會談到)

接著談到電源控制與管理軟體的部分,基本上在電腦中的電源控制軟體可以分為幾層,從基礎開始的 Intel SoC 電源管理,上一層則是平台(作業系統)的電源控制,最上層則是 OEM 廠商所設計的使用模式選擇(像是微星 MSI Center 或是華碩 My ASUS 軟體中提供的使用模式),基本上也分別對應了 Intel Thread Director 以及作業系統的排程控制設計。

而 Intel 在這部分也提供了 OEM 廠商自己調整電源供應策略的選項,透過 Intel 動態調整工具(Intel dynamic tuning utility,IDTU)以及微軟作業系統端的 PPM,可以讓 OEM 廠商設計更獨特的電源/性能調整模式,做出比 Windows 內建電源模式更細緻的調整選項,而這些調整後的資訊就會回到上面的 Thread Director,對處理器的運作模式進行最佳化調整。

既然提到了作業系統的 PPM 設計,也就一併來看一下這次 Panther Lake 處理器在這部分的改變,在過去的作業系統中可以看到電源調整模式的滑動選項,可以在最佳電池使用時間、最佳效能模式,以及中間選項中選擇,除了需要使用者自己進行調整外,模式也固定。

而這次 Intel 在 Panther Lake 處理器中加入了一個 Intel Experience Optimizer(智慧體驗最佳化,IXO)功能,整合在上面所說的 Intel 動態調整工具中,會依照裝置的當下使用狀態自動進行電源模式的調整,無需使用者自行設定。Rajshree Chabukswar 也表示透過這個設計,Panther Lake 也縮短了使用 AC 電源(插電)以及 DC 電源(電池)間的效能差異。

而這張投影片也展示了傳統電源管理模式(設定在平衡狀態)跟開啟 IXO 模式後的效能差異,在 UL Procyon Office 辦公室生產力效能以及 CineBench 2024 測試中,開啟 IXO 模式下有 19% 的效能提升。

最後來總結一下這次 Panther Lake 處理器在 Compute Tile 上所做的改變,包括在軟體層面跟平台上做出更緊密的合作設計,並且針對運作排程部分針對 Thread Director 進行最佳化,硬體採用兩種不同的混合核心配置以及採用 18A 製成的核心架構等等。
接下來陳拔還會對這次 Panther Lake 處理器的 XPU(GPU/NPU)部份進行介紹,請大家繼續看下去囉。