
supply-chaindemand-forecastingdata-pipelineenterpriseon-premiseai-trainingtime-series
供應鏈需求預測AI的資料準備
建構供應鏈需求預測AI資料管道的實用指南——涵蓋資料來源對映、依預測時間範圍劃分的品質要求、特徵工程以及企業供應鏈的本地部署。
EErtas Team·
麥肯錫估計,AI驅動的需求預測可以將供應鏈誤差降低30-50%,並將缺貨導致的銷售損失減少高達65%。然而,大多數企業需求預測專案在資料準備階段就停滯了,而不是在模型開發階段。原因是結構性的:需求預測需要整合來自從未被設計為相互通訊的系統的資料——ERP、WMS、POS、CRM和外部資料提供商——形成一個乾淨的、時間對齊的統一資料集。
預測模型本身往往是專案中最簡單的部分。將歷史銷售資料、庫存位置、供應商交貨時間、促銷日曆和總體經濟訊號整合成一致的、經過品質驗證的訓練集,才是專案60-80%工作量集中的地方。本指南涵蓋如何系統地建構該資料管道。
需求預測的資料來源對映
需求預測模型消耗來自多個企業系統的資料。每個資料來源有不同的格式、更新頻率和品質特徵。
| 資料來源 | 來源系統 | 典型格式 | 更新頻率 | 關鍵欄位 |
|---|---|---|---|---|
| 歷史銷售/訂單 | ERP (SAP, Oracle, NetSuite) | CSV/Excel匯出、API擷取 | 每日到每週 | SKU、數量、日期、通路、客戶區隔、價格 |
| 庫存位置 | WMS (Manhattan, Blue Yonder) | CSV/Excel匯出 | 每日 | SKU、位置、在庫數量、在途、預留 |
| 供應商交貨時間 | 採購/SRM系統 | Excel、手動追蹤表 | 每月到每季 | 供應商、SKU/類別、報價交貨時間、實際交貨時間歷史 |
| 促銷日曆 | 行銷/貿易促銷系統 | Excel、共用日曆 | 每月 | 促銷類型、開始/結束日期、受影響SKU、折扣力度 |
| 銷售點資料 | POS/零售系統 | CSV、EDI 852 | 每日到每週 | 門市、SKU、銷售數量、價格、退貨 |
| 價格歷史 | ERP或定價引擎 | CSV/Excel | 依價格變更事件 | SKU、生效日期、標價、淨價、幣別 |
| 天氣資料 | 第三方API (NOAA, Weather Company) | JSON/CSV | 每日 | 區域、溫度、降水、惡劣天氣警報 |
| 總體經濟指標 | 政府統計、資料供應商 | CSV | 每月到每季 | CPI、GDP成長、消費者信心、失業率 |
| 競爭對手定價 | 網路爬蟲或第三方資料來源 | JSON/CSV | 每日到每週 | 競爭對手、產品類別、價格點、可用性 |
並非每個預測模型都需要所有資料來源。資料來源的選擇取決於預測時間範圍和業務背景。雜貨零售商的短期補貨預測需要每日POS資料和促銷日曆。製造商的長期產能規劃預測需要總體經濟指標和供應商交貨時間趨勢。
依預測時間範圍劃分的品質要求
不同的預測時間範圍有不同的資料品質容忍度。用於年度產能規劃的策略預測可以容忍一些資料不精確。驅動每日補貨訂單的營運預測則不能。
| 預測時間範圍 | 時間跨度 | 主要資料來源 | 品質要求 | 可接受粒度 |
|---|---|---|---|---|
| 營運 | 1-14天 | POS資料、目前庫存、天氣、促銷日曆 | 非常高:缺失值低於1%,每日粒度,資料延遲低於24小時 | 每日按SKU按位置 |
| 戰術 | 2-12週 | 歷史銷售、庫存、促銷、供應商交貨時間 | 高:缺失值低於3%,每週粒度,每週更新可接受 | 每週按SKU按區域 |
| 策略 | 3-18個月 | 歷史銷售趨勢、總體經濟指標、競爭格局 | 中等:缺失值低於5%,每月粒度,每月更新 | 每月按產品類別按市場 |
| 長期規劃 | 1-5年 | 年度趨勢、市場研究、人口變化、技術採用曲線 | 寬容:缺失值低於10%,每季/每年粒度 | 每季按產品系列按區隔 |
資料新鮮度要求
需求預測資料的價值隨資料來源不同而以不同速率衰減:
| 資料來源 | 新鮮度要求 | 陳舊資料的影響 |
|---|---|---|
| POS / 銷售訂單 | 當日或次日 | 基於昨日需求的補貨訂單會錯過趨勢變化 |
| 庫存位置 | 當日 | 因可用量承諾不準確導致過量庫存或缺貨 |
| 促銷日曆 | 提前2-4週 | 預測遺漏未計入促銷帶來的需求激增 |
| 供應商交貨時間 | 每月更新 | 基於過時交貨時間的安全庫存計算 |
| 天氣 | 1-3天預測視窗 | 無法擷取天氣驅動的需求(季節性商品、暖通空調、飲料) |
| 總體經濟 | 每月到每季 | 策略預測錯過經濟轉折點 |
需求預測資料的管道階段
階段1:擷取與結構描述驗證
擷取階段從來源系統提取資料並驗證每次擷取是否符合預期的結構描述。結構描述漂移——當來源系統在升級過程中變更欄位名稱、日期格式或新增/移除欄位時——是生產預測管道中常見的故障模式。
| 驗證檢查 |
|---|