本地数据准备的硬件选型：CPU、GPU 和内存需求

"我们需要 A100 吗？"是开始数据准备项目的企业客户最常见的硬件问题。答案几乎总是不需要。

数据准备工作负载——摄入、OCR、清洗、标注、增强、导出——与模型训练有不同的计算特征。训练受益于大规模 GPU 并行和高内存带宽。数据准备是顺序的、I/O 密集的，通常瓶颈在磁盘速度而非计算。

按管道阶段的需求

CPU 4+ 核用于并行文件处理。NVMe SSD 是主要瓶颈。不需要 GPU。

引擎	硬件	速度（页/秒）
PaddleOCR	GPU (RTX 4070)	15-25
Surya OCR	GPU (RTX 4070)	20-30

模型大小	量化	所需 VRAM	速度 (token/秒)
7B	Q4_K_M	4-5 GB	30-60
14B	Q4_K_M	8-10 GB	20-35

RTX 4060 Ti 16GB、32GB RAM、2TB NVMe。处理概念验证项目和文本为主的数据集。

RTX 4080/4090、64GB RAM、4TB NVMe。大多数企业数据准备项目完全满足。

2x RTX 4090 或 1x A6000、128-256GB RAM、8TB NVMe。大规模数据准备和 14B+ 模型推理。

RTX 4090（$1,800）提供 A100 数据准备任务推理性能的 80-90%，成本仅为 12-15%。将 A100 预算留给实际训练任务。

Ertas Data Suite 的原生桌面架构直接访问所有硬件——CPU、GPU、NPU 和文件系统——无容器层或虚拟化的开销。