用於安全 AI 模型的氣隙資料準備

    Ertas Data Suite 為網路安全團隊提供本地端、氣隙式管線,用於準備威脅情報、日誌資料和事件報告進行 AI 模型訓練——而不會將敏感安全資料暴露給外部服務。

    The Challenges You Face

    安全資料是最敏感的資料

    威脅情報、弱點報告、事件回應手冊和網路日誌包含對手樂於取得的資訊。將此資料發送到任何外部服務——即使是有信譽的 AI 供應商——都會擴大攻擊面並違反最小暴露原則。

    威脅資料以異質格式送達

    STIX/TAXII 動態消息、Syslog 條目、PCAP 中繼資料、YARA 規則、MITRE ATT&CK 對應和自由文字事件報告都需要在成為有用的訓練資料之前進行標準化。每種格式都有其自身的解析挑戰和特定領域的結構。

    標記需要安全專業知識

    分類威脅類型、嚴重等級和攻擊向量需要具有深厚安全知識的分析師。將標記外包給通用標註服務既是安全風險也是品質風險——非專家經常對細微的安全資料做出錯誤標記。

    模型訓練資料是戰略資產

    您為安全 AI 模型建構的資料集代表了多年累積的威脅情報和機構知識。透過供應商漏洞、API 弱點或服務條款變更而失去對這些資料的控制,可能危及您的競爭優勢和客戶的安全。

    How Ertas Solves This

    Ertas Data Suite 是一款完全以氣隙模式運行的原生桌面應用程式——無需網路連接、無遙測、無外部依賴。將它安裝在您 SOC、SCIF 或隔離分析環境內的安全工作站上,以零暴露風險處理最敏感的安全資料。

    五模組管線處理完整的資料準備工作流程。匯入模組將異質威脅資料來源標準化為一致的格式。清理模組去除雜訊、去重條目並標準化欄位名稱。標記模組提供專門建構的介面,讓安全分析師使用其領域專業知識標記威脅。增強模組生成受控的變體以平衡代表性不足的威脅類別。匯出模組產出版本化、附帶稽核軌跡的資料集,準備好進行模型訓練。

    因為每項轉換都記錄在僅追加的稽核軌跡中,您可以維護安全框架要求的監管鏈文件——並且可以將任何模型預測追溯到產生它的確切訓練資料和準備步驟。

    Key Features for 網路安全公司

    Data Suite

    真正的氣隙運行

    Data Suite 完全不需要任何網路連接。它作為獨立的原生應用程式運行,所有處理都在本機進行。無 DNS 查詢、無更新檢查、無遙測。該應用程式在完全沒有網路介面的環境中也能完整運作。

    Data Suite

    多格式安全資料匯入

    匯入模組處理 STIX 套件、CSV/JSON 日誌匯出、PDF 事件報告、純文字 IOC 清單和結構化威脅動態消息。可為組織特定的日誌結構描述配置自訂格式解析器。

    Data Suite

    分析師驅動的標記

    安全分析師使用他們已經熟悉的框架來標記資料——MITRE ATT&CK 技術、殺傷鏈階段、嚴重性分類和自訂分類法。介面會呈現相關條目的上下文以提高標記的一致性和速度。

    Vault

    不可變稽核軌跡

    每項操作都記錄到僅追加的帳本中,並附帶密碼學完整性驗證。稽核軌跡支援 NIST CSF、SOC 2 Type II 和 FedRAMP 對用於安全作業的 AI 系統的文件要求。

    Why It Works

    • Data Suite 的氣隙架構滿足 CISA 約束性作業指令和 DoD CMMC Level 3 對 AI 訓練資料準備的資料處理要求。
    • 安全團隊已從機密事件報告中準備訓練資料集,而沒有任何資料離開安全設施——使先前因資料敏感性限制而無法實現的 AI 輔助威脅分類成為可能。
    • 分析師驅動的標記介面將準備已標記威脅情報資料集的時間從數週的手動試算表工作縮短到數天的結構化標註。
    • 增強功能有助於解決安全資料中固有的類別不平衡問題——罕見但關鍵的威脅類型在訓練集中獲得充分的代表性,而不會進行人為膨脹。
    • 不可變的稽核軌跡提供了證明用於安全作業的 AI 模型是在正確處理、正確標記的資料上訓練的所需證據。

    Example Workflow

    一家網路安全公司希望訓練一個按攻擊向量和精密程度分類釣魚郵件的模型。一名分析師在分析實驗室的氣隙工作站上開啟 Ertas Data Suite,透過匯入模組從公司內部儲存庫匯入 20,000 個已確認的釣魚樣本。

    清理模組標準化電子郵件標頭、提取 URL 和附件中繼資料,並去重近似相同的變體。資深威脅分析師使用標記模組按技術(憑證竊取、惡意軟體投遞、商業電子郵件詐騙等)和精密度等級對每個樣本進行分類。增強模組為代表性不足的類別生成受控變體,以確保訓練資料的平衡。

    匯出模組產出帶有完整稽核軌跡的版本化 JSONL 資料集。該資料集透過核准的媒體轉移到公司的訓練基礎設施,在那裡產出一個自動分類收到的可疑電子郵件的分類模型——將最精密的威脅優先路由給資深分析師。

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.