數據交易沙箱是奇安信科技集團股份有限公司針對隱私保護與數據價值挖掘之間存在巨大矛盾這一痛點問題,結合各類法律法規對數據安全開放的要求,秉承“數據不動程序動”、“數據可用不可見”的安全理念推出的數據安全開放平台。平台提供一站式大數據分析平台能力,支持對接多種數據源,具備敏感數據自動識別、數據訪問權限管控、數據操作留痕審計、輸出結果申報審核等功能,實現了數據所有權和使用權分離,確保數據安全可控。並且提供了開放的數據分析建模環境,可讓數據分析師在不改變建模習慣、不降低建模效率的前提下方便的進行建模工作。
通用數據訪問適配層
無縫對接適配數據源平台及外部的數據應用,無需數據源平台改變底層代碼和數流轉方式,提供標準的數據訪問接口,支持對接MySQL、Oracle等主流數據庫/大數據平台和CSV、XLSX等本地數據集的上傳。
數據置換
支持對結構化和非結構化等數據源的敏感數據自動識別,並針對敏感數據進行數據置換操作,在去除數據敏感性的同時,保留原始數據的數據屬性和關聯關係。
數據分析平台
提供集數據預處理、特徵選擇、模型訓練、模型預測與評估為一體的機器學習工作台,支持SQL語句和Python等編程語言,提供Pytorch、sklearn等機器學習框架,內置常用機器學習算法組件,實現組件的可視化拖拽操作,大大降低機器學習門檻,讓更多用户能夠聚焦數據的挖掘,最大程度地開發數據價值。
用户管理
支持多租户用户配置,提供一對多的安全數據挖掘環境與數據分析環境。用户管理包括:密碼管理、有效期管理、登錄時段管理、登錄IP管理、登錄地址管理、用户組管理等。
訪問控制
支持同時以用户/用户組、結構化數據資源、非結構化數據資源為核心要素設置多對多的訪問控制策略。支持基於最小權限原則,從表級、行級、字段級對數據的訪問權限進行嚴格化管控。
操作審計
支持對所有用户的所有數據操作進行全生命週期的日誌記錄,實現所有數據操作可追溯、可審計、可定責。
大數據分析平台
數據交易沙箱方案提供一站式的大數據分析平台能力,從數據收集、處理、分析到機器學習、深度學習,所有流程都可以通過平台功能完成。數據不動程序動,數據可用不可見
數據交易沙箱採用隱私計算新技術,實現“數據不動程序動,數據可用不可見”,數據分析方只能帶走不含敏感數據的分析模型文件和分析結果,既確保原始數據不泄露,又充分發揮了數據的最大價值。多源數據融合分析
數據交易沙箱能夠分佈部署在不同的數據中心,保障數據不流出各自數據中心的前提下,實現融合分析。不改變數據分析方的使用習慣
數據分析師可以在數據交易沙箱建模或上傳鏡像,無需改造現有的機器學習算法,內置更加簡便的分析工具,大大提高了分析效率。多環境部署
數據交易沙箱支持雲平台、虛擬化平台及物理機等異構基礎設施上進行部署,滿足客户不同環境下的部署需求。高擴展、高可用
數據交易沙箱基礎設施組件採用高拓展性的虛擬化架構,深度融合虛擬化擴展能力,一站運維,統一部署,為數據交換保留了適應業務發展的橫向擴展能力。同時通過技術手段從硬件、網絡到數據多副本備份,充分考慮運行可靠性,消除單點故障,通過軟件監測與業務處理聯動,為數據共享業務提供穩定保障。政府:城市大腦、智慧城市建設中政務大數據安全開放流通,政務敏感數據的安全使用
醫療:大型三甲醫院、醫科大學、區域醫療平台醫療大數據安全開放、價值發掘
金融:精準營銷、保險風控等業務中多方數據融合分析建模