데이터 딜레마 해독하기: AI 시대의 효과적인 데이터 삭제 전략

현재의 트렌드에 비추어 볼 때, 현대 기업들은 혁신적인 수단을 통해 데이터를 활용할 수 있는 전례 없는 기회를 누리고 있습니다. 그러나 동시에 보유 데이터의 성격과 활용 방법을 면밀히 검토하여 향후 발생할 수 있는 법적 문제를 피하는 것도 필수적입니다. 생성형 인공지능의 부상에도 불구하고 조직은 민감한 개인 데이터를 보호하고, 조직 운영에 실제 이익보다 더 큰 위험을 초래하는 오래된 정보를 신중하게 관리 및 삭제해야 할 책임이 있습니다.
Forrester는 2024년에 비정형 데이터가 개에서 개로 두 배로 증가할 것으로 예측하며, 이는 부분적으로 AI에 의해 주도될 것으로 예상합니다. 그러나 데이터 환경이 진화하고 침해 및 개인정보 침해로 인한 비용이 증가함에 따라 효과적이고 강력한 데이터 보존 및 삭제 전략을 수립하는 방법에 대한 비판적 검토가 필요합니다.
데이터 폭증과 침해 비용 증가
예상 데이터 양이 증가함에 따라 데이터 침해 및 개인정보 침해로 인한 비용도 증가하고 있습니다. 랜섬웨어 범죄자들은 호주 법원 건, 켄터키주 의료 회사 건, 23andMe, Infosys, 보잉, 보안 제공업체 Okta 같은 대기업을 비롯해 매우 민감한 의료 및 정부 데이터베이스를 해킹하고 있습니다. IBM의 조사에 따르면 2023년 침해 사고의 평균 총 비용은 달러 445만 달러로 2020년 대비 15% 증가한 달러에 달했습니다.
정보를 효율적으로 처리하기 위해서는 기업이 오래된 데이터의 폐기에 관한 프로토콜을 수립하는 것이 중요합니다. 인공지능의 도래와 함께 최고 경영진은 미래의 잠재적 가능성 때문에 데이터 삭제가 여전히 필요한지 고민할 수 있습니다. 그러나 데이터를 장기간 보관하면 개인정보 보호 규정 미준수로 인한 보안 침해 또는 과태료 부과 가능성이 높아집니다. 이러한 위험을 완화하기 위한 초기 조치에는 데이터 보존 계획과 관련된 미묘한 차이점과 구체적인 이점을 평가하는 것과 함께 조직의 데이터 활용도를 철저히 조사하는 것이 포함됩니다.
오래된 데이터를 삭제하는 이유는 무엇인가요?
데이터 보호 규정과 관련된 엄격한 법적 의무를 준수하기 위해 조직은 오래된 정보를 삭제해야 하는 경우가 많습니다. 이러한 조치는 필수적인 것으로 간주되는 기간 동안만 개인 데이터를 보유해야 하기 때문에 필수적이며, 그 결과 여러 기업 부서에서 서로 다른 보존 기간을 시행하고 있습니다. 만료된 데이터를 삭제하면 잠재적인 법적 영향을 최소화할 수 있을 뿐만 아니라 보관 비용도 절감할 수 있습니다.
더 이상 사용되지 않는 데이터 식별
어떤 데이터가 관련성이 없어졌고 어떤 데이터가 지속적인 가치를 제공하는지 판단하기 위한 철저한 접근 방식에는 수신 정보의 출처와 범주, 관련된 특정 필드, 저장 플랫폼, 처리 시스템을 설명하는 상세한 데이터 맵을 작성하는 것이 포함됩니다. 철저한 데이터 맵을 유지함으로써 조직은 민감한 데이터가 어디에 있는지, 어떤 종류의 개인 데이터가 처리되고 있는지, 이러한 처리 활동의 목적을 명확하게 파악할 수 있습니다. 또한 이 방법을 통해 기업은 데이터가 처리되고 유지되는 지역과 활용되는 시스템을 정확히 파악할 수 있습니다.
의미 있는 데이터의 포괄적인 인벤토리와 분류는 강력한 개인정보 보호 이니셔티브의 초석이 되어 기업의 네트워크 인프라 전반에서 정보의 진행 상황을 쉽게 파악할 수 있는 데이터 출처를 식별할 수 있게 해줍니다.
기업이 축적된 정보 저장소의 목록을 구축한 후에는 기업 대표와 함께 법률 및 기술 전문가 간의 학제 간 협업을 통해 특정 데이터 세트의 재정적 가치를 평가하고, 해당 데이터 세트 유지에 적용되는 규정 준수 요건을 파악하며, 민감한 정보가 손상되거나 노출되거나 필수 기간을 초과하여 보관될 경우 발생할 수 있는 결과를 고려할 수 있습니다.
일반적으로 조직에서 기득권을 가진 개인은 특히 기술의 빠른 발전을 고려할 때 정보 근절에 대해 주저하는 경향이 있습니다. 따라서 보존 및 삭제와 관련된 논의는 기업에 최대의 이익을 가져다주는 요소에 집중해야 합니다. 예를 들어, 재정 기관 내에서 모델 학습을 위해 방대한 양의 데이터를 활용하여 대출 승인 기준을 개선하기 위해 노력하는 그룹을 상상해 보십시오. 유감스럽게도 이러한 전략은 개인 데이터를 보호하고 프라이버시를 유지하기 위한 규정의 목적과 상충됩니다.
지난 20년 동안 이자율, 대출 조건, 소비자 금융 프로필 등의 분야에서 상당한 진화가 있었던 것은 사실이지만, 과거 데이터만으로는 현재 대출자의 상황을 적절히 파악하지 못할 수 있습니다. 따라서 최신 신용 보고서를 활용하여 현재의 상황을 기반으로 정확한 위험 평가를 생성하는 것이 보다 신뢰할 수 있는 접근 방식입니다.
상업용 부동산 부문의 현재 상황은 이 문제를 해결해야 할 필요성을 강조합니다.전자상거래와 원격 근무 방식이 널리 채택되기 전에 얻은 정보를 바탕으로 여러 가지 위험 예측 모델이 개발되었습니다. 잘못된 예측의 가능성을 최소화하려면 시간이 지남에 따라 데이터의 관련성이 떨어지고 가치가 감소하는 방식을 탐색하기 위해 주요 이해관계자와 협력하는 것이 필수적입니다. 또한 정확한 예측을 보장하기 위한 전략을 수립할 때 최신 트렌드를 가장 잘 나타내는 데이터 세트를 식별하는 것도 고려해야 합니다.
오래된 데이터 처리:
데이터의 보존 기간에 관한 결정을 내릴 때는 재무 문서와 관련된 기록 유지에 관한 법적 요건이나 특정 산업 내 개인정보 취급에 관한 특정 규제 지침을 고려해야 합니다. 또한, 법적 소멸시효에 의해 정해진 기간을 검토하면 잠재적인 소송을 위해 필요한 경우 데이터를 얼마나 오래 보존해야 하는지에 대한 통찰력을 얻을 수 있습니다. 이 경우 개별 사용자와 관련된 모든 데이터를 보존하는 대신 거래 내역이나 사용자 동의 증명과 같이 법적 조치를 방어하는 데 필요한 데이터로만 개인 데이터 보존을 제한해야 합니다.
가치가 낮은 것으로 간주되는 정보를 제거하기 위해 다양한 유형의 데이터 보관 기간을 상세히 명시한 보존 일정에 따라 미리 정해진 보존 기간에 따라 데이터를 수동으로 삭제하도록 선택할 수 있습니다. 또는 퍼지 정책의 구현을 통한 자동화로 신뢰성을 높일 수도 있습니다. 그러나 개인 식별 정보를 제거하거나 완전히 익명의 데이터를 활용하는 등의 방법을 사용할 수 있지만 추가적인 복잡성이 발생합니다.
완전히 비식별화된 데이터는 일반적으로 데이터 보호법에서 면제 대상에 해당하지만, 이를 올바르게 수행하려면 사용할 수 있는 가치가 거의 남지 않을 정도로 많은 가치를 제거해야 합니다. 비식별처리에는 SSN, 이름과 같은 고유하고 직접적인 식별자뿐만 아니라 고객 IP 주소와 같은 정보를 포함한 간접 식별자까지 제거해야 합니다. 예를 들어 세이프 하버 보호에 대한 HIPAA 표준을 충족하려면 조직은 18 식별자 목록을 제거해야 합니다. 조직은 분석 또는 AI 모델의 성능을 유지하기 위해 이 접근 방식을 시도할 수 있습니다. 하지만 먼저 이해 관계자와 장단점을 논의하는 것이 중요합니다.
일반적인 함정 피하기
오래된 정보를 다룰 때 조직이 저지르는 가장 일반적인 오류 중 하나는 포괄적인 논의 없이 서둘러 절차를 진행하는 것입니다.프로젝트 관리자는 서두르지 말고 다양한 이해관계자의 의견을 수렴하는 것이 중요하다는 점을 인식해야 합니다. 어떤 데이터를 보존해야 하는지에 대한 피드백을 얻기 위해 기업은 법무, 개인정보 보호, 보안 부서뿐만 아니라 최고 경영진과도 협력해야 합니다. 이를 통해 필요한 데이터만 보존하고 중요한 정보가 실수로 삭제되는 것을 방지하는 보존 계획과 일정표를 수립할 수 있습니다. 보존 기간을 점진적으로 늘리기보다는 짧은 기간부터 시작하여 점차적으로 보존되는 개인 데이터의 양을 줄이는 것이 좋습니다. 단, 삭제된 데이터는 복구할 수 없으므로 조치를 취하기 전에 신중하게 고려해야 합니다.
쓸모없는 데이터를 효과적으로 관리하기 위한 전략을 수립할 때는 데이터 맵과 계보를 구축하고, 적절한 보존 기간을 결정하고, 이러한 정책을 효율적으로 실행하는 등 다양한 요소를 고려하는 것이 중요합니다. 데이터 삭제 프로세스는 복잡할 수 있으므로 법적, 보안적, 경제적 영향을 신중하게 고려해야 합니다. 포괄적인 데이터 보존 정책은 규제 요건을 준수하는 동시에 소중한 디지털 리소스를 보호해야 합니다.
세스 베이티는 데이터 보호 책임자이자 Fivetran 의 개인정보 보호 수석 관리 고문입니다.