[데이터 익명화를 위한 파이프 라인]
제목 : 데이터 익명화를 위한 파이프 라인[Building an Anonymization Pipeline] 초판 1쇄 발행 : 2022년 04월 11일 지은이 : 루크 아버클, 칼레드 엘 에맘 옮긴이 : 이창현 출판사 : 한빛미디어 ![]() |
일을 하면서 다루는 데이터는 사내 보안을 위해 데이터가 외부로 반출되지 않게만 하고 있고, 사내라는 제한된 영역에서만 사용되기 때문에 데이터 익명화를 하지는 않고 있다. 간혹 외부 기관과의 협업을 위해 데이터가 반출될때는 수치데이터의 경우 정규화/표준화 작업을 통해 일종의 익명화를 수행하고는 있지만, 개인의 정보가 침해될 만한 데이터를 다루지는 않고 있다.
하지만 데이터 관련된 일을 하면서 주변에 민감데이터를 다루는(의료기관, 금융기관, 정부기관, 공항 등) 곳에서 종종 들려오는 개인정보 침해와 관련된 소식을 들으면서 속상했던 적이 있다. 특히 그 중 나의 정보가 누출되었을지도 모르는 상황들도 간혹 있었어서 화가날때도 있었다.
특히 얼마전에 충격적이었던 뉴스는 무려 '정부'에서 출입국 얼굴사진을 AI 민간 업체에 넘겼다는 사실이었다. 아마도 좋은 목적의 서비스를 개발하기 위해서 그랬겠지만... 개인의 정보를 허락없이, 정확히는 처음의 수집목적(1차 목적)에 부합되지 않는 2차 목적으로 사용된 경우인 것 같았다.(3장 파이브 세이프의 '프로젝트 안전' 부문 참조)
https://www.hani.co.kr/arti/economy/it/1016022.html
[단독] 정부, 출입국 얼굴사진 1억7천만건 AI업체에 넘겼다
정부가 출입국 심사에 쓸 ‘인공지능’(AI) 개발 명분으로 약 1억7천만건의 내·외국인 얼굴 사진을 민간 업체에 넘긴 것으로 확...
www.hani.co.kr
처음 책을 고를때는 데이터 익명화의 '방법'들이 예제 코드와 함께 소개될 줄 알았는데... 그런것은 아니었다. 코드내용은 없고 데이터 익명화에대한 개괄적인 내용과 주요 개념들, 그리고 그 방법론에 대한 이야기를 다루었다. 혹시 익명화 방법에 대한 직접적인 도움을 얻고 싶은 분들은 다른 책을 찾아보는 것이 좋을 것 같다.
그럼에도 데이터 익명화에 대해 두루뭉술하게만 알고있던 내게 꽤나 도움이 되었던 책이다. 개인적으로는 용어에 대한 정리를 할 수 있었고, 위험 관리 프레임 워크인 파이브 세이프(five safe)에 대해서도 알아볼 수 있었다.
* 익명화의 파이브 세이프(ref : https://ieeexplore.ieee.org/document/8821469) 1 프로젝트 안전 – 1차 목적, 2차 목적 데이터 공유 시나리오의 법적, 윤리적 경계는 무엇이며 개인 정보 보호 조치로 익명화가 필요한가? 2 인력 안전 – 수신자 신뢰(동기, 능력) 예상되는 데이터 수신자는 누구이며 데이터를 재식별할 동기와 능력은 무엇이며 데이터에서 누구를 알 수 있는가? 3 환경 안전 – 위험 행렬 고의적인 재식별 시도를 방지 또는 데이터 침해를 방지하기 위한 기술적, 조직적 통제는 무엇인가? 4 데이터 안전 – 위협 모델링 데이터 환경의 사람과 설정을 고려할 때 식별 가능성의 수준은 어느 정도이며 데이터에 대한 어떤 위협을 관리해야 하는가? 5 결과물 안전 – 개인 정보 침해를 결정하기 위한 식별 가능성 임곗값의 선택 의도된 목적 및 기타 목적으로 익명화된 데이터를 사용할 때 우려되는 점은 무엇이며 적절한 식별 가능성 임곗값은 무엇인가? |
몇 가지 용어들에 대해 정리해보면,
조금 어려운 부분들도 있기는 했지만, 데이터 익명화에 대해 전반적인 흐름과 방법론들, 그리고 주요 개념과 용어들을 배워볼 수 있는 시간이어서 감사했다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
<Reference>
- https://docs.microsoft.com/ko-kr/compliance/regulatory/offering-hipaa-hitech
'항해 > 독서' 카테고리의 다른 글
[파이썬을 활용한 베이지안 통계] (0) | 2022.07.24 |
---|---|
[소프트웨어 아키텍처 101] (0) | 2022.06.26 |
[내 인생 5년 후] (0) | 2022.05.24 |
[ELIXIR 처음 배우는 엘릭서 프로그래밍] (0) | 2022.04.24 |
[Quantum Computing: An Applied Approach] (0) | 2022.04.04 |