본문 바로가기
Tutorial/Big Data & ML

ADsP 1과목 자주 출제되는 핵심 개념 정리

by CLJ 2025. 5. 4.

ADsP(데이터분석 준전문가) 1과목인 ‘데이터의 이해’는 시험의 기본이 되는 과목으로, 기초 개념을 정확히 파악하고 있는지 묻는 문제가 대부분이다. 이 글에서는 실제 시험에서 반복적으로 출제되는 기출문제를 분석해 가장 자주 등장한 핵심 개념을 살펴본다. 

 

목차


 

1. 데이터와 정보의 차이

 

데이터(Data)는 관찰되거나 측정된 사실로, 아직 해석되지 않은 상태의 값이다. 온도, 숫자, 날짜, 제품 ID 등은 그 자체로는 의미를 알 수 없는 가공되지 않은 원시 값이다. 반면, 정보(Information)는 데이터를 특정 목적에 맞게 정리하고 가공하여 의미와 맥락이 부여된 형태이다. 즉, 데이터는 원재료이고, 정보는 그 재료를 조리해 만든 결과물이라 할 수 있다.
 
예를 들어, “2025년 4월 1일부터 7일까지의 일별 판매량”은 데이터다. 이 값을 바탕으로 주간 평균을 구하거나, 전주와 비교해 증가율을 도출하면 그것은 정보이다. 정보해석 가능성활용성이 있으며, 실제 의사결정이나 문제 해결에 사용될 수 있다. 두 개념의 핵심 차이가공 여부의미 존재 여부다. 데이터는 사실 그 자체이며, 정보는 의도적 처리 결과다. 이 관계는 보통 다음과 같은 단계로 이해된다.

데이터 → 처리 → 정보 → 해석 → 판단
 

기출 포인트 및 시험 대비 팁

  • "다음 중 데이터와 정보의 차이를 설명한 것으로 가장 적절한 것은?" 같은 문항이 자주 출제된다.
  • 정의만 외우기보다, 예시를 통해 구분할 수 있어야 한다. 특히 수험자는 문제 보기에서 ‘가공’과 ‘맥락’, ‘의미’라는 단어가 있는지 주의 깊게 본다.
  • 보기 예시에서 자주 틀리는 선택지는 다음과 같다:
    • “정보는 가공되지 않은 수치이다.”(X)
    • “데이터는 해석된 지식이다.”(X)
    • “정보는 데이터를 해석하여 얻은 결과이다.”(O)

이 개념은 시험에서 가장 기본적인 출제 항목으로, 반드시 구분 가능해야 하는 개념 중 하나이다.
 

2. 데이터의 특성 – 존재적 특성과 당위적 특성

 
데이터는 단순한 기록을 넘어 의미 있는 해석과 활용을 가능하게 하는 특성을 갖는다. 데이터의 본질적 속성을 묻는 문제에서 존재적 특성과 당위적 특성이 자주 등장한다. 이 두 개념은 유사해 보이지만 관점과 기능 면에서 명확히 구분된다.

존재적 특성

존재적 특성은 데이터가 객관적인 사실로 존재한다는 개념이다. 즉, 데이터는 해석이나 판단 없이도 현실 속에서 측정되거나 수집 가능한 사실이다.
예: “2025년 4월 12일 기온 21.7도”는 그 자체로 기록된 데이터이며, 주관적 판단이 개입되지 않았다.

당위적 특성

당위적 특성은 데이터를 예측, 추론, 판단의 근거로 활용할 수 있다는 특성이다. 즉, 데이터는 단순히 존재하는 것을 넘어서, 미래의 현상을 예측하거나 의사결정을 내리는 기준이 될 수 있어야 한다.
예: 최근 3개월 기온 데이터를 분석하여 다가오는 여름 평균 기온을 예측하는 것.

시험에서의 구분 기준

  • 존재적 특성: ‘있는 그대로의 사실’, ‘측정된 결과’, ‘해석 없이도 유효’
  • 당위적 특성: ‘예측’, ‘전망’, ‘의사결정’, ‘가치 추론의 기반’


기출 포인트 및 오답 주의

  • 문제 유형: “다음 중 데이터의 특성으로 옳지 않은 것은?”
  • 기출 보기 예시:
    • “데이터는 의사결정에 활용되는 당위적 특성을 지닌다.” (O)
    • “데이터는 객관적 사실로 존재한다.” (O)
    • “데이터는 항상 주관적인 해석을 포함한다.” (X)
    • “데이터는 판단 결과 그 자체다.” (X)


정리

  • 존재적 = 사실 중심
  • 당위적 = 활용 중심
  • 존재적 특성과 당위적 특성 모두 데이터의 속성이라는 것을 주의해야 한다. 

 

3. 데이터의 유형 – 정성적, 정량적, 정형, 비정형

 

데이터는 분석 가능성과 처리 방식에 따라 다양한 유형으로 분류된다. 특히 정성적과 정량적, 정형과 비정형 데이터를 구분하는 문제가 자주 출제된다. 각 유형의 개념과 예시를 명확히 파악하면, 선택지에서 쉽게 정답을 추려낼 수 있다.

정성적 데이터 (Qualitative Data)

수치화하기 어려운, 주관적이고 비구조적인 데이터를 의미한다. 감정, 의견, 서술형 응답 등이 이에 속한다.
예: 고객의 불만 코멘트, SNS 게시글, 인터뷰 응답, 제품 리뷰


정량적 데이터 (Quantitative Data)

수치로 표현 가능하고 통계적 처리에 적합한 데이터다. 객관적이며 분석 효율이 높다.
예: 매출 금액, 제품 수량, 클릭 수, 체중, 시험 점수

정형 데이터 (Structured Data)

미리 정의된 스키마나 포맷에 따라 저장되는 테이블 형태의 데이터다.
예: 엑셀 시트, 관계형 데이터베이스(SQL), 주민등록표

비정형 데이터 (Unstructured Data)

고정된 구조가 없고, 텍스트·이미지·영상 등 다양한 형태로 존재하는 데이터다.
예: 이메일 본문, 사진, 녹음 파일, 동영상, 블로그 게시글
 
반정형 데이터(예: JSON, XML)는 시험에 거의 출제되지 않지만 가볍게 유형을 알아둔다.

시험 기출 포인트 및 실전 팁

문제 유형:

  • “다음 중 정형 데이터에 해당하는 것은?”
  • “정성적 데이터의 예로 적절한 것을 고르시오.”
  • “다음 중 비정형 데이터는?”

정답 예시:

  • “고객 상담 녹취 파일” → 비정형
  • “엑셀에 정리된 고객 DB” → 정형
  • “고객의 감정 평가 서술형 응답” → 정성
  • “일일 방문자 수 통계” → 정량

자주 등장하는 오답 유도 예시:

  • “정형 데이터는 주관적이고 비정형적이다.”(X)
  • “정성적 데이터는 수치 분석에 적합하다.”(X)


정리  

구분 주요 특징 예시
정성적 주관적, 비정형, 언어 기반 인터뷰, 후기, 감정표현
정량적 수치 기반, 분석 용이 매출액, 온도, 인구수
정형 테이블 형태, 고정 구조 SQL DB, 엑셀 표
비정형 구조 없음, 분석 어려움 텍스트, 이미지, 영상, 녹음

시험 전략: 예시 중심으로 외워두면 유형별 문제에서 빠르게 정답을 선택할 수 있다.
 

4. 빅데이터의 4V

 
빅데이터(Big Data)는 단순히 ‘양이 많은 데이터’가 아니라, 기존의 저장·분석 체계로는 처리하기 어려운 특성을 가진 복합 데이터 집합을 의미한다. 이 빅데이터의 특성을 설명하는 4V 개념(Volume, Variety, Velocity, Value)이 반복적으로 출제된다. 주의할 점은 Veracity, Variability 등은 학계 또는 산업계에서 사용되는 확장 개념이지만, ADsP시험에서는 다루지 않고 주로 4V가 출제되므로 4V질문에 대해서는 오답으로 처리된다. 
 

 

① Volume – 데이터의 양

  • 방대한 규모의 데이터
  • 예: 하루 수억 건의 SNS 게시글, 실시간 결제 기록
  • 기존 시스템으로는 저장·처리가 어려울 정도의 크기


② Variety – 데이터의 다양성

  • 정형/비정형/반정형 등 다양한 형태의 데이터
  • 예: 이미지, 텍스트, 로그, 영상, 음성 등
  • 데이터 유형이 복잡해지고, 통합 분석이 어려워짐


③ Velocity – 데이터 생성·처리 속도

  • 데이터가 빠르게 생성되고 실시간으로 유입됨
  • 예: 센서 스트림, 주식 거래 정보, 실시간 추천 시스템


④ Value – 데이터의 가치

  • 데이터 그 자체가 아닌, 그로부터 얻는 인사이트가 중요한 가치
  • 예: 고객 이탈 예측, 수요 예측, 위험 탐지 등
  • 단순 수집이 아닌 분석을 통한 의미 도출이 핵심


시험 기출 포인트 및 실전 팁

문제 유형 예시:

  • “다음 중 빅데이터의 4V에 해당하지 않는 것은?”
  • “다음 보기에서 Variety에 해당하는 예시는?”
  • "빅데이터의 특성으로 가장 적절한 것은?"

자주 출제된 보기 예시:

  • “다양한 데이터 형식을 가진다 → Variety”
  • “데이터 생성 속도가 빠르다 → Velocity”
  • “분석을 통해 얻은 인사이트 → Value”
  • “기존 저장방식으로 처리할 수 없다 → Volume”

혼동 유도 오답 :

“Veracity(진실성), Vision(시각화 능력), Variability(변동성)” 등 → 공식 4V에 해당하지 않음

 

정답 처리 기준:

  • Volume, Variety, Velocity, Value → 공식 4V → 정답
  • Veracity(진실성), Variability(변동성), Vision(시각화), Visibility(가시성) 등 → 기출에서 보기로 출제되었지만 오답 처리됨


정리 

4V 요소  의미  예시
Volume 데이터의 양 실시간 로그, 수십억 건의 트랜잭션
Variety 데이터의 다양성 텍스트, 영상, 센서, 이미지 등 비정형 데이터
Velocity 생성·유입 속도 실시간 주가, 스트리밍 로그, 위치 정보
Value 분석을 통한 가치 창출 고객 행동 예측, 매출 증대 전략 수립

 

5. DIKW 피라미드

 

DIKW 피라미드는 데이터(Data), 정보(Information), 지식(Knowledge), 지혜(Wisdom)의 4단계를 통해, 비정형적 수치나 기록이 어떻게 의사결정에 사용될 수 있는 전략적 통찰로 발전하는지를 설명하는 모델이다. 이 모델의 순서, 각 단계의 정의, 그리고 대표 사례를 구분하는 문제가 자주 출제된다.

D: Data (데이터)

가공되지 않은 사실과 수치다. 예를 들어, “서울의 4월 평균 기온: 17.4도”는 그 자체로 해석되지 않은 원시적 정보이다.

I: Information (정보)

데이터에 맥락과 의미를 부여한 것. 예: “작년 4월보다 2도 상승” → 시간 비교를 통해 맥락이 부여된 상태.

K: Knowledge (지식)

여러 정보 간의 관계, 규칙, 패턴을 파악한 결과. 예: “기온이 상승하면 아이스크림 매출이 늘어난다”는 인과관계를 파악한 단계.

W: Wisdom (지혜)

지식에 기반한 통찰력 있는 판단과 의사결정. 예: “4월 평균 기온이 18도 이상일 경우, 아이스크림 광고를 집중 집행하자”는 전략 수립.

시험 기출 포인트 및 실전 팁

출제 유형:

  • “다음 중 DIKW의 순서로 올바른 것은?”
  • “다음 보기 중 ‘지식(K)’ 단계에 해당하는 것은?”
  • “다음 중 데이터와 정보의 차이로 적절하지 않은 것은?”

실제 보기 예시 구분법:

  • “날짜, 판매량, 기온 등 측정 수치” → 데이터
  • “월별 판매 추이 비교 결과” → 정보
  • “판매 증가 요인은 기온 상승과 관련 있음” → 지식
  • “기온이 상승할 경우 특정 상품의 마케팅을 강화” → 지혜

오답 보기 예시:

  • “지식은 가공되지 않은 수치의 집합이다.”(X)
  • “정보는 통찰력을 반영한 전략적 판단이다.”(X)


정리  

단계 의미 예시
데이터 관측·측정된 수치 4월 평균 기온 17.4도
정보 가공된 데이터 전년 대비 2도 상승
지식 인과관계 파악 기온 상승 시 매출 증가
지혜 전략적 판단 기온 18도 이상 시 광고 예산 증액

 
 

6. 데이터 품질 관리 – 정확성, 완전성, 일관성

 

분석 결과의 신뢰도는 결국 데이터 품질에 달려 있다. 데이터 품질의 핵심 요소를 정의하고, 각 품질 기준이 어떤 문제에 해당하는지 파악할 수 있는 능력을 묻는다. 특히 정확성, 완전성, 일관성은 반복 출제되는 핵심 개념이며, 문제에서 예시로 자주 등장한다.

정확성 (Accuracy)

데이터가 실제 값이나 현실을 얼마나 정확히 반영하고 있는가를 나타낸다.
예: 고객의 주소가 잘못 입력된 경우, 데이터 정확성이 떨어진다.
입력 오류, 측정 오차 등이 정확성 저하의 원인이다.


완전성 (Completeness)

데이터가 누락 없이 전부 입력되어 있는가를 뜻한다.
예: 고객 데이터에서 이름과 이메일은 있으나 전화번호가 비어 있다면 불완전한 데이터다.
결측값(missing value) 문제와 직결된다.


일관성 (Consistency)

동일한 정보가 시스템 전반에서 동일하게 유지되고 있는지를 의미한다.
예: A고객의 등급이 CRM 시스템에서는 VIP인데, ERP에서는 일반 등급으로 기록되어 있다면 일관성이 없는 것이다.


시험 기출 포인트 및 실전 팁

출제 유형:

  • “다음 중 데이터 품질 관리 요소에 해당하지 않는 것은?”
  • “아래 사례에서 나타난 품질 문제는 무엇인가?”

자주 출제된 보기 예시:

  • “정확성은 현실과의 차이를 최소화하는 특성이다.” (O)
  • “완전성은 필수 데이터 항목이 빠짐없이 존재함을 의미한다.” (O)
  • “일관성은 동일 데이터가 시스템 전반에서 동일하게 유지되는 정도이다.” (O)

혼동 유도 보기 예시:

  • “정확성은 데이터를 보기 쉽게 정렬하는 기능이다.” (X)
  • “완전성은 분석 결과의 신뢰성을 뜻한다.” (X)
  • “일관성은 수치의 정규분포 여부를 의미한다.” (X)


정리 

품질 요소  정의  예시
정확성 현실의 사실과 일치 정도 주소 오기재, 오타, 수치 오류
완전성 누락 없는 전체 데이터 유무 전화번호 미입력, 필드 값 공란
일관성 시스템 간 동일성 유지 서로 다른 시스템에서 동일 고객 정보가 다름

 

7. 데이터베이스 개념과 특징

 

데이터 분석의 출발점은 데이터를 저장하고 관리하는 데이터베이스(Database)이다. 데이터베이스의 개념과 특징, 특히 정형 데이터 저장 방식과 공유성, 변화 가능성 등 기본 속성을 이해했는지를 묻는 문제가 반복 출제된다. 복잡한 SQL 문법보다 DB의 개념적 이해가 핵심이다.


데이터베이스란?

데이터베이스는 논리적으로 연관된 데이터의 집합으로, 데이터를 저장, 검색, 수정, 삭제할 수 있도록 체계적으로 구조화된 저장 공간이다. 예를 들어 고객 정보 테이블, 재고 목록, 거래 내역 테이블 데이터는 대부분 DBMS(Database Management System)를 통해 관리되며, 대표적으로는 MySQL, Oracle, PostgreSQL 등이 있다.

데이터베이스의 4대 주요 특징

  1. 통합된 데이터 (Integrated Data)
    • 중복을 줄이고 의미 있는 방식으로 통합된 데이터 집합
    • 예: 각 부서에서 관리하던 고객 정보를 하나의 DB에 통합
  2. 저장된 데이터 (Stored Data)
    • 외부 저장 장치에 장기적으로 저장됨
    • 예: 디스크, 클라우드 등에서 지속적으로 관리
  3. 공용 데이터 (Shared Data)
    • 여러 사용자나 부서가 동시에 접근 가능
    • 예: 마케팅팀과 영업팀이 같은 고객 정보를 조회
  4. 변화되는 데이터 (Dynamic Data)
    • 시간 경과에 따라 값이 계속 갱신됨
    • 예: 주문 상태, 재고 수량, 가격 정보 등은 수시로 변경


시험 기출 포인트 및 실전 팁

출제 유형:

  • “다음 중 데이터베이스의 특징으로 적절하지 않은 것은?”
  • “공용 데이터의 의미로 옳은 것을 고르시오.”

기출 정답 보기 예시:

  • “데이터베이스는 시간에 따라 갱신 가능한 데이터를 저장한다.” (O)
  • “데이터베이스는 여러 사용자가 함께 사용할 수 있다.” (O)

혼동 유도 오답 보기:

  • “데이터베이스는 오직 단일 사용자만 접근할 수 있다.” (X)
  • “데이터베이스는 고정된 정적 데이터를 저장하며 변경이 불가능하다.” (X)
  • “데이터베이스는 통합을 지양하고 개별화된 저장소를 선호한다.” (X)


정리

특성 의미 예시
통합성 중복 제거, 구조화된 형태로 통합된 데이터 각 팀 고객 목록을 한 테이블로 통합
저장성 장기 저장, 지속적 접근 가능 디스크에 보관된 구매 기록
공용성 여러 사용자 및 부서에서 동시 활용 가능 부서 간 재고 테이블 공동 사용
동적성 시간에 따라 지속적 변경 실시간 주문 상태 변경, 재고 수치 갱신

시험 전략: 특징 네 가지를 암기하고, 보기 지문에서 "단일성", "고정성", "비공유" 같은 표현이 오답 신호임을 파악해야 한다.
 

8. 데이터 사이언스와 전략적 인사이트

 

데이터 사이언스(Data Science)는 단순한 데이터 분석을 넘어서, 데이터를 기반으로 문제를 해결하고 미래를 예측하며 전략적 결정을 지원하는 과정 전체를 포함한다. 이 개념의 정의와 목적, 전략적 인사이트(Strategic Insight)와의 관계를 간단한 개념 문제 형태로 출제한다. 출제 빈도는 높지 않지만, 최근 실무 연계 문항이 증가하면서 중요도가 올라가고 있다.


데이터 사이언스란?

통계학, 컴퓨터 공학, 머신러닝 등 다양한 분야의 기술을 통합하여, 데이터를 수집, 분석, 모델링하고 유의미한 패턴을 발견해 내는 과정이다. 핵심은 데이터를 활용한 문제 해결력이다. 예로, 고객의 클릭 패턴과 구매 이력을 분석하여 이탈 가능성이 높은 고객군을 예측하는 것을 들 수 있다. 


전략적 인사이트란?

분석 결과로부터 도출된 실행 가능한 통찰이다. 이는 단순한 리포트가 아닌, 조직의 목표나 성과 개선에 직접 연결되는 의사결정 정보다. 예를 들어, 예측 결과를 기반으로 이탈 가능 고객에게 쿠폰을 발송하거나 VIP 전환 전략을 수립하는 경우를 들 수 있다.


데이터 분석 프로세스 흐름 

      1. 문제 정의
      2. 데이터 수집 및 정제
      3. 탐색적 분석
      4. 모델링 및 예측
      5. 인사이트 도출 및 전략 수립


시험 기출 포인트 및 실전 팁

출제 유형:

  • “데이터 사이언스의 정의로 가장 적절한 것은?”
  • “전략적 인사이트에 대한 설명으로 옳은 것을 고르시오.”

기출 예시:

  • “데이터 사이언스는 분석을 통해 의사결정에 필요한 인사이트를 도출하는 과정이다.” (O)
  • “전략적 인사이트는 분석 결과로부터 실용적인 판단을 도출하는 것이다.” (O)

혼동 유도 오답 예시:

  • “데이터 사이언스는 단순 통계 계산을 의미한다.” (X)
  • “인사이트는 데이터를 수집하는 과정이다.” (X)
  • “전략적 인사이트는 정성적 데이터와 관련이 없다.” (X)


정리

구분  의미  예시
데이터 사이언스 데이터 기반 문제 해결 프로세스 전체 고객 행동 분석, 이탈 예측, 트렌드 분석 등
전략적 인사이트 분석 결과로부터 도출된 실행 가능한 판단 A/B 테스트 결과로 특정 디자인이 전환율이 높음 → 적용 결정

 

9. 암묵지와 형식지

 

데이터 분석은 단순히 수치를 해석하는 데서 그치지 않는다. 조직 내 지식이 어떻게 표현되고 전파되는가는 분석 결과의 활용도를 결정짓는 중요한 요소이다. 암묵지(Tacit Knowledge)와 형식지(Explicit Knowledge)의 개념 구분뿐 아니라, SECI 모델을 통한 지식 변환 프로세스까지 문제로 출제된다.


암묵지 (Tacit Knowledge)

암묵지는 경험, 직감, 통찰처럼 문서화되기 어려운 지식이다. 이 지식은 보통 개인의 축적된 경험에 의해 형성되며, 말이나 글로 표현하기 어렵고 전수에도 시간이 필요하다. 예를 들면, 외과의사의 손의 감각, 고객 클레임 대응 노하우, 장인의 숙련된 기술 등이 있다.
 

핵심 특징

  • 개인 경험 기반
  • 언어화·문서화가 어렵다
  • 실습, 관찰, 전수 등을 통해 공유됨


형식지 (Explicit Knowledge)

형식지는 언어나 기호로 표현 가능하며, 쉽게 문서화되고 공유 가능한 지식이다. 대부분의 공식 문서, 매뉴얼, 데이터베이스 등은 형식지에 해당한다. 형식지의 예로 매뉴얼, 통계 보고서, 분석 프로세스 문서 등이 있다. 
 

핵심 특징

      • 객관적, 구조화 가능
      • 전달과 전사적 공유가 용이
      • 반복적 활용 및 표준화 가능


SECI 모델 – 지식 창출의 4단계

SECI 모델(Socialization, Externalization, Combination, Internalization) 은 Nonaka & Takeuchi가 제안한 지식 전환 구조로, 암묵지와 형식지가 어떻게 상호 작용하여 조직 내에서 지식이 축적·공유·창출되는지를 설명한다. ADsP 시험에서 이 모델의 4단계 용어와 전환 방향은 실제 출제된 바 있다.

단계  전환 방향  설명 및 예시
사회화(Socialization) 암묵지 → 암묵지 경험 공유를 통한 전수 (예: 도제 방식, 관찰, 멘토링)
표출화( Externalization) 암묵지 → 형식지 직관이나 감각을 문서화 (예: 숙련자의 감각을 매뉴얼로 기록)
결합( Combination) 형식지 → 형식지 여러 문서를 통합·구조화 (예: 부서별 문서 통합 보고서 작성)
내면화(Internalization) 형식지 → 암묵지 문서를 학습하고 체득 (예: 매뉴얼을 읽고 실제 상황에 적용)

 

시험 기출 포인트 및 실전 팁

기출 유형:

  • “다음 중 SECI 모델의 요소가 아닌 것은?”
  • “암묵지가 형식지로 변환되는 과정은?”
  • “암묵지의 예로 적절한 것은?”

출제 보기 예시:

  • “표출화는 암묵지를 형식지로 전환하는 것이다.” (O)
  • “결합은 여러 형식지를 통합하여 새로운 형식지로 만드는 과정이다.” (O)

혼동 유도 오답 보기:

  • “분석화(Analysis)”
  • “정제화(Purification)”
  • “암묵지는 문서화를 통해 직접 전달 가능하다.” (X)


정리 

구분  정의  예시
암묵지 경험 기반, 표현 어려움 감각, 노하우, 직감
형식지 문서화 가능, 표현 명확 매뉴얼, 표준 절차 문서
SECI 모델 지식 전환의 4단계 구조 사회화, 표출화, 결합, 내면화

 

10. 개인정보 보호법 및 법적 요구사항

 

데이터 분석이 활성화되면서 동시에 중요해진 것이 바로 데이터의 윤리적, 법적 활용이다. 특히 개인정보 보호법은 ADsP 1과목에서 자주 출제되는 주제이며, 수험자가 법적 기본 개념을 정확히 이해하고 있어야 데이터의 적법한 활용과 보호 기준을 명확히 판단할 수 있다.


개인정보 보호법의 목적

개인정보 보호법은 개인의 권익을 보호하고, 개인정보가 무분별하게 수집·이용·유출되지 않도록 규제하는 법이다. 이 법은 공공기관과 민간 기업을 포함한 모든 데이터 처리 주체에게 적용되며, 데이터 수집, 저장, 가공, 분석, 파기에 이르는 전 과정에 걸쳐 명확한 동의와 통제 권한을 요구한다.


개인정보의 정의

법적으로 개인정보란 살아 있는 개인을 식별할 수 있는 정보를 말한다. 예: 이름, 주민등록번호, 휴대전화 번호, 이메일 주소, 생체 정보 등. 또한, 다른 정보와 결합하여 개인을 식별할 수 있는 정보도 포함된다.


민감정보와 가명정보

      • 민감정보: 인종, 정치 성향, 건강, 종교 등 개인의 사생활에 중대한 영향을 미칠 수 있는 정보로, 특별한 보호 대상이다.
      • 가명정보: 특정 개인을 식별할 수 없도록 처리한 정보로, 통계·연구·공익적 기록 보존 목적에 한해 추가 동의 없이 활용 가능하다. 단, 재식별 방지 조치가 필수다.


법적 책임과 제재

개인정보 유출 또는 법 위반 시 과징금 부과, 형사처벌, 행정제재가 적용될 수 있다. 따라서 데이터 분석자는 기술적 보안뿐 아니라 법적 기준까지 반드시 고려해야 한다.
 

기출 포인트 및 시험 대비 팁

“다음 중 개인정보에 해당하지 않는 것은?”, “가명정보의 설명으로 옳지 않은 것은?” 등의 정의형, 개념 이해형 문제가 반복적으로 출제된다.

자주 나오는 보기 지문 표현:

  • “개인을 식별할 수 있는 정보”
  • “추가 정보와 결합하여 식별 가능한 경우 포함”
  • “가명처리된 정보는 연구 목적에 활용 가능”
  • “민감정보는 특별한 보호 조치가 필요함”

주의할 오답 보기:

      • “가명정보는 자유롭게 상업적 목적에 활용 가능하다.”(X)
      • “민감정보는 일반 정보보다 수집이 쉬운 편이다.”(X)


정리

      • 법적 요구사항은 데이터 분석의 기본 조건
      • 개인정보 = 식별 가능성
      • 가명정보 = 비식별화, 제한적 활용 가능
      • 민감정보 = 보호 수준 강화 필요

 
1과목 요약 및 시험 준비 팁

 

이제까지 ADsP 1과목인 ‘데이터의 이해’를 살펴보며 출제 우선순위 기반으로 주요 개념을 정리하였다. 1과목은 데이터의 개념, 유형, 구조, 가치 흐름에 대한 이해력을 평가한다. 정성/정량 데이터, 암묵지/형식지, DIKW 구조, 데이터 품질, 개인정보 구분 등은 반복 출제되는 핵심 영역이다. 추천하는 학습 방법은 기출문제를 분석해 자주 출제되는 개념 위주로 학습하는 것이다. ADsP시험은 각 과목의 특성과 난이도에 따라 전략적인 접근이 필요하다. 

전체 시험 준비 학습 전략

    • 기출문제 3회 이상 반복 풀이
    • 자주 혼동되는 개념 비교와 오답 노트 정리 (예: 정형 vs 비정형, 암묵지 vs 형식지)
    • 요약노트 작성 (핵심 개념 요약)