Data Privacy?

Privacy란 개인의 사생활이나 집안의 사사로운 일 또는, 그것이 남에게나 사회에 알려지지 않으며 간섭받지 않는 권리.

왜 데이터의 privacy가 중요한가?

  • 범죄에 사용 될 가능성이 있고 사용자를 교란 및 괴롭힐 수 도 있다
  • 개인정보가 유출되면 원하지 않는 광고들을 많이 받을 수 있다
  • 개인의 사생활을 추적할 수 있어, 언제나 추적 감시 대상이 될 수 있다
  • 또한 기업의 중요 문서 등이 탈취되면 기업에 기술 및 가치를 탈취 당할 수 있다

http vs https

http(HyperText Transfer Protorcol)

  • HTML 문서와 같은 리소스들을 가져올 수 있도록 해주는 프로토콜이다. 1
  • 모든 데이터 교환의 기초
  • 클라이언트-서버 프로토콜(통신규약)
  • 텍스트 기반의 통신 규약으로 인터넷에서 데이터를 주고받을 수 있는 프로토콜이다. image

https(HyperText Transfer Protocol over Secure Socket Layer )

  • http 기반에 SSL을 추가 보완한 프로토콜

    image

http/https 비교

차이점 http https 설명
보안성 낮음 높음 상대적으로 https가 보안성 측면에서 높다
사용계층 응용계층 전송계층과 응용계층 사이 SSL/TLS 가 중간에 위치하여 한번더 체크를 한다
사용포트 80 443 443 포트로 먼저 certificate 을 확인 후 통신한다
전달데이터 암호화 No Yes https는 암호화 되서 전송된다
속도 빠름 상대적으로 느림 상대적으로http보다 https가 더 느리다(Handshake때문에)

TLS/SSL

TLS(Transport Layer Security)

  • TLS 특징
    • 클라이언트와 서버의 암호화 정보 교환을 목적을 두고 1999년 개발되었다
    • TLS는 웹뿐만아니라 이메일, 메세지, VoIP 등 에 쓰인다
    • 최신버전인 TLS 1.3 2018년에 나왔다
    • 기존 버전의 암호화 프로토콜인 SSL을 포함하고 있다
    • 대칭키 암호2을 사용하여 암호화한다

SSL(Secure Socket Layer)

SSL or Secure Sockets Layer 암호화 기반의 인터넷 보안 프로토콜이다.

  • SSL 특징
    • 1995년 네스케이프사에서 처음 개발되었다
    • 개발 목적은 프라이버시 보장, 인증, 데이터 진실성을 위해 개발되었다
    • 암호화 알고리즘을 사용하여 데이터를 암호화함
  • SSL 사용방법
    • CA(Certificate authorities)에서 인증서를 발급
    • 서버에 설치 후 웹서버 설정

TLS vs SSL

TLS는 SSL 3.0을 계승하는 암호화 프로토콜이다 즉 앞으로 TLS == SSL 라고 생각하면 된다

SSL 암호화 방식

  • 대칭키 방식
    • 해시 테이블 처럼 키가 있어야 암호화를 할 수 있다
    • 암호화 할때 1234이라는 암호로 키를 사용했다면 1234이 있어야 복호화 할 수 있다
    • 대칭키를 공유할때 위험이 노출되기 때문에 매우 위험하다
  • 비대칭 키 방식
    • 공개키(public key)와 개인키(private key)를 가진다
    • 공개키로 암호화 하는 경우와 개인키로 암호화 하는것으로 구분
    • 암호화할때의 키와 복호화할 때의 키 값이 다르면 비대칭 키라고 한다

CA에서 발급받은 인증서는 제 3자가 소유하고있는 사이트를 보장해준다는 의미 즉 데이터가 안전하게 암호화 되어 전송되고 있다는 뜻이다

구글에서는 공식적으로 Search eninge ranking 이라는 항목으로 https 암호화를 적용시 상위 검색순위에 들어가게 됨으로 꼭 https를 적용시키자 SEO 체크리스트 공식문서

image

인증서(Certificate)

  • CA(Certificate authorities) 기관의 종류
    • 무료
      • Let's Encrypt
      • WoSign
      • AWS Certificate
      • CloudFlare SSL
    • 유료
      • Verisign
      • GoDaddy
      • GlobalSign
      • Comodo(Sectigo)
      • Thawte
      • GeoTrust
      • DigiCert
    • 실제로 적용된 사례

      image

      image

      각자브라우져에 자물쇠 부분을 클릭해서 Certificate 부분을 보면 도메인의 소유자의 대한 내용이 상세히 나온다 즉 SSL이 적용된 사례라고 볼 수 있다

인증서 구매 및 셋팅

  • CA 사이트에서 구매 후

    image

  • 도메인 내용 입력장면

    image

  • 생성된 private key

    image

  • cludeflare.com의 certificate의 정보
    • 도메인 네임이 인증되어있고 어떤 내용으로 발생되었는지
    • 어떤 사람, 기관, 기종에서 발생되었는지
    • 발급한 인증기관
    • 인증기관의 디지털 서명
    • 관련된 서브 도메인들
    • 인증날짜
    • 만료날짜
    • Public 키

    image

  • 인증기관의 등록 절차가 모두 완료 후 아래와 같은 4가지 키 와 인증서를 받게 된다
    • ssl.key : 서버쪽 비공개키
    • ssl.crt : 디지털 인증서
    • ca.pem : ROOT CA 인증서
    • sub.class1.server.ca.pem : 중계자 인증서
  • Apache 또는 Nginx 또는 Node.js 에 설치 … 생략[나중에…]

SSL 작동원리

  • 작동원리
    1. 핸드쉐이크를 통한 서버 인증 확인 절차
    2. 절차 완료 후 클라이언트와 서버 둘다 세션 획득 성공
    3. 대칭 암호화 데이터 전송(세션 키를 이용해서)
  • 알아야할 개념
    1. 대칭 키 알고리즘(Symmetric-key algorithm)
    2. 비 대칭 키 암호
    3. 인증서(certificate)
    4. CA (Certificate authority)
    5. 핸드쉐이크(3way Handshake)
    6. 암호화 알고리즘 (RSA 기타 등등…)

SSL Handshake를 통한 서버 인증 확인 절차

  • SSL Handshake의 전체적인 흐름도

    image

  • SSL Handshake RSA key 교환방식 알고리즘을 사용한 순서도표

    image

세션(데이터 전송 준비완료)

  • 마지막으로 대칭 키가 준비가 완료
  • 세션키를 가지고 암호화 한다음 데이터를 전송

7 가지 Man-in-the-middle attack

  • IP spoofing
    • 공격자가 IP 주소를 변형시켜 일반적인 클라이언트인척 속인 후 서버에 접속해서 추적을 피하는 해킹 기법이다
  • DNS spoofing
    • 공격자는 금융기관등의 사이트와 동일한 사이트를 만들어 강제로 가짜 사이트로 이동하게 하는 방식이다
  • HTTPS spoofing
    • 링크주소는 https로 되어 있지만 사실 링크된 사이트는 http로 된 사이트로 연결되어 클라이언트의 정보를 뺴는 방식
  • SSL hijacking
    • http로 된 URL에 접속할때 공격자가 설정해 놓은 SSL 서버에 접속을 유도하여 클라이언트와 서버 중간에서 데이터를 가로채는 공격방식
  • Email hijacking
    • 금융기관을 사칭한 사이트로 접속을 유도하여 사용자 정보를 빼는 방식
  • Wi-fi eavesdropping
    • 공공 wifi를 사용하면 공격자가 router에 연결된 디바이스의 패킷 정보를 모니터 할 수 있다.
  • Stealing browser cookies
    • 쿠키 탈취는 클라이언트 내부에 저장된 개인정보가 탈취되는 것을 말한다

https 로 미리 암호화된 상태로 연결되었다면 데이터가 중간에 탈취되더라도 세션키로 암호화 되어 있어서 좀더 안전할 수가 있다.

단 좀비 컴퓨터를 이용해 여러대의 컴퓨터가 한곳을 집중적으로 공격하는 DDOS 공격에는 https는 도움이 안된다.

결론

랜선을 타고 다니는 모든 데이터는 안전하지 않다

다만 이중 삼중으로 암호화시 좀더 보안성이 향상 된다 따라서 https는 선택이 아닌 필수

참고사이트

주석

  1. 프로토콜은 컴퓨터 내부에서, 또는 컴퓨터 사이에서 데이터의 교환 방식을 정의하는 규칙 체계이다. 기기 간 통신은 교환되는 데이터의 형식에 대해 상호 합의를 요구한다. 이런 형식을 정의하는 규칙의 집합을 프로토콜이라고 한다. 

  2. 대칭키 암호(symmetric-key algorithm) 암호화 알고리즘의 한 종류로, 암호화와 복호화에 같은 암호 키를 쓰는 알고리즘을 의마한다.