개발도서 읽기/HTTP 완벽 가이드

[1. HTTP: 웹의 기초] 1장) HTTP 개관

까연 2021. 4. 10. 17:45

HTTP는 전 세계의 웹 서버로부터 대량의 정보를 빠르고, 간편하고, 신뢰성있는 데이터 전송 프로토콜을 사용하여 정확하게 전송한다.

이러한 신뢰성 있는 전송 덕분에 개발자는 인터넷의 결함이나 약점에 대한 걱정 없이 애플리케이션 고유의 기능을 구현하는 데 집중할 수 있다.

 

- 웹 클라이언트와 서버

웹 클라이언트와 서버는 월드 와이드 웹의 기본 요소이다.

 

웹 서버

인터넷의 데이터를 저장하고, 클라이언트가 요청한 데이터를 제공한다.

클라이언트(웹 브라우저)

서버에게 HTTP 객체를 요청하고 사용자의 화면에 보여준다.

 

- 리소스

웹 서버는 웹 리소스를 관리하고 제공한다.

 

웹 리소스: 웹 서버 파일 시스템, 프로그램 등의 콘텐츠 소스

 

* MIME(다목적 인터넷 메일 확장) 타입

: 각기 다른 전자메일 시스템 사이에서 메시지가 오갈 때 겪는 문제점을 해결하기 위해 설계되었다. 웹에서도 모든 HTTP 객체 데이터에 MIME 타입을 붙인다.

 

- 형식

: 사선(/)으로 구분된 주 타입과 부 타입으로 이루어진 문자열 라벨

ex) text/html : HTML로 작성된 텍스트 문서, image/jpeg : 이미지 형식 ...

 

* URI (통합 자원 식별자)

: 인터넷의 우편물 주소 같은 것으로, 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.

 

- URI의 종류

  • URL (통합 자원 지시자) : 리소스 식별자의 가장 흔한 형태. 특정 서버의 한 리소스에 대한 구체적인 위치 서술. 대부분의 URI는 URL이다.
    • URL의 표준 포맷 : 리소스에 접근하기 위해 사용되는 프로토콜 서술 (보통 HTTP 프로토콜(http://)) , 서버의 인터넷 주소 제공, 웹 서버의 리소스 
  • URN (유니폼 리소스 이름)
    • 리소스의 위치에 영향 받지 않는 유일무이한 이름 역할. 여러 종류의 네트워크 접속 프로토콜로 접근해도 문제없이 동작한다.

 

- 트랜잭션

: 요청 명령과 응답 결과로 구성되어 있으며, HTTP 메시지를 사용하여 주고 받는다.

 

  • 메서드: 모든 요청 메시지는 한 개의 메서드를 갖는다.
    • GET, PUT, DELETE, POST, HEAD ...
  • 상태 코드: 모든 응답 메시지는 상태 코드와 함께 반환된다.
    • 200: 성공, 302: 다른 곳에서 리소스를 가져가라, 404: 리소스를 찾을 수 없음
  • 웹 브라우저는 웹 페이지를 가져올 때 대량의 HTTP 트랜잭션을 수행한다.

 

- 메시지

: HTTP 메시지는 일반 텍스트로 구성되어 있으며, 요청 메시지와 응답 메시지가 있다.

  • HTTP 메시지 구조
    • 시작줄: 어떤 요청인지(요청) / 무슨 일이 일어났는지(응답) 나타냄
    • 헤더: 0개 이상의 헤더 필드가 이어짐.
    • 본문: 메시지의 본문이 들어감. 요청의 본문은 웹 서버로 데이터를 실어 보내고, 응답의 본문은 클라이언트로 데이터를 반환한다.

 

- TCP 커넥션

HTTP는 애플리케이션 계층 프로토콜이라, 네트워크 통신에 대해선 신경쓰지 않는다. 통신에 대해선 TCP/IP에 맡긴다.

 

- TCP 전송 특징

  • 오류 없는 데이터 전송
  • 순서에 맞는 전달
  • 조각나지 않는 데이터 스트림

- TCP/IP

: TCP와 IP가 층을 이루는, 패킷 교환 네트워크 프로토콜의 집합으로 어떤 종류의 컴퓨터든 서로 신뢰성 있는 의사소통을 할 수 있게 해준다.

 

- HTTP 네트워크 프로토콜 스택

애플리케이션 계층 HTTP
전송 계층 TCP
네트워크 계층 IP
데이터 링크 계층 네트워크를 위한 링크 인터페이스
물리 계층 네트워크 하드웨어

 

- 접속, IP 주소, 포트번호

: 클라이언트가 서버에 메시지를 전송하기 위해, IP주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야 한다.

IP주소와 포트번호는 URL을 이용하여 알 수 있다.

보통 IP주소 대신 도메인 이름(호스트 명)을 사용한다. 도메인 이름은 DNS 장치를 통해 쉽게 변환할 수 있다.

  • DNS(Domain Name Service) : 도메인 이름과 IP 주소를 서로 변환하는 역할

URL에서 포트 번호가 없는 경우, 기본 값은 80이다.

 

- TCP/IP로 통신하는 과정

  1. 서버의 URL에서 호스트 명 추출
  2. 호스트 명을 IP로 변환
  3. 포트번호 추출
  4. 웹 서버와 TCP 커넥션
  5. 서버에 HTTP 요청을 보낸다.
  6. 서버는 HTTP 응답을 돌려준다.
  7. 커넥션이 닫히면, 문서를 보여준다.

- 프로토콜 버전

  • HTTP/0.9 : GET 메서드만 지원, 멀티미디어 콘텐츠에 대한 타입이나 헤더, 버전 번호는 지원하지 않음
  • HTTP/1.0 : 헤더, 추가 메서드, 멀티미디어 객체 처리 추가
  • HTTP/1.0+
  • HTTP/1.1 : 현재 HTTP 버전
  • HTTP/2.0 : 설계가 진행 중인 프로토콜

- 웹의 구성요소

프락시

클라이언트와 서버 사이에 위치한 HTTP 중개자

프락시는 주로 보안을 위해 사용되며 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다.

예를 들어 바이러스를 검출하거나 성인 콘텐츠 차단하는 등의 역할을 한다.

 

캐시

많이 찾는 웹페이지를 클라이언트 가까이에 보관하는 HTTP 창고

HTTP는 캐시를 효율적으로 동작하게 하고 캐시된 콘텐츠를 최신 버전으로 유지하면서 개인정보 보호에 대한 많은 기능을 정의한다.

 

게이트웨이

다른 애플리케이션과 연결된 특별한 웹 서버

게이트웨이는 주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다.

 

터널

단순히 HTTP 통신을 전달하기만 하는 특별한 프락시

HTTP터널은 비 HTTP 데이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용된다.

 

에이전트

자동화된 HTTP 요청을 만드는 준지능적 웹클라이언트

에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램이다.

'스파이더'나 '웹로봇'이란 이름을 갖고 있으며, 스파이더는 웹을 돌아다니며 검색엔진 데이터베이스나 가격비교 로봇을 위한 제품 카탈로그 등의 웹 콘텐츠 보관소를 만든다.