데이터 블로그 챌린지 Day 11

Data Engineering 과 Data Science

결론

데이터 엔지니어링은 데이터 과학자가 사용할 수 있는 데이터를 만들어 주는 것이다.

Data Engineering, Data Science

Where does data engineering fit in with data science? There’s some debate, with some arguing data engineering is a subdiscipline of data science. We believe data engineering is separate from data science and analytics. They complement each other, but they are distinctly different. Data engineering sits upstream from data science (Figure 1-4), meaning data engineers provide the inputs used by data scientists (downstream from data engineering), who convert these inputs into something useful.

데이터 엔지니어링은 데이터 과학과 무슨 관련이 있나요? 데이터 엔지니어링이 데이터 과학 분야의 하위 분야라고 주장하는 논쟁도 있습니다. 우리는 데이터 엔지니어링과 데이터 과학과 분석은 별개라고 생각합니다. 그것들은 서로 보완하지만 분명히 다릅니다. 데이터 엔지니어링은 데이터 과학의 upstream 에 위치합니다. 즉 데이터 엔지니어는 이러한 인풋을 유용하게 변환하여 데이터 과학자(데이터 엔지니어링의 downstream) 가 사용할 입력을 제공합니다.

Joe Reis, Matt Housley. 『Fundamentals of Data Engineering』

upstream 이란 석유 시추로 예를 들면 자원 탐사, 시추, 생산까지 의미합니다.

이에 반하여 downstream 은 가공하고 상품화하는 것을 의미합니다.

11-1.png


데이터 블로그 챌린지 Day 10

카드 내역 점검하기

데이터 블로그 챌린지 Day 12

맬서스 모델과 로지스틱 함수

NCloud LB & SourcePipeline 구축하기
tech collection 서비스 성능 개선하기
Selenium 복권 구매 자동화 만들어보기
디자인 패턴
책 리뷰
블로그 챌린지