데이터 사이언스 : 빅데이터 개론 커리큘럼 – 경희사이버대학교 모바일융합학과 고영혁 교수 4.93/5 (14)

2015년 1학기부터 경희사이버대학교 모바일융합학과겸임교수로서 데이터 사이언스 관련 과목들을 가르치게 되었습니다. 앞으로 진행될 데이터 사이언스 수업의 시작으로서 학교에서 처음 만들어진 과목이 ‘빅데이터 개론’입니다. 이미 과목 이름이 정해져 있어서 현재는 변경할 수 없지만 사실상 ‘데이터 사이언스 개론’으로 보시면 됩니다.

학과의 동의 하에 경희사이버대학교 학생들이 조회할 수 있는 빅데이터 개론 커리큘럼 (강의 계획서)를 공개합니다. 읽어보시면 아시겠지만, 선수 과목이 필요 없이 누구나가 데이터 사이언스 분야에 대해 살펴보고 이후의 진로를 결정하고 계속적으로 공부하는 계획을 세우는 데에 도움이 되는 것이 목적인 쉽고 재미있는 말랑말랑한 강의입니다.

경희사이버대학교 모바일융합학과 빅데이터 개론 강의

경희사이버대학교 모바일융합학과 빅데이터 개론 강의


 – 데이터 사이언스 : 빅데이터 개론 커리큘럼 –

1. 수업 목표

1-1. 핵심 목표

본격적으로 시작된 빅데이터 시대에서 경쟁력을 확보하고 계속 성장하기 위해 필요한, 데이터 사이언스에 대해 기본적으로 이해하고 관련 지식을 습득함으로써, 이후 구체적인 학업 및 경력 설계를 가능하게 합니다.

1-2. 세부 목표

  • 빅데이터와 데이터 사이언스가 무엇이고 왜 필요한지에 대한 지식을 습득합니다.
  • 데이터 사이언티스트들은 빅데이터로 어떤 종류의 일들을 어떻게 하는지 설명할 수 있습니다.
  • 데이터 사이언티스트가 되려면 앞으로 어떤 역량(학업/경력 포함)을 어떻게 길러야 하는지 알고 실천의 토대를 마련할 수 있습니다.
  • 데이터 사이언스를 하기 위한 여러 가지의 도구 중 초보자들도 쉽게 사용할 수 있지만 강력한 도구 몇가지를 직접 사용해 보고 스스로 활용할 수 있습니다.

2. 수업 운영 전략

  • 수업은 동영상 강의 및 온라인에서 진행되는 토론과 Q&A가 중심이 됩니다.
  • 기본적인 지식을 습득하기 위해 주요 내용이 요약된 강의를 제공합니다.
  • 강의에서 제시된 토론 주제에 대한 토론과 자유로운 Q&A 활동을 장려합니다.
  • 선수 과목은 필요 없으며, 빅데이터와 데이터사이언스에 대해 전혀 모르는 학생이 들어도 문제 없이 기본 토대를 만들 수 있습니다.

2-1. 강의

동영상으로 제공되는 강의는 크게 두 가지 포맷으로 진행됩니다. 하나는 슬라이드 형태로 요약 제공된 정보와 지식을 교수가 구체적으로 설명하면서 적절한 강조와 보강 내용을 필기하듯이 슬라이드 상에 직접 추가합니다. 다른 포맷은 데이터 분석 도구를 직접 사용하여 데이터를 처리하고 분석하는 화면을 그대로 보여주며 설명합니다. 추후 영상을 보면서 그대로 따라서 실습할 수 있습니다. 한편, 강의에는 토론방에서 토론된 내용에 대한 요약과 인사이트도 포함됩니다.

2-2. 토론

각 주차는 두 개의 강의로 구성되는데, 첫번째 강의를 시작할 때 이번 주차의 두 강의에 대한 토론의 키워드를 제시하고, 두번째 강의를 시작할 때 보다 구체적인 토론 화두를 제시합니다. 즉, 키워드를 보고 첫번째 강의를 키워드에 맞추어서 집중해 들은 다음에 두번째 강의에서 토론 화두를 보고 강의를 마저 들은 다음에 토론에 참여하면 됩니다. 토론은 토론방에서 이루어지며, 학생만이 아니라 교수도 토론에 참여합니다.

2-3. Q&A

수업 내용과 관련된 어떤 질문이든 환영합니다. 게시판을 통해 자유로운 질문과 답변 활동이 이루어지며, 질문에 대한 답변은 교수 뿐만 아니라 다른 학생들도 마음대로 할 수 있습니다. 심지어 교수도 질문을 할 수 있습니다. 질문과 답변의 활성화를 통해 매주차 수업에서 제시된 토론과는 별개로 자유로운 토론이 이루어지는 것을 적극 장려합니다.

3. 평가 설명

이 강의의 평가는 리포트, 참여율, 중간고사, 진도 및 출석을 종합적으로 반영하여 진행합니다.

정해진 조건에서의 시험을 통해 습득한 기본적인 최소한의 지식을 공평하게 테스트하고, 자유롭게 주위 리소스를 활용하여 최대한의 역량을 발휘할 수 있는 기회를 리포트를 통해 제공합니다. 중간고사보다 리포트에 가중치를 높게 책정한 이유를 잘 생각해 보세요.

한편, 참여율의 비중을 높게 책정했는데, 수업목표에서 언급한 것처럼 이 강의를 통해 학생 여러분이 앞으로 이 분야에 대해 어떤 커리어를 설계하고 어떻게 공부해 나가는 것이 좋을지 탐색하기 위해서는, 토론과 질문/답변이 필수적이기 때문입니다.

각각에 대한 세부 설명은 다음과 같습니다.

3-1. 리포트 (30%)

강의에서 다룬 내용을 활용하여, 특정한 데이터에 대해서 원하는 도구를 통해 분석하여 의미있는 결론을 도출하는 경험을 각자 해보고 그 과정과 결과를 리포트로 정리하여 제출합니다. 개론이기 때문에 사용 도구나 분석 기법의 난이도를 평가 기준으로 삼지 않고, 데이터를 바라보는 관점, 데이터를 분석해나가는 과정, 도출한 의미의 가치를 중심으로 평가합니다. 이 항목들 모두 수업만 잘 따라오면 무리 없이 해낼 수 있습니다.

3-2. 참여율 (30% = 토론 15% + Q&A 15%)

수업운영 전략에서 말씀드렸듯이, 이 강의는 토론과 Q&A 참여가 매우 중요합니다. 토론방과 게시판에서의 활동을 토대로 평가가 이루어집니다. 토론과 Q&A의 운영 방식은 운영 전략에서 설명드렸고, 평가는 기본적으로 게시한 글의 개수를 토대로 하지만 교수가 봤을 때 지나치게 성의 없고 개수를 채우기 위한 것 외에는 의미가 전혀 없다고 판단되는 글(의견/질문/답변)은 개수를 인정하지 않겠습니다. 이 참여 활동의 평가는 상/중/하 의 세 등급으로 나누어지며 글의 개수 기준 15개 이상 상(100점), 7~14개 중(70점), 6개 이하 하(40점)으로 배점됩니다.

3-3. 중간고사 (25%)

중간고사는 중간고사 때까지 학습한 내용 및 토론한 내용들 중에서 몇 가지 문제가 단답형 및 논술형이 적절하게 혼합된 형태로 출제됩니다. 단답형과 논술형의 배점은 상황에 따라 달라질 수 있습니다. 논술형 문제의 답은 수업을 통해 터득한 내용을 얼마나 충실하고 적절하게 활용했는지를 중심으로 평가합니다.

3-4. 출석진도 (15% = 출석 5% + 진도 10%)

개론이기 때문에 강의 한 강 한 강에 데이터 사이언스에 대해서 제대로 짚고 넘어가야 할 서로 성격이 다른 내용들을 핵심적으로 다루게 됩니다. 따라서 각각의 강의를 충실하게 듣는 것이 개론으로서 전체적인 그림을 이해하는 데에 중요하므로, 출석과 진도를 의미 있는 평가 항목으로 설정했습니다. 특히 한 강의에 대한 토론/질문의 참여 활동이 다음 강의에 일부분 이어지는 형태를 띠기 때문에 출석과 진도를 잘 챙기시길 바랍니다.

4. 교재

  • 별도의 교재를 구입할 필요 없이, 강의 노트만으로도 수강 가능합니다. 이하는 참고할 수 있는 부교재입니다.
  • 레이철 슈트, 캐시 오닐. 데이터과학 입문 (2014). 한빛미디어
  • 한국데이터베이스진흥원. 데이터 분석 전문가 가이드 (2014). 한국데이터베이스진흥원.
  • 포스터 프로보스트,톰 포셋. 비즈니스를 위한 데이터 과학 (2014). 한빛미디어

5. 학습 관련 사이트

6. 주차별 강의 주제

6-1. 1주차 : 강의 소개 및 기본 개념 소개

  • 1강 – 빅데이터 개론 강의 소개
  • 2강 – 데이터, 빅데이터, 데이터 사이언스

6-2. 2주차 : 데이터 사이언스의 필요성

  • 1강 – 시대의 트렌드와 데이터 사이언스
  • 2강 – 데이터 사이언티스트에 대한 실수요 상황

6-3. 3주차 : 데이터 사이언스의 진행 절차

  • 1강 – 데이터 수집 / 데이터 처리&정제 / 데이터 탐색
  • 2강 – 모델 분석 / 커뮤니케이션 / 데이터 제품

6-4. 4주차 : 데이터 – 정보 – 지식 – 지혜

  • 1강 – DIKW 프레임
  • 2강 – Visual Insight Process (인사이트 시각화 프로세스)

6-5. 5주차 : 데이터 사이언스 관련 분야 소개

  • 1강 – 인포그래픽
  • 2강 – 데이터 저널리즘

6-6. 6주차 : 빅데이터 & 데이터 사이언스의 활용 사례

  • 1강 – 헬스케어 / 금융
  • 2강 – 정보산업 / 공공
  • 사례 분야는 상황에 따라 변동될 수 있음

6-7. 7주차 : 데이터 사이언스 몸에 와닿게 하기

  • 1강 – 대표적인 도구 R의 소개와 실습
  • 2강 – 데이터 사이언티스트 커리어 한국인 사례 인터뷰1 (한국에서 일하는)

6-8. 8주차 : 중간고사

6-9. 9주차 : 데이터 사이언티스트의 핵심 역량

  • 1강 – 수학 / 통계
  • 2강 – 코딩 / 머신러닝(기계학습)

6-10. 10주차 : 데이터 사이언티스트의 핵심 역량

  • 1강 – 하둡(Hadoop) / 분야 전문성
  • 2강 – 시각화 / 커뮤니케이션

6-11. 11주차 : 데이터 사이언티스트로서의 정신과 윤리

  • 1강 – 데이터 사이언티스트의 정신과 성향
  • 2강 – 데이터 사이언스의 윤리 문제

6-12. 12주차 : 데이터 사이언스 도구 소개와 실습 – 통합 도구

  • 1강 – Tableau 소개와 기본 실습
  • 2강 – Watson Analytics 소개와 기본 실습

6-13. 13주차 : 데이터 사이언스 도구 소개와 실습 – 특화 및 범용 도구

  • 1강 – Gephi 를 이용한 네트워크 분석 기본 실습
  • 2강 – 범용 도구인 Excel 과 Google Spreadsheet 의 활용 실습

6-14. 14주차 : 데이터 사이언티스트 커리어 사례

  • 1강 – 외국인 사례 1, 2, 3
  • 2강 – 한국인 사례 인터뷰 2 (외국에서 일하는)

6-15. 15주차 : 기말고사 (리포트로 진행)

 

< 읽어주셔서 감사합니다. 이왕이면 평가도 부탁 드립니다! >

Gonnected !!

고 영혁

CEO & Founder at Gonnector
* Gonnector - Go, Connect, Create Values
* 제공 서비스 - 컨설팅, 평가, 교육
* 전문 분야 - 데이터 사이언스, 그로스 해킹, 서비스 디자인, 사업개발, UX, 스타트업, 커리어
* 경희사이버대학교 모바일융합학과 겸임교수 (데이터 사이언스)
* 아카데미X 공동창업자 / 푸드테크 협동조합 어메이징브로 이사 / PAG&파트너스 부대표
* 전) NHN 콘텐츠 전략팀장 / eBay Gmarket 금융사업 파트장
* 6권의 책 저자 - 데이터 사이언스, 그로스 해킹, 커리어, ICT 트렌드 관련
Gonnected !!

CC BY-NC-ND 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

2 thoughts on “데이터 사이언스 : 빅데이터 개론 커리큘럼 – 경희사이버대학교 모바일융합학과 고영혁 교수

  1. 데이어 사이언스 제대로 붙잡고 공부해 보고 싶은데 관련 사이트 링크와 전체 강의 구성이 독학하는 데에도 좋은 참고가 될 것 같아요. 강의 자료도 공개된다면 정말 좋을 것 같은데 무리겠죠? ^^

    5/5

    5/5

    • 최정우님, 피드백 주셔서 감사드립니다.

      안타깝게도 이 강의는 경희사이버대학교의 학생들에게만 제공되다보니 제가 임의로 강의자료를 공개할 수는 없습니다.

      하지만, 이 강의를 토대로 확장되고 강화된 내용을 담을 ‘데이터 사이언스 개론’ 책의 집필을 시작했습니다. 아마도 2015년 하반기에 출간될 것 같은데, 추후에 그 책을 참고하시면 좋을 것 같습니다.

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

*

다음의 HTML 태그와 속성을 사용할 수 있습니다: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>