본문 바로가기

전공/인공지능

처음 만나는 인공지능 12장 연습문제 풀이

12

 

연습문제

진위 문제

 

1. 데이터 사이언스는 통계 방법만을 사용하여 대량의 데이터를 처리하는 전문 분야다. ( x )

 

2. 데이터 사이언스는 데이터를 다루는 방법론, 프로세스, 알고리즘 등을 다루게 된다.( o )

 

3. 머신러닝을 전혀 이용하지 않고도 데이터 사이언스가 폭넓게 활용될 수 있다.( x )

 

4. SAS는 편리한 연산을 위한 통계적 소프트웨어로서 안정성과 신뢰성을 가지고 있다.( o )

 

5. 데이터 사이언스에서의 분석은 분류, 회귀, 그리고 클러스터링에 의한 경우가 많다.( o )

 

6. 빅데이터는 구매 패턴 분석과 앱에서의 경향 분석 등에 응용될 수 있다.( o )

 

7. 태풍이나 허리케인과 관련된 빅데이터를 활용하여 재해 예방에 활용하고 있다.( o )

 

8. 개인정보보호 문제는 빅데이터의 자료 수집 문제와 거의 관련이 없다.( x )

 

9. 데이터 마이닝은 데이터로부터 정보를 추출하는 일, 패턴들을 발견해 내는 일, 그리고 예

측 모델을 개발하는 등에 중심을 둔다.( o )

 

10. 우리나라에서는 아직까지 데이터 거래소가 별로 필요하지 않다. ( x )

 

단답식/선택식 문제

1. 데이터 사이언스나 빅데이터와 관련된 업무의 전문가를 ( 데이터 과학자 )라 한다.

 

2. 다양한 형태의 정형 또는 비정형 데이터를 많이 모아 놓은 것이 ( 빅데이터 )이다.

 

3. 빅데이터의 3가지 특징 ( 3V )은 크기, 변화의 다양성, ( 속도 )이다.

 

4. ( 데이터마이닝 )은 대규모 데이터 집합으로부터 통계적 규칙이나 패턴을 체계적으로 찾아내거나 캐내는 뜻을 가진 과정이다.

 

5. ( 분류 )란 주어진 많은 데이터 중 비슷한 특성을 가진 것들끼리 분리하는 것이다.

 

6. ( 클러스터링 )이란 데이터의 집합을 유사도에 따라 클러스터들로 나누는 것이다.

 

7. ( 시각화 )란 탐색적 분석의 결과가 나오면 그것을 보기 쉽고 잘 이해할 수 있도록 하는 것이다.

 

8. ( R )은 오픈소스 통계적 프로그래밍 언어인데, 데이터를 분석하고 가시화하는데 도움

을 줄 수 있는 다양한 패키지를 제공한다.

 

9. 데이터 사이언스에 필요한 지식과 기술 중 중요성이 상대적으로 적은 것은? ( 2 )

데이터 수집 기술

컴퓨터 하드웨어 지식

통계처리와 시각화 기술

머신러닝과 관련된 지식과 기술

 

10. 다음 중 데이터 사이언스의 도구 중 가장 관계가 먼 것은? ( 4 )

①.Python

R

 SAS

④ Ruby

 

주관식 문제

1. 데이터 사이언스를 간단하게 정의하시오.

대량의 데이터를 수집, 저장, 분석, 처리하는 여러 분야가 관련된 학문이다.

 

2. 데이터 사이언스는 어떤 분야들의 융합으로 이루어지는지 말하시오.

통계적 수학, 머신러닝, 빅데이터, 비즈니스 등의 융합

 

3. 사용자가 빅데이터를 활용하는 단계를 간단히 나열하시오.

비즈니스 요구사항 확인 -> 필요한 데이터 수집 -> 수집한 데이터 가공 -> 처리한 데이터 분석 및 시각화 하여 이용

 

4. 데이터 사이언스가 비즈니스에 미치는 좋은 효과를 말하시오.

의사 결정 향상, 경영 상 문제 개선, 경영 목표 개선, 미래에 대한 예측

 

5. 데이터 마이닝이 많이 활용되는 기업 관련 업무를 3가지 정도 적으시오.

기업 생산 과정 중 불량률을 감소하기 위한 품질 관리 분야, 패턴 인식 기법을 적용한 의료 진단 분야,

고객의 신용을 평가하는 금융 관리 분야