R

[빅분기 실기대비] 단답형 예상 개념 ①

한번해보즈아 2021. 6. 6. 21:06

이 글은 sqld, adsp, 빅분기 필기, 정보처리기사, 사회조사분석사2급을 취득한 통계학과 졸업생의 입장에서 예상 문제를 기록하는것입니다.

참고로 작년에 들은 교육에서 데이터진흥산업원 관계자분이 빅분기 난이도를 adsp, adp 사이에 맞춘다고 하셔서 주로 adsp, adp 기출위주로 접근할것이며 참고로 지난 필기시험에서 수제비에서 출판한 빅데이터 분석기사 필기책에 해당하는 키워드가 많아서 참고하고 있습니다. 

 

https://m.blog.naver.com/shinikju/222313580144

 

빅데이터 분석 기사 1차 필기 시험 : 문항별 Keyword

국가공인이 아닌 국가에서 직접 운영하는 국가기술자격시험으로 '빅데이터 분석 기사' 시험이 처...

blog.naver.com

 

[출처] 한국데이터진흥산업원 예시문제

여러 명의 사용자들이 컴퓨터에 저장된 많은 자료들을 쉽고 빠르게 조회, 추가, 수정, 삭제할 수 있도록 해주는 소프트웨어는 무엇인가?

: DBMS

 

 

 

1.DIKW 피라미드

 

-Data: 객관적 사실로서 다른데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호

-Information: 가공, 처리하여 데이터 간의 연관 관계와 함께 의미가 도출된 데이터

-Knowledge: 획득된 다양한 정보를 구조화하여 유의미한 정보로 분류하고 일반화시킨 결과물, 정보에 기반해 찾아진 규칙

-Wisdom: 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어

 

2,빅데이터의 특성

 

-규모(Value): 빅데이터 분석 규모에 관련된 특징

-다양성(Variety): 빅데이터 자원 유형에 관련된 특징

-속도(Velocity): 빅데이터 수집,분석,활용 속도에 관련된 특징

-신뢰성(Veracity): 빅데이터의 수집 대상 데이터가 가지는 신뢰에 관련된 특징

-가치(Value): 빅데이터 수집데이터를 통해 얻을 수 있는 가치

 

3.데이터 지식경영 구분

 

-암묵지: 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식

           사회적으로 중요하지만 다른 사람에게 공유되기 어려움

-형식지: 문서나 매뉴얼처럼 형상화된 지식

            전달과 공유가 용이

 

4.스키마

: 데이터베이스에서 자료의 구조, 자료의 표현방법, 자료간의 관계를 형식언어로 정의한 구조

 

5.사회관계망 분석(Social Network Analysis)

: 그룹에 속한 사람들 간의 네트워크 특성과 구조를 분석하고 시각화하는 분석기법

 

6.클라우드 컴퓨팅

: 클라우드를 통해 다수의 사용자들에게 가상화된 컴퓨터의 시스템 리소스를 요구하는 즉시 서비스로 제공하는 컴퓨팅 기술

인터넷 기반 컴퓨팅의 일종으로 정보를 자신의 컴퓨터가 아닌 클라우드에 연결된 다른 컴퓨터로 처리하는 기술을 의미

 

7.빅데이터 조직구조 유형

 

-집중 구조: 전사 분석 업무를 별도의 분석 전담 조직에서 담당

               전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행가능

-기능 구조: 일반적인 형태로 별도 분석조직이 없고 해당 부서에서 분석 수행

               전사적 핵심 분석이 어려우며 과거에 국한된 분석 수행

-분산 구조: 분석 조직 인력들을 현업 부서로 직접 배치해 분석업무를 수행

               전사 차원의 우선순위 수행

 

8.데이터 사이언티스트의 요구역량( 가트너가 제시)

 

-소프트 스킬: 분석의 통찰력, 여러분야의 협력 능력, 설득력 있는 전달력

-하드 스킬: 빅데이터 관련 이론적 지식, 분석기술의 숙련도

 

9.NoSQL

: 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로서 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할수없으며, 수평적 확장이 가능한 DBMS이다.

 

10.인포그래픽

: Information Graphic의 줄임말로, 중요 정보를 하나의 그래픽으로 표현해서 보는 사람들이 쉽게 정보를 이해할 수 있도록 만드는 시각화 방법

 

11.스쿱(Sqoop)

:정형 데이터 수집 소프트웨어로 커넥터를 사용하여 RDBMS에서 HDFS로 데이터를 수집하거나 HDFS에서 RDBMS로 데이터를 보내는 기능을 수행

 

12. 데이터 웨어하우스(Data Warehouse)

: 사용자의 의사 결정에 도움을 주기 위하여, 기간 시스템의 데이터베이스에 축적된 데이터를 공통 형식으로 변환해서 관리하는 데이터베이스

 

13.딥러닝

: 사람의 개입이 필요한 기존의 지도 학습보다 더 능동적인 비지도 학습이 결합되어 컴퓨터가 마치 사람처럼 스스로 학습할 수 있는 인공지능기술

 

14.개인정보 보호법

: 개인정보 처리 과정상의 정보 주체와 개인정보 처리자의 권리, 의무 등 규정

 

15.마이 데이터 

: 개인이 자신의 정보를 관리,통제 할뿐만 아니라 이러한 정보를 신용이나 자산관리 등에 능동적으로 활용하는 일련의 과정