읽으면서 공부하는 3과목 데이터 통계분석
1. 세번째 과목 : 데이터 분석 이 과목은 크게 R기초와 데이터마트, 통계분석, 정형데이터 마이닝 세가지 파트로 나누어 집니다. 첫째, R기초와 데이터 마트에서는 R기초, 데이터마트, 결측값 처리와 이상값 검색을 각 절로 다루고 있습니다. 두번째 통계분석 장에서는 통계학 개론, 기초 통계분석, 다변량 분석, 시계열 예측 이라는 4절로 나누어집니다. 마지막 정형 데이터 마이닝에서는 데이터 마이닝 개요, 분류분석, 군집분석, 연관분석 4절로 나누어져 있습니다. 1장. R기초와 데이터마트, 결측치와 이상값 키워드 암기 여기서 저는 요약변수와 파생변수의 정의를 간단히 정리하고 넘어가려고 합니다. 요약변수는 가장 기본적인 변수, 파생변수는 특정 조건에 맞추어 의미를 부여한 변수로 기억해보겠습니다. 참고로 파생변..
2023. 2. 24.
데이터(자료, Data)와 데이터베이스의 활용
밤새 비가 오더니 오늘 아침엔 날씨가 정말 좋습니다. 오늘도 데이터 분석 준전문가 자격을 취득하기 위해 공부를 시작해보겠습니다. 공부 시작 2일차. 데이터란 무엇인가 대해 먼저 알아보겠습니다. 데이터의 정의 데이터는 단어, 문자, 그림, 소리, 영상 등 다양한 형태로 된 의미의 단위입니다. 연구나 조사 등에 이용이 되는 재료를 의미하며, 이러한 자료(데이터)를 의미 있게 정리하면 정보가 되는 것입니다. 이러한 데이터는 질적(정성적) 자료와 양적(정량적) 자료로 구분할 수 있습니다. 질적(정성적, 분류, 범주형)자료 언어, 문자 등 수치로 확인할 수 없는 자료로 저장이나 검색, 분석 등에 큰 비용이 소모되는 특징이 있습니다. 예시로는 전화번호, 성별, 기상특보, 계급, 순위, 종교 등이 있습니다. 양적(정..
2023. 2. 23.