정식 보고서 파일은 아니지만, 프로젝트의 개요를 워드로 작성해 보았다.
1. 전국 고령화 비율
- 사용 데이터:old_people_pro_total (전국+고령인구비율_시도_시_군_구__20221013214512)
- 표현 방법: 막대그래프 2가지, 범주형의 비율을 시각화할 때 pie chart
첫번째: 검정 막대그래프, 두번째: 부산만 빨간색, 그 외 파란색으로 구분
- 결과: 5번째로 고령화 비율 높음(21.2)
2. 전국 노인(시or구별) 문화시설 현황
- 사용데이터: old_people_facility_total (2022+노인복지시설+현황)
※ raw 데이터 쓸수 없어 가공
- 표현 방법: 주거복지시설 + 의료복지시설 + 여가복지시설 + 복지시설 + 일자리기관 +
학대피해전용쉼터 + 치매요양기관 전체를 더한 숫자를 변수 파생하여
전국에서 부산의 기관 개수가 어느정도인지를 파악
막대그래프, 원 그래프 제공
- 결과: 전국에서 8번째로 기관 개수 적음(3113개)
3. 부산 고령화 인구 비율
- 사용 데이터: busan_old_pro(부산+구·군별_고령인구_65세_이상__및_구성비_20221013214633+(1)
- 표현 방법: 원 그래프
# UN 기준에 따르면 65세 이상 인구가 7% 이상일때, => 우리나라의 고령화 기준수치 확인할 것
# 고령화사회, 14% 넘으면 고령사회, 20%가 넘으면 초고령화사회
# 해당 기준에 따르면 부산광역시는 고령화인구가 38.5% 이므로 초고령화사회 => 년도 변화에 따른 시각화
4. 연령에 따른 인구 밀도
(1)번과 연관 지어서 시각화 함.
5. 부산 노인 문화시설 현황
- 사용 데이터: busan_facility2(부산광역시+경로당현황_20220228)
- 표현 방법: 막대그래프,*pie chart로 표현해보자.
group by를 통해 구별 노인복지시설이 얼마나 있는지 분포를 확인
- 결과: 기장군이 가장 많고 중구가 가장 적었다.
6. 노인 우울 지수
- 사용 데이터: old_depression2(전국+노인+우울증상+경험률)
- 표현 방법: 막대그래프
첫번째: 검정색 막대그래프 (부산이 다섯번째로 우울 경험 지수 높음)
두번째: 색상있는 막대그래프(부산을 빨간색, 그 외 파란색으로 구분)
- 결과: 부산이 전국에서 5번째로 우울 지수가 높은 것으로 확인
7. 연령대별 거주지역 분포
- 사용 데이터: city_people(202209_202209_연령별인구현황_월간)
- 표현 방법: 막대그래프
50, 60, 70, 80, 90대 연령대별 거주지역 분포
- 결과: 부산광역시 50대 분포도 전국 2위, 60대 분포도 전국 2위,
70, 80, 90대는 순위 점차 낮아짐
8. 대한민국 행복지도_삶의 만족도
- 사용데이터 : 대한민국행복지도_삶의 만족도+행복지수
- 표현방법 : 워드 클라우드, 막대그래프
# (상관계수)
# 전국 우울지수와 인구수, 노인지원기관수, 고령인구비율, 2020_우울증상경험군, 2021_행복지수 수치 데이터를
상관관계 분석 진행
# 관련성 있는 것: 65세 이상 인구 수 & 노인지원 기관수, 상관계수 0.68 => 양의 상관관계가 있다.
/65세 이상 인구 수 & 2021_행복지수, 상관계수 -0.5230352 => 음의 상관관계가 있다.
=> 노인인구대비 노인지원 기관의 수가 적절한가? 부족하지 않은가? => 회귀분석
=> 노인밀도
※ 그 외 관련성 없음
# (회귀분석1)
# lm 모델로 진행하여 확인한 결과
종속변수: 우울지수
독립변수: 65세 이상 인구, 노인지원기관수, 고령인구비율
# 3개 독립변수 모두 종속변수에 영향을 주는 변수인 것으로 확인이 되었으나
(p값이 0.05보다 작음)
결론적으로 이 모델 자체의 p값이 0.05보다 크고, r2값이 마이너스 값인것을 고려해서
해당 데이터에서 회귀분석를 하는 것이 의미 없는 것으로 나타남
# (회귀분석2)
# lm 모델로 진행하여 확인할 결과
종속변수 : 행복지수
독립변수 : 65세 이상 인구, 노인지원기관수, 고령인구 비율
# 3개 독립변수 모두 종속변수에 영향을 주는 변수인 것으로 확인
(p값이 0.05보다 크다 = 0.5801)
결론적으로 이 모델 자체의 p값이 0.05보다 큰 걸로 봐서 해당 데이터에서 회귀분석을 하는 것이 의미 없는 것으로 나타남.
'K-digital Project > R_project' 카테고리의 다른 글
R 프로젝트 사용 데이터 (0) | 2022.10.23 |
---|