I. 서론
II. 1인 가구와 주간 인구 지수 현황
1. 1인 가구 현황
2. 주간 인구 현황
III. 지역 구분을 위한 데이터 처리
1. 1인 가구 데이터
2. 주간 인구 데이터
3. 1인 가구와 주간 인구를 조합한 데이터
IV. 분석 방법
1. 분석 방법 설계
2. 분석 방법에 따른 군집분석 결과분석
V. 방법별 군집분석 결과
1. 방법 1에 의한 군집분석 결과
2. 방법8에 의한 군집분석 결과
3. 방법 11에 의한 군집분석 결과
4. 방법 간 비교
VI. 결론
I. 서론
지역을 구분하는 것은 지역을 대상으로 하는 학문의 큰 연구 주제로 많은 연구가 진행되어 왔다(박경훈 등, 2000; 남영우・성은영, 2001; 정윤남 등, 2020). 지역은 인구 규모에 따라 대도시에서 소도시로 구분하기도 하고, 중심지 체계 또는 중심 기능에 의해 중심 지역과 주변 지역으로 구분하기도 하며, 지역의 성격에 따라 생산 지역과 주거 또는 소비 지역으로 구분하기도 하며, 주요 산업에 따라 농축산업, 제조업, 서비스업 지역으로 구분하기도 한다. 인구는 이러한 인간 활동의 총화로 지역의 사회, 경제, 문화적 특성을 집약적으로 반영하며(국토지리정보원, 2016) 지역에 따라 성별, 연령별 인구 구조는 다양하게 나타난다. 성별, 연령별 지역의 인구 이외에도 지역의 성격에 따라 그 분포가 매우 달라지는 대표적인 인구학적 측면의 데이터로는 1인 가구와 주간 인구 지수를 들 수 있다.
1인 가구는 우리나라뿐만 아니라 전 세계적으로도 증가하는 추세이며(강덕구, 2021), 1인 가구의 비율은 지역의 특성을 잘 나타내는 자료이다. 1인 가구 증가에 따라 대도시 특정 지역에서는 미혼의 1인 가구가 많고, 노령화에 따라 농촌에는 여성 1인 가구가 많다. 반면, 신도시와 대도시의 주거 지역에서는 1인 가구의 비율이 상대적으로 낮다. 또한, 지역의 특성에 따라 남자와 여자 1인 가구가 많은 지역이 달라지기도 하며 이를 토대로 1인 가구 비율을 이용하여 지역을 구분한 연구가 진행되기도 하였다(정재준, 2020)
주간 인구 지수 역시 지역의 특성을 잘 나타내는 자료이다. 통상 지역의 성별, 연령별 인구 구조는 지역의 상주인구의 성별, 연령별 인구 구조를 나타내기 때문에 지역의 특성을 완전히 나타낸다고 할 수 없다. 반면 주간 인구는 상주인구에서 통근-통학에 의한 유입 인구와 유출 인구를 고려하기 때문에 지역의 특성을 나타낼 수 있는 자료로 이용될 수 있다. 산업화 시대의 도래로 직장과 주거의 분화가 나타나게 되고, 이로 인해 상주인구와 주간 인구의 차이는 커지게 된다(변미리・서우석, 2011). 따라서 상주인구 대비 주간 인구 비율을 나타내는 주간 인구 지수는 지역의 특성을 나타낼 수 있는 자료로 이용될 수 있다. 주간 인구 지수 역시 지역의 특성에 따라 그 분포가 다양하다. 주간 인구 지수가 높은 지역은 일자리가 많은 지역이며, 주간 인구 지수가 낮은 지역은 도시의 주거 지역인 경우가 많다. 하지만 현재까지 주간 인구 지수를 이용하여 전국 단위로 지역을 구분한 연구는 찾아보기 어렵다.
본 연구에서는 이러한 점에 착안하여 통계청의 국가통계포털(kosis.kr)에서 제공하는 우리나라 시군구의 1인 가구 비율과 주간 인구 지수를 이용하여 시군구의 성격을 구분하는 군집분석을 하고자 한다. 먼저 우리나라의 1인 가구 현황과 주간 인구 현황을 살펴본 후, 1인 가구와 주간 인구 데이터의 상관관계 분석을 토대로 지역 구분을 위한 데이터를 정리하였다. 다음으로는 군집분석 방법을 설계하여 시군구에 대해 군집분석을 하였고, 방법별 군집분석의 결과를 비교・분석하고 이를 바탕으로 기능에 따라 지역을 군집분석하는 방안을 제시하였다.
II. 1인 가구와 주간 인구 지수 현황
1. 1인 가구 현황
우리나라 시군구의 성별, 연령별, 혼인상태별 1인 가구 현황은 5년 단위로 조사되며(성별, 연령별 1인 가구는 1년 단위로 조사됨) 일반가구를 대상으로 한 표본 조사이다. 1인 가구 지속적으로 늘어나 2020년 현재 전체 일반 가구의 31.7%에 해당하는 약 664만 가구이며, 일반가구원 대비 13.5%에 해당한다(표 1). 1인 가구는 2020년 현재 우리나라의 가구원별 구성 중 가장 많은 비율을 차지하는 있는 가장 대표적인 가구 형태이다(1인 가구-664만 가구(31.7%), 2인 가구-586만 가구(28.0%), 3인 가구-420만 가구(20.1%), 4인 이상 가구-422만 가구(21.6%)).
1인 가구는 성별, 연령별, 혼인상태별로 매우 다양하게 나타나는데 20~30대에는 미혼 1인 가구, 50~60대에는 배우자가 있거나 이혼한 1인 가구, 70대 이상에서는 사별 1인 가구가 많으며(표 2), 다음 장에서 살펴보겠지만 1인 가구의 분포는 지역에 따라서도 매우 다양한 양상으로 나타난다.
표 1.
2000~2020년 1인 가구의 변화(단위: 1,000명, (괄호) 안은 일반가구원 대비 비율임)
|
2000년
|
2005년
|
2010년
|
2015년
|
2020년
|
|
일반가구원 수
|
44,712
|
45,737
|
46,651
|
48,340
|
49,029
|
|
일반가구 수
|
14,312
|
15,887
|
17,339
|
19,111
|
20,927
|
1인
가구 수
|
남자
|
미혼
|
576
|
855
|
1,110
|
1,340
|
1,996
|
|
유배우자
|
168
|
236
|
338
|
353
|
526
|
|
사별
|
106
|
148
|
195
|
217
|
219
|
|
이혼
|
95
|
180
|
281
|
405
|
564
|
|
소계
|
945
|
1,418
|
1,924
|
2,315
|
3,304
|
|
여자
|
미혼
|
381
|
573
|
733
|
944
|
1,344
|
|
유배우자
|
99
|
132
|
196
|
232
|
348
|
|
사별
|
676
|
854
|
1,013
|
1,315
|
1,143
|
|
이혼
|
124
|
193
|
275
|
405
|
503
|
|
소계
|
1,279
|
1,753
|
2,218
|
2,896
|
3,339
|
|
합계
|
2,224
|
3,171
|
4,142
|
5,211
|
6,643
|
|
1인 가구 비율
|
15.5 (5.0)
|
20.0 (6.9)
|
23.9 (8.9)
|
27.3 (10.8)
|
31.7 (13.5)
|
표 2.
2020년 1인 가구원의 성별, 혼인상태별, 연령별 구성(단위: 1,000명, 괄호 안은 구성비(%)를 나타냄)
|
20대
|
30대
|
40대
|
50대
|
60대
|
70대
|
합계
|
|
남자
|
미혼
|
679
|
638
|
377
|
216
|
72
|
14
|
1,996
|
|
(10.2)
|
(9.6)
|
(5.7)
|
(3.2)
|
(1.1)
|
(0.2)
|
(30.0)
|
|
유배우자
|
5
|
53
|
106
|
163
|
133
|
66
|
526
|
|
(0.1)
|
(0.8)
|
(1.6)
|
(2.5)
|
(2.0)
|
(1.0)
|
(7.9)
|
|
사별
|
-
|
1
|
3
|
18
|
56
|
141
|
219
|
|
(0.0)
|
(0.0)
|
(0.0)
|
(0.3)
|
(0.8)
|
(2.1)
|
(3.3)
|
|
이혼
|
2
|
23
|
87
|
198
|
190
|
65
|
564
|
|
(0.0)
|
(0.3)
|
(1.3)
|
(3.0)
|
(2.9)
|
(1.0)
|
(8.5)
|
|
소계
|
686
|
715
|
572
|
595
|
451
|
286
|
3,304
|
|
(10.3)
|
(10.8)
|
(8.6)
|
(9.0)
|
(6.8)
|
(4.3)
|
(49.7)
|
|
여자
|
미혼
|
648
|
348
|
191
|
88
|
47
|
21
|
1,344
|
|
(9.8)
|
(5.2)
|
(2.9)
|
(1.3)
|
(0.7)
|
(0.3)
|
(20.2)
|
|
유배우자
|
6
|
30
|
53
|
109
|
101
|
49
|
348
|
|
(0.1)
|
(0.5)
|
(0.8)
|
(1.6)
|
(1.5)
|
(0.7)
|
(5.2)
|
|
사별
|
-
|
1
|
6
|
66
|
275
|
796
|
1,143
|
|
(0.0)
|
(0.0)
|
(0.1)
|
(1.0)
|
(4.1)
|
(12)
|
(17.2)
|
|
이혼
|
3
|
22
|
82
|
181
|
165
|
51
|
503
|
|
(0.0)
|
(0.3)
|
(1.2)
|
(2.7)
|
(2.5)
|
(0.8)
|
(7.6)
|
|
소계
|
657
|
401
|
332
|
445
|
588
|
917
|
3,339
|
|
(9.9)
|
(6.0)
|
(5.0)
|
(6.7)
|
(8.9)
|
(13.8)
|
(50.3)
|
|
합계
|
1,343
|
1,115
|
904
|
1,039
|
1,039
|
1,202
|
6,643
|
|
(20.2)
|
(16.8)
|
(13.6)
|
(15.7)
|
(15.7)
|
(18.1)
|
(100.0)
|
2. 주간 인구 현황
우리나라 시군구의 주간 인구는 5년 단위의 표본 조사(표본 비율 20%)로 데이터가 취합되며, 일반가구, 집단가구, 집단시설가구의 가구원을 대상으로 한다. 지방자치단체의 상주인구에서 통근-통학으로 인한 유입 인구와 유출 인구를 가감하여 주간 인구를 계산한다.
주간 인구 지수는 상주인구 대비 주간 인구의 비율이기 때문에 지역의 특성에 따라 편차가 크며, 이는 지역의 특성을 구분할 수 있는 자료이다. 성별로는 남자가 여자보다 시군구별 주간 인구 지수 차이가 크다. 연령대 별로는 30~50대의 편차가 크며, 70대 이상에서는 경제활동인구의 감소로 주간 인구 지수가 차이가 급격히 줄어드는 양상을 보인다(표 3).
표 3.
2020년 시군구의 성별, 연령별 주간 인구 지수
|
20대
|
30대
|
40대
|
50대
|
60대
|
70대 이상
|
계
|
|
전체
|
최대
|
336
|
467
|
511
|
351
|
215
|
127
|
321
|
|
최소
|
63
|
59
|
63
|
68
|
85
|
96
|
77
|
|
평균
|
103
|
109
|
109
|
106
|
102
|
100
|
104
|
|
표준편차
|
26
|
39
|
37
|
25
|
12
|
3
|
21
|
|
남자
|
최대
|
294
|
503
|
620
|
415
|
244
|
144
|
357
|
|
최소
|
64
|
49
|
42
|
49
|
76
|
93
|
69
|
|
평균
|
104
|
111
|
111
|
107
|
103
|
101
|
105
|
|
표준편차
|
23
|
46
|
49
|
33
|
16
|
5
|
25
|
|
여자
|
최대
|
372
|
432
|
399
|
289
|
188
|
115
|
288
|
|
최소
|
62
|
68
|
78
|
84
|
91
|
98
|
82
|
|
평균
|
102
|
106
|
106
|
104
|
101
|
100
|
102
|
|
표준편차
|
30
|
33
|
27
|
17
|
8
|
1
|
17
|
III. 지역 구분을 위한 데이터 처리
1인 가구와 주간 인구 데이터를 이용하여 전국 시군구를 구분하기 위해 데이터가 취득되는 기준인 행정구까지를 포함한 252개 시군구를 대상으로 데이터를 처리하였다. 다만, 부천시의 소사구, 원미구, 오정구 데이터가 제공되지 않고 있어서 부천시로 1개의 시군구로 통합하여 처리하여 전국 250개 시군구를 대상으로 분석을 실시하였다. 지역 구분을 위한 데이터로는 총 15개의 변수를 추출하였는데, 그중 1인 가구 데이터로부터는 총 8개의 변수를, 주간 인구 데이터로부터는 총 7개의 변수를 추출하였으며 그 과정은 다음과 같다.
1. 1인 가구 데이터
1인 가구 데이터는 일반가구원 대비 1인 가구원의 비율로 계산하였다. 가공할 수 있는 데이터는 시군구별 1인 가구 비율 데이터는 전체 비율 1개, 성별 비율 2개(남자, 여자), 혼인상태별 4개(미혼, 유배우, 사별, 이혼), 연령대별 6개(20대, 30대, 40대, 50대, 60대, 70대이며 10대는 20대로, 80대 이상은 70대로 구분)이다.
이렇게 구분한 13개 변수 이외에도 성별-혼인상태별 8개, 성별-연령별 12개, 혼인상태별-연령별 24개, 성별-혼인상태별-연령별 48개 등 총 105개의 변수를 만들 수 있다. 하지만 실제 변수들의 상관관계를 조사한 결과 연령별 분포는 성별, 혼인상태별에 포함에 포함되어 연령대별 변수를 제외하고 전체 1개, 성별 2개, 혼인상태별 4개, 성별-혼인상태별 8개 등 총 15개 변수의 상관관계를 조사였다(예를 들면, 남자-미혼-20대 또는 30대 변수와 남자-미혼 변수와의 상관 계수는 각각 0.8952와 0.8954였으며, 여자-사별-60대 이상 변수와 여자-사별 변수의 상관 계수는 0.9999로 나타나는 등 연령대별 변수가 성별-혼인상태별 변수와 상관 계수가 높은 변수가 많았음).
15개 변수의 상관관계를 산출한 후 결과적으로 전체, 남자, 여자, 미혼, 유배우, 사별, 남자-이혼, 여자-이혼의 8개 변수를 1인 가구 비율 데이터로 선정하였다(표 4). 남자-미혼과 여자-미혼, 남자-유배우자와 여자-유배우자, 남자-사별과 여자-사별 등은 상관 계수가 0.8 이상으로 매우 높아 각각 미혼, 유배우, 사별로 대체하였으며, 이혼의 경우 남자-이혼과 여자-이혼의 상관 계수는 0.59로 상관관계가 높지는 않아 각각 다른 변수로 선정하여 이혼 변수를 대체하였다.
표 4.
1인 가구원 비율의 성별, 혼인상태별 상관 계수
|
전체
|
성별
|
혼인상태별
|
성별-혼인상태별
|
|
남자
|
여자
|
미혼
|
유배우
|
사별
|
이혼
|
남자
미혼
|
여자
미혼
|
남자
유배우
|
여자
유배우
|
남자
사별
|
여자
사별
|
남자
이혼
|
여자
이혼
|
|
전체
|
1.00
|
0.86
|
0.92
|
0.30
|
0.60
|
0.64
|
0.34
|
0.33
|
0.25
|
0.58
|
0.58
|
0.64
|
0.63
|
0.52
|
0.05
|
|
성별
|
남자
|
0.86
|
1.00
|
0.59
|
0.48
|
0.54
|
0.29
|
0.43
|
0.60
|
0.32
|
0.53
|
0.47
|
0.35
|
0.27
|
0.56
|
0.17
|
|
여자
|
0.92
|
0.59
|
1.00
|
0.11
|
0.53
|
0.78
|
0.21
|
0.06
|
0.14
|
0.51
|
0.55
|
0.74
|
0.78
|
0.40
|
-0.05
|
혼인
상태별
|
미혼
|
0.30
|
0.48
|
0.11
|
1.00
|
-0.39
|
-0.50
|
0.24
|
0.96
|
0.96
|
-0.40
|
-0.29
|
-0.49
|
-0.50
|
0.05
|
0.41
|
|
유배우
|
0.60
|
0.54
|
0.53
|
-0.39
|
1.00
|
0.72
|
0.01
|
-0.29
|
-0.45
|
0.99
|
0.88
|
0.77
|
0.71
|
0.31
|
-0.34
|
|
사별
|
0.64
|
0.29
|
0.78
|
-0.50
|
0.72
|
1.00
|
-0.02
|
-0.47
|
-0.49
|
0.72
|
0.62
|
0.97
|
1.00
|
0.30
|
-0.38
|
|
이혼
|
0.34
|
0.43
|
0.21
|
0.24
|
0.01
|
-0.02
|
1.00
|
0.30
|
0.16
|
-0.02
|
0.11
|
0.02
|
-0.02
|
0.91
|
0.87
|
성별-
혼인
상태별
|
남자
미혼
|
0.33
|
0.60
|
0.06
|
0.96
|
-0.29
|
-0.47
|
0.30
|
1.00
|
0.84
|
-0.30
|
-0.23
|
-0.45
|
-0.47
|
0.14
|
0.41
|
여자
미혼
|
0.25
|
0.32
|
0.14
|
0.96
|
-0.45
|
-0.49
|
0.16
|
0.84
|
1.00
|
-0.47
|
-0.32
|
-0.49
|
-0.49
|
-0.05
|
0.37
|
남자
유배우
|
0.58
|
0.53
|
0.51
|
-0.40
|
0.99
|
0.72
|
-0.02
|
-0.30
|
-0.47
|
1.00
|
0.81
|
0.76
|
0.71
|
0.30
|
-0.38
|
여자
유배우
|
0.58
|
0.47
|
0.55
|
-0.29
|
0.88
|
0.62
|
0.11
|
-0.23
|
-0.32
|
0.81
|
1.00
|
0.67
|
0.61
|
0.32
|
-0.15
|
남자
사별
|
0.64
|
0.35
|
0.74
|
-0.49
|
0.77
|
0.97
|
0.02
|
-0.45
|
-0.49
|
0.76
|
0.67
|
1.00
|
0.95
|
0.34
|
-0.35
|
여자
사별
|
0.63
|
0.27
|
0.78
|
-0.50
|
0.71
|
1.00
|
-0.02
|
-0.47
|
-0.49
|
0.71
|
0.61
|
0.95
|
1.00
|
0.29
|
-0.38
|
남자
이혼
|
0.52
|
0.56
|
0.40
|
0.05
|
0.31
|
0.30
|
0.91
|
0.14
|
-0.05
|
0.30
|
0.32
|
0.34
|
0.29
|
1.00
|
0.59
|
여자
이혼
|
0.05
|
0.17
|
-0.05
|
0.41
|
-0.34
|
-0.38
|
0.87
|
0.41
|
0.37
|
-0.38
|
-0.15
|
-0.35
|
-0.38
|
0.59
|
1.00
|
2. 주간 인구 데이터
시군구의 전체 주간 인구, 남자 주간 인구, 여자 주간 인구, 전체 상주인구, 남자 상주인구, 여자 상주인구 6개의 데이터로부터 시군구의 주간 인구 지수와 성비 데이터를 계산하여 분석에 이용하였다. 결론적으로 주간 인구 지수와 관련하여 4개의 변수, 성비와 관련하여 3개의 변수를 도출하였으며 그 과정은 다음과 같다.
먼저 주간 인구 지수는 전체 주간 인구 지수 1개, 성별 주간 인구 지수 2개, 성별 주간 인구 지수 차(=남자 주간 인구 지수 – 여자 주간 인구 지수) 1개, 연령대별(10대는 20대로, 80대 이상은 70대로 구분) 주간 인구 지수 6개, 성별-연령대별 주간 인구 지수 12개 등 총 22개의 변수를 조사하였다. 연령대별 주간 인구 지수가 포함된 변수는 변수 간의 상관 계수가 0.9 내외로 매우 높아 전체 주간 인구 지수, 남자 주간 인구 지수, 여자 주간 인구 지수, 성별 주간 인구 지수 차 이렇게 4개의 변수를 사용하였다. 전체 주간 인구 지수, 남자 주간 인구 지수, 여자 주간 인구 지수는 서로 상관관계는 높지만 남자 주간 인구 지수가 여자 주간 인구 지수보다 시군구 간 변화 폭이 변수로 사용하였다. 주간 인구 지수 차의 경우 전체 또는 성별 주간 인구 지수와의 상관 계수가 상대적으로 낮아 지역의 주간 인구 지수를 나타내는 변수로 사용하였다(표 5).
표 5.
주간 인구 지수의 상관 계수
|
전체
|
남자
|
여자
|
지수 차
|
|
전체
|
1.00
|
0.99
|
0.98
|
0.81
|
|
남자
|
0.99
|
1.00
|
0.96
|
0.87
|
|
여자
|
0.98
|
0.96
|
1.00
|
0.69
|
|
지수 차
|
0.81
|
0.87
|
0.69
|
1.00
|
다음으로 성비 데이터는 상주인구 성비 1개, 주간 인구 성비 1개, 주간 성비 지수(=주간 인구 성비/상주인구 성비) 1개, 연령대별 상주인구 성비 6개, 연령대별 주간 인구 성비 6개, 연령대별 성비 차 6개 등 총 21개 변수에 대해 상관관계를 조사하였다.
주간 성비 지수는 본 연구에서 조작적 정의를 통해 새롭게 산출한 값으로 ‘주간 인구 성비 / 상주인구 성비’ 또는 ‘남자 주간 인구 지수 / 여자 주간 인구 지수’를 나타내는 값이다. 주간 성비 지수가 높을수록 남자 위주의 일자리가 많다는 의미이며, 반대로 낮으면 여자 위주의 일자리가 많을 수도 있지만 실제로는 남자 주간 인구가 남자 상주인구에 비해 적은 전형적인 신도시 등 주거 지역을 의미한다. 따라서 성비 차와 거의 비슷하기는 하지만(상관 계수 0.998) 주간 인구 성비 또는 상주인구 성비 등과 마찬가지로 100을 기준으로 하여 값을 산출할 수 있으므로 성비 차에 대신하여 주간 성비 지수를 사용하였으며 그 정의는 아래와 같다.
주간 인구 성비와 주간 성비 지수의 경우 주요 생산 연령층인 30~60대의 연령대별 주간 인구 성비 또는 주간 성비 지수와 상관관계가 매우 높다. 따라서 주간 인구 성비와 주간 성비 지수는 변수를 연령대별 데이터를 사용하지 않고 전체 연령대별 값을 나타내는 하나의 변수만을 사용하였고, 이에 따라 연령대별 상주인구 성비 역시 자료를 단순화하기 위해 전체 연령대별 상주인구 성비만을 사용하였다. 이런 과정을 거쳐 성비와 관련해서는 상주인구 성비, 주간 인구 성비, 주간 성비 지수 이렇게 3개의 변수를 사용하였다(표 6).
표 6.
성비 관련 상관 계수
|
성비
|
상주인구 성비
|
주간 인구 성비
|
성비 지수
|
상주
인구
|
주간
인구
|
성비
지수
|
20
대
|
30
대
|
40
대
|
50
대
|
60
대
|
70
대
|
20
대
|
30
대
|
40
대
|
50
대
|
60
대
|
70
대
|
20
대
|
30
대
|
40
대
|
50
대
|
60
대
|
70
대
|
|
성비
|
상주
인구
|
1.0
|
0.7
|
0.4
|
0.6
|
0.7
|
0.4
|
0.5
|
0.7
|
0.1
|
0.6
|
0.6
|
0.4
|
0.5
|
0.6
|
0.2
|
0.4
|
0.3
|
0.3
|
0.3
|
0.4
|
0.1
|
주간
인구
|
0.7
|
1.0
|
0.9
|
0.5
|
0.6
|
0.5
|
0.6
|
0.6
|
0.0
|
0.6
|
0.9
|
0.8
|
0.9
|
0.9
|
0.2
|
0.5
|
0.8
|
0.8
|
0.8
|
0.8
|
0.5
|
성비
지수
|
0.4
|
0.9
|
1.0
|
0.4
|
0.3
|
0.5
|
0.5
|
0.4
|
-0.1
|
0.5
|
0.8
|
0.9
|
0.9
|
0.8
|
0.2
|
0.4
|
0.9
|
0.9
|
0.9
|
0.9
|
0.7
|
3. 1인 가구와 주간 인구를 조합한 데이터
다음으로는 1인 가구와 주간 인구 데이터를 조합하여 시군구를 구분하기 위한 데이터를 제작하였다. 데이터는 1인 가구 관련 8개 변수와 주간 인구 관련 7개 변수로 구성되었으며 각 변수의 상관 계수와 기술 통계는 각각 표 7, 표 8과 같으며, 분석 변수의 상위 지역과 하위 지역은 표 9와 같다.
표 7.
분석 변수 간 상관관계
|
1인 가구 비율
|
주간 인구 및 상주인구
|
|
전체
|
성별
|
혼인상태별
|
주간 인구 지수
|
성비
|
|
남자
|
여자
|
미혼
|
유배우
|
사별
|
이혼
남자
|
이혼
여자
|
전체
|
남자
|
여자
|
지수 차
|
상주
인구
|
주간
인구
|
주간
성비
지수
|
1인
가구
비율
|
전체
|
1.00
|
0.86
|
0.92
|
0.30
|
0.60
|
0.64
|
0.52
|
0.05
|
0.33
|
0.32
|
0.32
|
0.25
|
-0.04
|
0.17
|
0.27
|
|
성별
|
남자
|
0.86
|
1.00
|
0.59
|
0.48
|
0.54
|
0.29
|
0.56
|
0.17
|
0.32
|
0.33
|
0.29
|
0.32
|
0.38
|
0.42
|
0.34
|
|
여자
|
0.92
|
0.59
|
1.00
|
0.11
|
0.53
|
0.78
|
0.40
|
-0.05
|
0.27
|
0.26
|
0.29
|
0.16
|
-0.35
|
-0.04
|
0.17
|
혼인
상태
별
|
미혼
|
0.30
|
0.48
|
0.11
|
1.00
|
-0.39
|
-0.50
|
0.05
|
0.41
|
0.26
|
0.22
|
0.31
|
0.04
|
-0.09
|
-0.09
|
-0.06
|
|
유배우
|
0.60
|
0.54
|
0.53
|
-0.39
|
1.00
|
0.72
|
0.31
|
-0.34
|
0.15
|
0.18
|
0.09
|
0.30
|
0.37
|
0.46
|
0.40
|
|
사별
|
0.64
|
0.29
|
0.78
|
-0.50
|
0.72
|
1.00
|
0.30
|
-0.38
|
0.08
|
0.10
|
0.05
|
0.16
|
-0.13
|
0.11
|
0.25
|
이혼
남자
|
0.52
|
0.56
|
0.40
|
0.05
|
0.31
|
0.30
|
1.00
|
0.59
|
0.12
|
0.12
|
0.11
|
0.12
|
0.19
|
0.18
|
0.13
|
이혼
여자
|
0.05
|
0.17
|
-0.05
|
0.41
|
-0.34
|
-0.38
|
0.59
|
1.00
|
-0.04
|
-0.07
|
0.01
|
-0.20
|
-0.04
|
-0.21
|
-0.26
|
주간
인구
및
상주
인구
|
주간
인구
지수
|
전체
|
0.33
|
0.32
|
0.27
|
0.26
|
0.15
|
0.08
|
0.12
|
-0.04
|
1.00
|
0.99
|
0.98
|
0.81
|
-0.01
|
0.44
|
0.62
|
|
남자
|
0.32
|
0.33
|
0.26
|
0.22
|
0.18
|
0.10
|
0.12
|
-0.07
|
0.99
|
1.00
|
0.96
|
0.87
|
0.04
|
0.53
|
0.71
|
|
여자
|
0.32
|
0.29
|
0.29
|
0.31
|
0.09
|
0.05
|
0.11
|
0.01
|
0.98
|
0.96
|
1.00
|
0.69
|
-0.10
|
0.29
|
0.48
|
|
지수 차
|
0.25
|
0.32
|
0.16
|
0.04
|
0.30
|
0.16
|
0.12
|
-0.20
|
0.81
|
0.87
|
0.69
|
1.00
|
0.27
|
0.81
|
0.95
|
|
성비
|
상주
인구
|
-0.04
|
0.38
|
-0.35
|
-0.09
|
0.37
|
-0.13
|
0.19
|
-0.04
|
-0.01
|
0.04
|
-0.10
|
0.27
|
1.00
|
0.74
|
0.38
|
주간
인구
|
0.17
|
0.42
|
-0.04
|
-0.09
|
0.46
|
0.11
|
0.18
|
-0.21
|
0.44
|
0.53
|
0.29
|
0.81
|
0.74
|
1.00
|
0.90
|
주간성
비지수
|
0.27
|
0.34
|
0.17
|
-0.06
|
0.40
|
0.25
|
0.13
|
-0.26
|
0.62
|
0.71
|
0.48
|
0.95
|
0.38
|
0.90
|
1.00
|
표 8.
분석 변수의 기술 통계
|
1인 가구 비율
|
주간 인구 및 상주인구
|
|
전체
|
성별
|
혼인상태별
|
주간 인구 지수
|
성비
|
|
남자
|
여자
|
미혼
|
유배우
|
사별
|
이혼
남자
|
이혼
여자
|
전체
|
남자
|
여자
|
지수 차
|
상주
인구
|
주간
인구
|
주간성비
지수
|
|
평균
|
30.0
|
14.5
|
15.5
|
12.0
|
4.8
|
8.7
|
2.5
|
1.9
|
103.7
|
105.0
|
102.4
|
2.5
|
98.0
|
100.0
|
101.8
|
|
최대
|
54.9
|
28.8
|
27.8
|
43.4
|
15.5
|
23.8
|
5.9
|
4.9
|
321.0
|
356.8
|
288.1
|
68.7
|
117.1
|
155.9
|
149.2
|
|
최소
|
13.2
|
6.3
|
6.4
|
5.0
|
2.0
|
2.0
|
0.6
|
0.7
|
77.3
|
68.6
|
82.2
|
-17.2
|
87.0
|
74.5
|
79.9
|
|
표준편차
|
6.8
|
3.3
|
4.3
|
5.4
|
2.2
|
5.4
|
0.7
|
0.6
|
20.9
|
25.3
|
17.1
|
10.2
|
5.0
|
11.3
|
8.4
|
표 9.
분석 변수의 상위 지역과 하위 지역
|
구분
|
변수명
|
변수
번호
|
상위 10% 지역
(하위 10% 지역)
|
상위
|
하위
|
|
1위
|
2위
|
3위
|
4위
|
5위
|
5위
|
4위
|
3위
|
2위
|
1위
|
1인
가구
비율
|
전체
|
1
|
도시, 도서, 접경, 군 지역
(신도시)
|
서울
관악
|
부산 중
|
경북
울릉
|
대구 남
|
충북
괴산
|
경기
안양
동안
|
경기
남양주
|
경기
고양
일산서
|
경기
용인
수지
|
경기
과천
|
|
성별
|
남자
|
2
|
미혼 남자 많은 지역,
남자 일자리 지역
(신도시)
|
서울
관악
|
경북
울릉
|
인천
옹진
|
부산 중
|
충북
괴산
|
충남
계룡
|
경기
안양
동안
|
경기
고양
일산서
|
경기
용인
수지
|
경기
과천
|
|
여자
|
3
|
미혼 여자 많은 지역,
군 지역
(신도시, 남자 일자리)
|
부산 중
|
경북
영덕
|
서울
관악
|
경남
합천
|
경남
의령
|
경기
광주
|
경기
남양주
|
경기
용인
수지
|
경기
과천
|
울산 북
|
혼인
상태
별
|
미혼
|
4
|
대도시 지역
(군 지역, 계룡시)
|
서울
관악
|
서울
광진
|
서울
마포
|
부산 중
|
서울
종로
|
전북
진안
|
충북
옥천
|
인천
강화
|
충남
계룡
|
전북
순창
|
|
유배우
|
5
|
도서, 도시 떨어진
군 지역
(도시 주거 지역)
|
인천
옹진
|
경북
울릉
|
경북
군위
|
충북
괴산
|
강원
영월
|
경기
안양
동안
|
서울
도봉
|
경기
용인
수지
|
서울
성북
|
서울
양천
|
|
사별
|
6
|
군 지역
(도시 주거 지역)
|
전남
고흥
|
경남
합천
|
전남
보성
|
경북
의성
|
경북
영덕
|
인천
연수
|
경기
화성
|
서울
서초
|
경기
용인
수지
|
경기
수원
영통
|
|
이혼남자
|
7
|
영남 대도시,
수도권 외곽 도시
(도시 주거 지역)
|
부산 중
|
경북
울릉
|
부산 동
|
부산
영도
|
대구 서
|
경기
성남
분당
|
충남
계룡
|
경기
안양
동안
|
경기
과천
|
경기
용인
수지
|
|
이혼여자
|
8
|
영남대도시,
수도권 외곽 도시
(군 지역)
|
부산 중
|
대구 남
|
대구 서
|
서울
강북
|
강원
속초
|
전남
곡성
|
전북
순창
|
경기
용인
수지
|
전북
임실
|
전남
신안
|
주간
인구
및
상주
인구
|
주간
인구
지수
|
전체
|
9
|
업무 중심지,
일자리 많은 지역
(도시 주거 지역)
|
서울 중
|
서울
종로
|
서울
강남
|
부산 중
|
부산
강서
|
서울
양천
|
서울
도봉
|
서울
관악
|
경기
용인
수지
|
서울
은평
|
|
남자
|
10
|
업무 중심지,
일자리 많은 지역
(도시 주거 지역)
|
서울 중
|
서울
종로
|
서울
강남
|
부산 중
|
부산
강서
|
부산 북
|
서울
양천
|
서울
도봉
|
서울
은평
|
경기
용인
수지
|
|
여자
|
11
|
업무 중심지,
영남 중심 지역
(도시 주거 지역)
|
서울 중
|
서울
종로
|
서울
강남
|
부산 중
|
대구 중
|
경기
용인
수지
|
서울
도봉
|
서울
중랑
|
서울
은평
|
서울
관악
|
|
지수 차
|
12
|
남자 일자리 지역
(도시 주거 지역)
|
서울 중
|
부산
강서
|
서울
종로
|
전남
영암
|
서울
강남
|
경기
수원
장안
|
서울
서대문
|
울산 중
|
대구 중
|
경기
용인
수지
|
|
성비
|
상주인구
|
13
|
도서, 접경,
남자 일자리 지역
(도시 주거, 군 지역)
|
경북
울릉
|
인천
옹진
|
충북
음성
|
충남
당진
|
충북
진천
|
전북
순창
|
경북
영덕
|
서울
서대문
|
부산
수영
|
서울
마포
|
|
주간인구
|
14
|
남자 일자리 지역
(도시 주거 지역)
|
부산
강서
|
전남
영암
|
충북
음성
|
인천
옹진
|
경남
함안
|
부산
수영
|
서울
노원
|
서울
은평
|
서울
서대문
|
경기
용인
수지
|
주간
성비
지수
|
15
|
남자 일자리 지역
(도시 주거 지역)
|
부산
강서
|
전남
영암
|
경남
함안
|
서울 중
|
서울
종로
|
서울
노원
|
경기
수원
장안
|
부산 북
|
울산 중
|
경기
용인
수지
|
IV. 분석 방법
1. 분석 방법 설계
군집분석은 사회과학, 자연과학, 공학 등 전 연구 분야에서 데이터를 분류하는 가장 널리 사용되는 방법이다(김화환 등, 2015; 원석환・황철수, 2018; 박선엽, 2021). 종속 변수가 존재하는 판별 분석과는 달리 독립 변수만 존재하므로 군집을 구분한 후 구분된 군집에 적절한 명명을 하는 것이 일반적이다. 시군구를 구분하기 위한 군집분석에는 총 15개 변수가 사용되었으며, 표 10과 같이 11개의 다양한 방법으로 군집분석을 실시하였다. 군집의 수는 각 방법별로 2개부터 9개까지 늘여가며 분석을 실시하였다. 분석에 사용되는 변수는 원데이터를 이용하는 방법과 표준화 값(z값)을 이용하는 방법으로 나누어 분석을 실시하였으며, 군집분석은 계층적 분류 방법과 비계층적 분류 방법 중 K-means 군집분석 방법을 사용하였다. 계층적 분석 중에서 변수 간 거리 측정은 Euclidean 방법을, 연결 방법 중에서는 모든 변수에 대하여 군집 간의 거리보다는 군집 내의 편차 제곱 합에 근거한 Ward 방법을 사용하였다.
표 10.
군집분석에 사용되는 방법별 변수 구성
|
방법
|
변수 개수
|
사용변수 그룹
|
사용변수(변수번호)
|
|
방법1
|
2
|
1인 가구 비율
|
전체 1인 가구 비율(1)
|
|
주간 및 상주인구
|
전체 주간 인구 지수(9)
|
|
방법2
|
2
|
1인 가구 비율
|
성별 1인 가구 비율(2-3)
|
|
방법3
|
5
|
1인 가구 비율
|
혼인상태별 1인 가구 비율(4-8)
|
|
방법4
|
7
|
1인 가구 비율
|
성별 1인 가구 비율(2-3), 혼인상태별 1인 가구 비율(4-8)
|
|
방법5
|
2
|
주간 및 상주인구
|
싱주/주간 인구 성비(13-14)
|
|
방법6
|
2
|
주간 및 상주인구
|
성별 주간 인구 지수(10-11)
|
|
방법7
|
4
|
주간 및 상주인구
|
성별 인구 지수(10-11), 싱주/주간 인구 성비(13-14)
|
|
방법8
|
9
|
1인 가구 비율
|
성별 1인 가구 비율(2-3), 혼인상태별 1인 가구 비율(4-8)
|
|
주간 및 상주인구
|
싱주/주간 인구 성비(13-14)
|
|
방법9
|
11
|
1인 가구 비율
|
성별 1인 가구 비율(2-3), 혼인상태별 1인 가구 비율(4-8)
|
|
주간 및 상주인구
|
성별 인구 지수(10-11), 싱주/주간 인구 성비(13-14)
|
|
방법10
|
13
|
1인 가구 비율
|
성별 1인 가구 비율(2-3), 혼인상태별 1인 가구 비율(4-8)
|
|
주간 및 상주인구
|
성별 인구 지수(10-11), 주간 인구 지수 차(12)
싱주/주간 인구 성비(13-14), 주간 성비 지수(15)
|
|
방법11
|
15
|
1인 가구 비율
|
전체 1인 가구 비율(1), 성별 1인 가구 비율(2-3), 혼인상태별 1인 가구 비율(4-8)
|
|
주간 및 상주인구
|
전체 주간 인구 지수(9), 성별 인구 지수(10-11), 주간 인구 지수 차(12),
싱주/주간 인구 성비(13-14), 주간 성비 지수(15)
|
2. 분석 방법에 따른 군집분석 결과분석
변수 구성 방법별 11개(표 10), 군집 수 구성 8개(군집 수 2~군집 수 9), 데이터의 입력 값 2개(원데이터와 표준화 값), 군집분석 방법 2개(계층적 분석 방법과 K-means 분석 방법)를 조합하여 총 352회의 군집분석을 실시하였다(표 11). 분석에는 통계 소프트웨어는 R을 사용하였다.
표 11.
군집분석 결과
|
계층적 분류 방법
|
K-means 분류 방법
|
군
집
수
|
군
집
값
|
방
법
1
|
방
법
2
|
방
법
3
|
방
법
4
|
방
법
5
|
방
법
6
|
방
법
7
|
방
법
8
|
방
법
9
|
방
법
10
|
방
법
11
|
군
집
수
|
군
집
값
|
방
법
1
|
방
법
2
|
방
법
3
|
방
법
4
|
방
법
5
|
방
법
6
|
방
법
7
|
방
법
8
|
방
법
9
|
방
법
10
|
방
법
11
|
원
데
이
터
를
이
용
한
군
집
분
석
|
2
|
1
|
129
|
124
|
167
|
136
|
47
|
141
|
139
|
111
|
150
|
139
|
126
|
2
|
1
|
3
|
122
|
166
|
169
|
170
|
3
|
3
|
174
|
3
|
5
|
3
|
|
2
|
121
|
126
|
83
|
114
|
203
|
109
|
111
|
139
|
100
|
111
|
124
|
2
|
247
|
128
|
84
|
81
|
80
|
247
|
247
|
76
|
247
|
245
|
247
|
|
3
|
1
|
4
|
124
|
20
|
63
|
47
|
2
|
4
|
41
|
2
|
27
|
2
|
3
|
1
|
126
|
72
|
39
|
121
|
104
|
16
|
3
|
121
|
125
|
130
|
3
|
|
2
|
125
|
97
|
147
|
73
|
152
|
139
|
135
|
139
|
148
|
112
|
124
|
2
|
121
|
91
|
136
|
47
|
42
|
2
|
153
|
65
|
3
|
3
|
121
|
|
3
|
121
|
29
|
83
|
114
|
51
|
109
|
111
|
70
|
100
|
111
|
124
|
3
|
3
|
87
|
75
|
82
|
104
|
232
|
94
|
64
|
122
|
117
|
126
|
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
|
8
|
1
|
3
|
35
|
20
|
20
|
34
|
2
|
2
|
5
|
2
|
2
|
2
|
8
|
1
|
6
|
23
|
19
|
20
|
61
|
1
|
40
|
75
|
41
|
7
|
1
|
|
2
|
1
|
36
|
19
|
43
|
26
|
29
|
41
|
26
|
12
|
12
|
51
|
2
|
69
|
30
|
66
|
35
|
1
|
2
|
6
|
22
|
8
|
56
|
6
|
|
3
|
20
|
52
|
64
|
45
|
56
|
34
|
38
|
81
|
66
|
55
|
43
|
3
|
42
|
27
|
21
|
34
|
46
|
61
|
13
|
36
|
2
|
74
|
2
|
|
4
|
37
|
27
|
30
|
28
|
36
|
53
|
35
|
32
|
40
|
72
|
26
|
4
|
2
|
50
|
33
|
1
|
39
|
17
|
87
|
7
|
55
|
16
|
61
|
|
5
|
62
|
26
|
34
|
29
|
15
|
25
|
73
|
6
|
60
|
39
|
55
|
5
|
43
|
35
|
33
|
53
|
26
|
31
|
46
|
8
|
53
|
40
|
38
|
|
6
|
68
|
29
|
33
|
40
|
26
|
50
|
17
|
30
|
12
|
13
|
7
|
6
|
15
|
2
|
1
|
21
|
36
|
6
|
1
|
27
|
1
|
52
|
17
|
|
7
|
26
|
16
|
38
|
25
|
44
|
7
|
2
|
38
|
28
|
27
|
36
|
7
|
72
|
39
|
48
|
61
|
32
|
57
|
55
|
38
|
15
|
2
|
72
|
|
8
|
33
|
29
|
12
|
20
|
13
|
50
|
42
|
32
|
30
|
30
|
30
|
8
|
1
|
44
|
29
|
25
|
9
|
75
|
2
|
37
|
75
|
3
|
53
|
|
9
|
1
|
3
|
31
|
20
|
20
|
10
|
2
|
2
|
5
|
2
|
2
|
2
|
9
|
1
|
51
|
32
|
21
|
21
|
25
|
48
|
1
|
48
|
12
|
2
|
2
|
|
2
|
1
|
36
|
19
|
43
|
26
|
29
|
41
|
26
|
12
|
9
|
51
|
2
|
69
|
19
|
35
|
41
|
36
|
6
|
2
|
31
|
55
|
1
|
1
|
|
3
|
15
|
52
|
39
|
45
|
56
|
34
|
38
|
63
|
36
|
55
|
43
|
3
|
35
|
2
|
57
|
31
|
48
|
2
|
78
|
36
|
2
|
58
|
52
|
|
4
|
37
|
27
|
30
|
28
|
36
|
53
|
35
|
32
|
40
|
72
|
26
|
4
|
1
|
27
|
31
|
35
|
1
|
64
|
5
|
7
|
41
|
15
|
15
|
|
5
|
62
|
26
|
34
|
13
|
15
|
25
|
45
|
6
|
60
|
39
|
55
|
5
|
15
|
39
|
33
|
44
|
21
|
30
|
68
|
35
|
6
|
49
|
55
|
|
6
|
68
|
29
|
25
|
40
|
26
|
50
|
17
|
18
|
12
|
3
|
7
|
6
|
6
|
24
|
18
|
24
|
29
|
10
|
46
|
8
|
1
|
40
|
40
|
|
7
|
26
|
4
|
33
|
16
|
44
|
5
|
2
|
30
|
28
|
13
|
13
|
7
|
2
|
40
|
1
|
35
|
8
|
25
|
35
|
27
|
47
|
5
|
5
|
|
8
|
5
|
16
|
38
|
25
|
13
|
2
|
28
|
38
|
30
|
27
|
23
|
8
|
43
|
23
|
33
|
1
|
48
|
64
|
1
|
20
|
15
|
5
|
5
|
|
9
|
33
|
29
|
12
|
20
|
24
|
50
|
42
|
32
|
30
|
30
|
30
|
9
|
28
|
44
|
21
|
18
|
34
|
1
|
14
|
38
|
71
|
75
|
75
|
표
준
화
값
을
이
용
한
군
집
분
석
|
2
|
1
|
160
|
170
|
167
|
153
|
143
|
145
|
142
|
173
|
206
|
101
|
134
|
2
|
1
|
117
|
106
|
163
|
166
|
168
|
3
|
70
|
164
|
154
|
130
|
128
|
|
2
|
90
|
80
|
83
|
97
|
107
|
105
|
108
|
77
|
44
|
149
|
116
|
2
|
133
|
144
|
87
|
84
|
82
|
247
|
180
|
86
|
96
|
120
|
122
|
|
3
|
1
|
62
|
69
|
83
|
42
|
97
|
4
|
47
|
121
|
145
|
58
|
91
|
3
|
1
|
3
|
68
|
112
|
89
|
86
|
238
|
3
|
93
|
94
|
130
|
119
|
|
2
|
98
|
101
|
84
|
111
|
107
|
141
|
108
|
52
|
61
|
149
|
116
|
2
|
114
|
78
|
82
|
77
|
49
|
2
|
76
|
106
|
4
|
115
|
126
|
|
3
|
90
|
80
|
83
|
97
|
46
|
105
|
95
|
77
|
44
|
43
|
43
|
3
|
133
|
104
|
56
|
84
|
115
|
10
|
171
|
51
|
152
|
5
|
5
|
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
⋮
|
|
8
|
1
|
4
|
41
|
18
|
14
|
35
|
3
|
2
|
26
|
3
|
3
|
9
|
8
|
1
|
77
|
21
|
34
|
39
|
5
|
2
|
2
|
41
|
26
|
2
|
6
|
|
2
|
14
|
36
|
40
|
22
|
30
|
1
|
49
|
17
|
17
|
16
|
29
|
2
|
3
|
26
|
41
|
38
|
2
|
1
|
8
|
26
|
26
|
6
|
40
|
|
3
|
48
|
41
|
18
|
28
|
27
|
18
|
18
|
36
|
51
|
20
|
18
|
3
|
6
|
52
|
38
|
16
|
39
|
108
|
48
|
31
|
3
|
57
|
2
|
|
4
|
44
|
57
|
66
|
23
|
50
|
67
|
41
|
16
|
20
|
37
|
49
|
4
|
2
|
46
|
23
|
38
|
61
|
33
|
34
|
37
|
20
|
29
|
61
|
|
5
|
50
|
23
|
25
|
66
|
37
|
30
|
60
|
54
|
61
|
33
|
20
|
5
|
23
|
42
|
20
|
18
|
29
|
5
|
55
|
20
|
39
|
27
|
54
|
|
6
|
33
|
4
|
19
|
30
|
36
|
75
|
35
|
24
|
29
|
76
|
49
|
6
|
58
|
5
|
73
|
60
|
46
|
75
|
5
|
49
|
59
|
56
|
40
|
|
7
|
21
|
24
|
39
|
45
|
26
|
51
|
5
|
49
|
25
|
22
|
33
|
7
|
21
|
24
|
1
|
27
|
39
|
1
|
66
|
22
|
54
|
57
|
18
|
|
8
|
36
|
24
|
25
|
22
|
9
|
5
|
40
|
28
|
44
|
43
|
43
|
8
|
60
|
34
|
20
|
14
|
29
|
25
|
32
|
24
|
23
|
16
|
29
|
|
9
|
1
|
4
|
41
|
18
|
14
|
35
|
3
|
2
|
26
|
3
|
3
|
9
|
9
|
1
|
62
|
40
|
46
|
14
|
58
|
79
|
1
|
19
|
59
|
47
|
6
|
|
2
|
14
|
36
|
40
|
22
|
30
|
1
|
49
|
17
|
17
|
16
|
29
|
2
|
3
|
27
|
41
|
35
|
11
|
1
|
4
|
26
|
3
|
22
|
2
|
|
3
|
48
|
41
|
18
|
28
|
27
|
18
|
18
|
36
|
51
|
20
|
18
|
3
|
12
|
44
|
38
|
25
|
5
|
31
|
32
|
27
|
39
|
17
|
23
|
|
4
|
44
|
29
|
26
|
23
|
50
|
67
|
41
|
16
|
20
|
37
|
49
|
4
|
2
|
5
|
23
|
39
|
29
|
1
|
2
|
42
|
26
|
48
|
51
|
|
5
|
50
|
23
|
25
|
25
|
14
|
30
|
60
|
54
|
42
|
33
|
20
|
5
|
18
|
28
|
19
|
38
|
33
|
14
|
8
|
50
|
1
|
29
|
28
|
|
6
|
14
|
28
|
40
|
41
|
36
|
31
|
35
|
24
|
19
|
49
|
16
|
6
|
64
|
26
|
41
|
16
|
28
|
62
|
48
|
21
|
26
|
56
|
12
|
|
7
|
19
|
4
|
19
|
30
|
26
|
51
|
5
|
33
|
29
|
27
|
33
|
7
|
53
|
36
|
1
|
27
|
38
|
2
|
34
|
3
|
22
|
6
|
50
|
|
8
|
21
|
24
|
39
|
45
|
9
|
44
|
12
|
28
|
25
|
22
|
33
|
8
|
35
|
19
|
20
|
54
|
2
|
5
|
55
|
37
|
22
|
23
|
32
|
|
9
|
36
|
24
|
25
|
22
|
23
|
5
|
28
|
16
|
44
|
43
|
43
|
9
|
1
|
25
|
21
|
2
|
46
|
55
|
66
|
25
|
52
|
2
|
46
|
군집분석 과정에서는 원데이터를 사용하기도 하지만 변숫값의 범위가 다르므로 원데이터를 z 값으로 표준화하여 사용하는 것이 바람직하다고 알려져 있다(조대헌, 2013). 원데이터를 사용할 경우 다른 시군구 대비 값이 매우 큰 소수의 시군구가 군집을 이루는 경우(예를 들면, 주간 인구 지수 등이 사용될 경우 서울 중구, 서울 종로구 등이 극소수의 시군구가 군집을 이루는 경우 발생)가 많았다(표 11). 또한, K-means 군집분석 방법의 경우 원데이터보다 표준화 값을 사용한 경우 분리도가 증가하여 더 많은 군집으로 구분하는 것이 가능하다고 판단 된다(그림 1).

그림 1.
방법 11에 의한 K-means 분석의 거리 제곱 합 (좌: 원데이터 사용, 우: z 값 사용)
K-means는 군집의 개수에 따라 데이터의 군집이 다르게 나타나므로 위계를 가지지 않지만, 계층적 군집분석은 계층의 수를 증가함에 따라 군집이 위계를 가지면서 계층적으로 변화하므로 군집의 의미를 설명하기에 용이하였다. 계층적 분류 방법의 경우 덴드로그램을 이용하므로 군집수가 1개 늘어날 때마다 군집 중 하나에서 분화되어 1개 더 많은 군집을 형성한다. 표준화 값을 사용한 표를 예를 들면, 방법11 중 8 군집으로 분류된 경우의 군집값 6에 해당하는 시군구 49개가 9 군집으로 분류된 경우의 군집값 6(16개)과 군집값 7(33개)로 분화되는 것을 알 수 있다(표 11과 그림 7). 반면, K-means 분류 방법은 통곗값에 기초하여 평균과의 거리 제곱의 합을 최소로 하는 군집에 할당하므로 이러한 분화를 나타낼 수 없었다. 또한, 계층적 분류에 비해 소수의 시군구가 군집을 이루는 경우도 많았다. 위의 두 상황을 종합했을 때 표준화 값을 사용한 계층적 분류 방법으로 지역을 구분하는 것이 타당한 것으로 판단된다.
V. 방법별 군집분석 결과
표준화 값을 사용한 계층적 분류 방법의 비교를 통해 군집분석 결과를 시각화하여 시군구를 구분하고자 한다. 여기에서는 대표적으로 9개의 군집으로 구분한 방법 1, 방법 8, 방법 11의 군집분석 결과를 나타냈다.
1. 방법 1에 의한 군집분석 결과
방법 1은 2개 변수(전체 1인 가구 비율과 전체 주간 인구 지수)를 이용하여 구분하는 방법이다, 9개 군집으로 구분은 하였으나(그림 2), 2개 변수를 이용하여 9개의 군집을 나타내기에는 다소 무리가 있다. 예를 들면, 다른 성격의 시군구가 하나의 군집이 되는 경우 발생하게 되는데 군집값 4의 경우 1인 가구 비율이 시군구 평균보다 높은 군 지역과 도시 지역이 하나의 군집에 속하는 경우가 발생하는 등 군집분석의 결과가 만족스럽지 못하다(그림 3). 이에 따라 군집의 명칭을 명명할 수 없으므로 군집번호로만 군집을 구분하여 지도로 제작하였다(그림 4).

그림 2.
방법1에 의한 계층적 군집분석 결과

그림 3.
방법 1의 군집값 4에 속하는 시군구

그림 4.
방법 1에 의한 계층적 군집분석
이처럼 군집분석의 결과가 지역을 구분하는 데 있어서 만족스럽지 못한 결과가 나타나는 것은 방법 1에서 방법 7까지 공통으로 나타났다. 이는 변수의 개수가 적거나 1인 가구의 비율만으로는 지역을 구분하는 데 있어 한계가 있음을 나타낸다. 이에 반해, 성별, 혼인상태별 1인 가구 비율과 주간 인구 성비, 상주인구 성비 등 다양한 변수가 포함된 방법 8~방법 11까지는 인구 특성에 따라 시군구를 구분하는 것이 가능했다.
2. 방법8에 의한 군집분석 결과
방법 8은 성별, 혼인상태별 1인 가구 비율과 상주인구 성비, 주간 인구 성비 등 총 9개의 변수에 의해 지역을 군집화하는 방법이다. 방법 8에 의하면 군집마다 공통적인 특성에 따라 군집의 이름을 명명하는 것이 가능하였다. 방법 8의 덴드로그램에 의하면 일차적으로 군집은 전통적인 군 지역과 도시 지역으로 양분되었으며 세분화될 수 있었으며(그림 5) 이를 지도화하였다(그림 6). 방법 9 역시 방법 8과 비슷한 군집분석 결과를 나타내 전통 군 지역과 도시 지역으로 지역을 구분한 후 점차 지역을 세분화하였다.

그림 5.
방법 8에 의한 계층적 군집분석 결과

그림 6.
방법 8에 의한 계층적 군집분석
3. 방법 11에 의한 군집분석 결과
방법 11은 표 11에 나타난 것처럼 15개 변수를 모두 이용하여 분석하는 것이고, 그림 7은 그 결과를 지도화한 것이다. 방법 8에 의한 그림 6과 방법 11에 의한 그림 7은 비슷한 듯 보이지만 세부적으로는 차이가 크다. 방법 11에서는 본 연구에서 조작적 정의를 한 주간 성비 지수를 군집분석에 이용하였으며, 군집분석 결과를 살펴보면 이 방법은 일차적으로 지역을 성비에 의해 크게 양분하였다(그림 8). 방법 10도 방법 11과 마찬가지로 주간 성비 지수가 포함되어 그 결과가 방법 11과 유사하게 지역을 크게 성비에 의해 양분하였으며, 여기에서는 방법 11을 사례로 결과를 설명하고자 한다.

그림 7.
방법11에 의한 계층적 군집분석

그림 8.
방법11에 의한 계층적 군집분석 결과
양분된 지역 중 하나는 고정적 성비 지역이었으며, 다른 하나는 유동적 또는 불균형 성비 지역이었다. 고정적 성비 지역은 총 116개 시군구가 속했으며 주간 성비와 상주 성비의 차이가 크지 않은 지역으로 대부분 소비/주거 지향 기능이 강한 지역이었다. 유동적/불균형 성비 지역은 총 134개 시군구가 속했으며 유동적 성비 지역은 주간 성비와 상주 성비의 차이가 큰 지역으로 대부분 업무/제조 기능 지역이었고, 불균형 성비 지역은 전통적인 군 지역으로 농업 기능 지역에 해당하였다. 이런 과정을 거쳐 총 9개의 지역으로 군집을 명명하였다.
방법 8보다 방법 11은 군집을 이루는 시군구가 동일한 성격을 가지는 경향이 매우 뚜렷했다. 이는 본 연구에서 사용된 주간 성비 지수를 이용했기 때문이라 판단된다. 즉, 주간 인구 성비 / 상주인구 성비를 사용함으로써 남자 주간 인구 지수만 높은지를 판단하는 것이 가능했기 때문이라 판단된다. 실제로 남자 주간 인구 지수가 높지만, 여자 주간 인구 지수도 동시에 높은 지역의 경우 소비 중심 지역이 많았다.
4. 방법 간 비교
11개 방법을 사용한 군집분석 결과를 비교하면 방법 간 군집분석 결과의 차이가 두드러지게 나타난다. 방법 1은 변수가 다양하게 사용되지 못하여 군집을 나눌 수는 있었지만 군집별로 유사한 성격을 갖는 군집명을 부여하기 어려웠다. 1인 가구 비율을 이용한 방법 2 - 방법 4와 주간 또는 상주인구 만을 고려한 방법 5~방법 7 또한 분석 결과를 나타내지는 않았지만 군집명을 부여하지는 어려웠다. 반면 방법 8~방법 11은 군집명을 부여할 수 있었으며, 방법 8과 방법 9는 일차적으로 전통적인 군 지역과 도시 지역으로 양분되었다. 반면, 주간 성비 지수를 사용한 방법 10과 방법 11은 일차적으로 고정적 성비 지역과 유동적/불균형 성비 지역으로 양분되었다.
표 12는 방법 1, 방법 8, 방법 11에 의한 군집의 사례를 보여주고 있다. 표 12에서 볼 수 있듯이 전체 1인 가구 비율과 전체 주간 인구 지수만을 사용한 방법 1에서 경기 수원 장안구, 경기 수원 영통구, 전북 김제시, 전남 영암군이 하나의 군집으로 구분되는 것은 적절하지 못하다는 것을 알 수 있다. 또한, 주간 성비 지수가 사용되지 않은 방법 8에서는 서울 강동구가 중심업무지역으로, 경기 수원 영통구가 구도시 지역으로, 충북 옥천군이 일반 도시 지역으로, 전남 영암군이 일반 농촌 지역으로 구분되는 등 일반적인 지역에 대한 인식과는 괴리가 있는 구분이 되는 것을 알 수 있다. 이에 반해 주간 성비 지수를 사용한 방법 11은 비교적 일반적인 지역에 대한 인식과 일치하는 것을 알 수 있다.
일반적으로 지역은 도시와 비도시로 구분될 수도 있고, 기능에 따라 생산 지향 기능과 주거/소비 기능으로 구분될 수도 있다. 본 연구를 통해 여러 방법으로 군집분석을 수행한 결과, 도시와 비도시 지역으로 지역을 구분하는 관점에서 벗어나 본 연구에서 제안한 주간 성비 지수를 이용하면 지역을 기능에 따라 구분하는 것이 가능하다는 점을 보여주고 있다.
표 12.
방법별 시군구의 군집 사례
|
시군구 순서
|
시군구명
|
방법1
|
방법8
(주간성비지수-없음)
|
방법11
(주간성비지수-있음)
|
|
1
|
서울 종로
|
군집1
|
군집1-중심업무지역
|
군집1-중심업무지역
|
|
2
|
서울 중
|
군집1
|
군집1-중심업무지역
|
군집1-중심업무지역
|
|
3
|
서울 용산
|
군집6
|
군집3-주거지역
|
군집2-청년소비지역
|
|
25
|
서울 강동
|
군집2
|
군집1-중심업무지역
|
군집4-주거중심지역
|
|
26
|
부산 중
|
군집5
|
군집2-구도시지역
|
군집1-중심업무지역
|
|
37
|
부산 강서
|
군집5
|
군집1-중심업무지역
|
군집1-중심업무지역
|
|
49
|
대구 달성
|
군집7
|
군집5-일반도시지역
|
군집5-주거특화지역
|
|
50
|
인천 중
|
군집5
|
군집2-구도시지역
|
군집1-중심업무지역
|
|
76
|
경기 수원장안
|
군집4
|
군집2-구도시지역
|
군집4-주거중심지역
|
|
79
|
경기 수원영통
|
군집4
|
군집2-구도시지역
|
군집2-청년소비지역
|
|
117
|
경기 양평
|
군집4
|
군집8-생산농촌지역
|
군집7-일반생산지역
|
|
118
|
강원 춘천
|
군집8
|
군집6-생산도시지역
|
군집4-주거중심지역
|
|
125
|
강원 홍천
|
군집3
|
군집7-일반농촌지역
|
군집8-원교생산지역
|
|
143
|
충북 옥천
|
군집5
|
군집5-일반도시지역
|
군집7-일반생산지역
|
|
151
|
충남 천안서북
|
군집8
|
군집6-생산도시지역
|
군집2-청년소비지역
|
|
172
|
전북 김제
|
군집4
|
군집9-고령농촌지역
|
군집9-농촌지역
|
|
195
|
전남 영암
|
군집4
|
군집7-일반농촌지역
|
군집8-원교생산지역
|
|
206
|
경북 김천
|
군집5
|
군집5-일반도시지역
|
군집7-일반생산지역
|
|
232
|
경남 거제
|
군집5
|
군집5-일반도시지역
|
군집6-특화생산지역
|
|
250
|
제주 서귀포
|
군집3
|
군집7-일반농촌지역
|
군집7-일반생산지역
|
VI. 결론
지역을 구분하는 것은 지역을 대상으로 하는 학문의 큰 연구 주제이다. 1인 가구의 증가와 직장과 주거의 분화로 인한 상주인구와 주간 인구의 차이가 증가하는 것은 우리나라 인구 구조의 변화를 가장 잘 나타내주는 요소이다. 본 연구에서는 1인 가구과 주간 인구 통계데이터를 이용하여 우리나라 시군구에 대한 군집분석을 실시하고자 하였다. 성별, 혼인상태별, 연령대별 1인 가구 데이터와 성별, 연령별 주간 인구와 상주인구 데이터에 대한 상관분석을 통해 15개의 변수를 추출하였다. 군집분석 방법은 사용변수별 11개, 군집 수 구성별 8개, 입력 데이터의 형식별 2개, 군집분석 방법 2개를 조합하여 총 352회의 군집분석을 실시하였으며, 분석에는 통계 소프트웨어는 R을 사용하였다. 이 중 표준화 값을 사용하여 계층적 분류 방법으로 9개 지역으로 지역을 구분한 결과를 덴드로그램 및 지도로 나타내어 비교・분석 하였다. 군집분석 결과는 방법별로 상이하게 나타났으며 그 결과를 요약하면 다음과 같다.
첫째, 군집분석 결과 1인 가구 비율과 주간 및 상주인구 변수가 충분히 이용될 경우 군집분석에 의해 생성된 군집의 명칭을 명명할 수 있었다. 전체 1인 가구 비율과 전체 주간 인구 지수만을 사용한 방법 1, 1인 가구 비율만을 사용한 방법 2~방법4, 주간 및 상주인구 변수 만을 사용한 방법 5~방법 7은 군집의 명칭을 명명하기 곤란하였다. 반면, 1인 가구 비율과 주간 및 상주인구 변수를 충분히 사용한 방법 8~방법 11은 군집의 명칭을 부여할 수 있었다.
둘째, 주간 및 상주인구 관련 변수 중에는 본 연구에서 제안한 주간 성비 지수가 지역을 기능에 의해 구분하는 중요한 변수로 작용하였다. 주간 성비 지수를 사용하지 않은 방법 8과 방법 9는 지역을 도시와 비도시로 구분한 후 계층적으로 구분하기 때문에 지역의 기능에 따른 구분이 되지 못하였다. 반면, 주간 성비 지수를 사용한 방법 10과 방법 11은 지역의 기능에 따른 구분이 가능하였다. 또한, 방법 8보다 방법 11에서 비교적 일반적인 지역에 대한 인식과 일치하게 지역이 구분되는 것을 알 수 있었다.
본 연구는 주간 성비 지수를 이용하여 지역을 기능에 따라 구분하는 실험적인 연구를 수행한 것에 의의가 있다. 다시 말해 지역의 인구를 상주인구로 간주하는 관점을 벗어나 주간 인구를 중심으로 지역의 특성을 파악했다는 점에 의의가 있다. 향후, 거주지와 근무지를 파악할 수 있는 마이크로 통계데이터 등을 이용하여 권역별로 보다 상세한 수준에서 권역 내에서 지역의 기능을 구분하는 연구가 진행되어야 할 것이다.