I. 서론
II. 생성형 인공지능 서비스 특성과 발전과정
1. 생성형 인공지능 서비스
2. 생성형 인공지능 서비스 비교
III. 지방소멸 선행연구 검토 및 실험결과
1. 지방소멸의 개념
2. 주요어 빈도 변화
3. 응답결과
IV. 사례분석: 강원도 횡성군 지방소멸 대응방안
V. 결론 및 시사점
I. 서론
생성형 인공지능 서비스(Generative AI, 이후 생성형 AI)는 지난 2022년 11월 OpenAI에서 개발한 Chat Generative Pre-trained Transformer(이후 ChatGPT)가 처음 공개된 이후 2023년 5월 10일 Google에서 개발한 대화형 인공지능 모델(Language Model for Dialogue Applications)을 사용한 Bard가 서비스되면서 그 활용 가능성과 응답의 신뢰성에 관한 논의가 활발히 진행되고 있다(Castelvecchi, 2022; Coeckelbergh and Gunkel, 2023; Lund et al., 2023; Teubner et al., 2023; Tsigaris and Teixeira da Silva, 2023). ChatGPT와 Bard는 사용자가 수행 조건(specific task condition)이 포함된 질문과 요청사항(prompt, 이후 프롬프트)을 입력하면, 이를 인식하여 문맥에 적합한 문장으로 답변을 제공한다. 생성형 AI는 빠른 응답속도와 구체적인 답변을 제공하는 편리함과 유용성으로 인해 다양한 분야의 활용이 빠르게 확산되고 있다. 나아가 프로그래밍 언어와의 결합을 통한 단순 반복 작업의 업무 자동화(Robotic Process Automation, RPA)와 전문지식이 필요한 연구자가 수행하는 자료 수집, 정리, 오류 검토 등 연속적인 업무에 이르기까지 그 활용범위가 점차 확대되고 있다.
하지만 이러한 생성형 AI의 유용성에도 불구하고 학술연구 영역에선 생성형 AI 응답결과의 불명확한 출처 등과 같은 현상에 따른 신뢰성 문제가 제기되고 있다(Stokel-Walker and Van Noorden, 2023). 예컨대 저명한 국제학술지인 Nature에서는 최근 사설을 통해 학술지 투고 시 연구자는 생성형 AI를 연구에 사용한 점을 밝혀야 하며, 불분명한 책임소재로 인해 생성형 AI는 공저자로 포함할 수 없다는 원칙이 새롭게 가이드라인에 반영되었음을 밝혔다(Nature, 2023). 이러한 단점에도 불구하고 광범위한 문헌으로부터 함축된 정보를 제공할 수 있기에 연구자의 중요한 도구로써 지식 재생산에 기여할 것으로 전망되고 있다(Hosseini et al., 2023).
이에 본 연구에서는 생성형 AI가 지역현안을 탐색하고 이러한 이슈에 대한 방안을 탐색할 수 있는 보조도구로써의 활용 가능성을 탐색하고자 한다. 특히, 현재 우리나라에서 가장 큰 이슈 중 하나라고 인식되고 있는 지방소멸 및 인구감소(행정안전부, 2021)에 대한 현안에 대한 탐색과 이에 대한 해결방안에 대해서 생성형 AI를 활용해보고자 한다. 즉, ① 지방소멸의 정의, ② 지방소멸 위기 지역, ③ 지방소멸 해결방안에 대한 프롬프트를 작성하고, 제공된 응답결과의 검토를 통해 생성형 AI별 특성 및 그 유용성에 대한 정성적인 평가를 진행하였다. 지방소멸을 본 연구의 실험주제로 선택한 이유는 다음과 같다. 우리나라의 지방소멸 위기는 심각성에도 불구하고 방지를 위한 노력이 행・재정적 지원 및 사업발굴에 치우쳐 있다(이원도 등, 2023a). 또한, 지역 인구감소 문제는 인구분포의 공간적 양극화 심화로 인한 지방소멸 문제와 함께 저출산, 초고령화에 따른 인구 규모의 감소로 인한 문제가 혼재되어 있다. 이에 따라 지방소멸 개념정립과 함께 등장 배경과 지역에 미치는 영향을 고려한 해결방안이 요구된다. 이러한 배경에서 생성형 AI는 지방소멸 위기 대응을 위해 새로운 접근방식과 정책방향 설정에 중요한 시사점을 제공할 수 있을 것으로 기대되어 본 연구에서 실험을 진행하였다.
또한 생성형 AI가 지방소멸의 개념을 정확히 인식하여 정확하고 신뢰성 있는 응답결과를 제공하는지에 대한 평가가 필요하다. 왜냐하면 이러한 평가를 통해 생성형 AI가 지역현안의 탐색과 해결방안 도출을 위한 보조도구로써 활용될 수 있는지를 확인할 수 있기 때문이다. 이를 위해 본 연구에서는 지방소멸에 대한 개념정립을 위하여 이론적 배경을 검토하였고, 유사한 개념인 축소도시와의 발생지역과 원인에 대한 차이점을 비교하였다. 이후 정립된 개념을 바탕으로 실험을 진행하였다. 또한, 실증연구를 위하여 인구감소지역에 포함된 기초 지방자치단체(이후 지자체) 중 사례지역(강원도 횡성군)을 선정하여, 지자체의 지방소멸 위기 극복 노력을 생성형 AI가 인지하는 지와 사용자의 적극적인 개입(예: 프롬프트 엔지니어링)이 응답내용의 질적 수준에서 어떠한 영향을 미치는지를 추가적인 실험을 통해 확인하였다. 프롬프트 엔지니어링은 생성형 AI를 보다 효율적으로 활용하기 위해 원하는 결과값에 최대한 가까워지도록 사용자의 적극적인 개입을 하는 것을 의미하며, 이를 토대로 생성형 AI의 효용성이 증가하기도 한다(강옥주, 2023).
본 연구의 구성은 다음과 같다. 2장은 생성형 AI의 특성과 사용된 언어모델에 대하여 정리하였다. 3장은 실험주제인 지방소멸 관련 프롬프트를 통해 얻은 응답결과를 바탕으로 실험결과를 정리하였다. 4장은 사례지역의 프롬프트 수정 전・후의 응답결과를 비교하여 프롬프트 엔지니어링 기술이 응답내용의 질적 수준에 미치는 영향을 확인하였다. 마지막으로, 5장은 실험결과를 요약하고, 정책연구에서 생성형 AI 활용 가능성과 주의사항을 제언하는 토의를 진행하였다.
II. 생성형 인공지능 서비스 특성과 발전과정
1. 생성형 인공지능 서비스
인공지능은 인간의 지능으로 수행되어야 하는 행위들을 컴퓨터와 같은 기계가 할 수 있도록 하는 기술이라고 할 수 있다. 이러한 인공지능이 처음 등장한 이후에 컴퓨터가 데이터를 학습하여 데이터에서 특정 패턴을 찾으며, 이를 기반으로 결과물을 도출해내는 기계학습(혹은 머신러닝, machine learning)이라는 개념이 등장하였다. 이후 모델을 훈련하는 등의 과정을 기계가 직접 인공신경망을 통해 실시하는 딥러닝(deep learning)이 등장하게 되었다(양지훈・윤상혁, 2023). 이러한 인공지능 및 머신러닝 기술의 진화를 통해서 만들어 진 것이 바로 최근의 생성형 AI라고 할 수 있다.
생성형 AI는 사용자가 플랫폼과 대화하는 것과 유사한 상호작용 방식을 통해서 사용자가 원하는 질의에 대한 응답이 가능하도록 훈련된 언어모델을 기반으로 하고 있다. 이러한 언어모델은 자연어 처리 작업(Natural Language Processing, NLP)을 통해 사용자의 질의에서 의도를 파악하고, 문제를 인식하여, 이후 사전 학습된 데이터에서 가장 연관성이 높은 정보를 검색하여 답안을 제시한다. (Kocoń et al., 2023; Hill-Yardin et al., 2023). 즉, 대규모의 데이터를 기반으로 학습된 언어모델을 바탕으로 대화를 주고받는 방식을 통해 간단한 질문, 어려운 개념 요약, 코딩, 글쓰기 등 다양한 작업에 활용할 수 있는 서비스라고 할 수 있다(Thorp, 2023).
최근 생성형 AI를 활용한 연구에서 생성형 AI의 학술적인 활용에 대한 유용성을 확인할 수 있다. McGee(2023)는 미국의 2050년 전망과 관련한 프롬프트의 응답결과 검토를 통해 향후 AI 기술은 광범위한 범위의 데이터를 바탕으로 더욱 정교한 미래 예측이 가능해질 것으로 시사하였다. Kim and Lee(2023)는 미국과 캐나다의 교통 현안과 해결방안에 대한 프롬프트를 통해 생성형 AI가 시의성 있는 현안과 구체적인 문제해결 대안을 답변하였음을 확인하였다. 다만, 유재진(2023)과 김성근(2023)의 ChatGPT를 활용한 실험에서 주요어 패턴에 기반하여 요약된 정보와 종합적인 현황 파악에는 유용성을 보였지만, 분석・평가 과정을 통한 정보의 사실 확인 및 시사점 도출에는 한계가 있음을 밝혔다.
이러한 생성형 AI는 인공신경망 알고리즘을 기반으로 데이터의 흐름, 패턴의 특성과 탐색에 활용되고 있다. ChatGPT와 Bard와 관련된 기술에 대한 간단한 발전과정은 다음과 같다. 이러한 모델의 발전은 처음 1980년대의 순방향 신경망과 역전파(Feedforward Neural Networks and Backpropagation, FNNs), 1990년 대의 순환신경망(Recurrent Neural Networks, RNNs)를 거쳐, 장단기 메모리(Long Short-Term Memory, LSTM), 2010년대의 Seq2Seq(Sequence to Sequence) 등으로 발전되어 왔다. 이러한 Seq2Seq의 모델의 성능을 높인 것이 2017년에 개발된 Attention 메커니즘을 적용한 Transformer 모델이다. 이후 대부분의 언어모델은 Transformer를 기반으로 확장되어가고 있는데, ChatGPT가 이를 활용하고 있다(Liu et al., 2023).
2. 생성형 인공지능 서비스 비교
본 연구에선 앞서 밝힌 것처럼 ChatGPT와 Bard를 활용하여 실험을 진행하였다. 두 서비스는 공개된 이후 높은 접근성과 범용적인 활용이 가능하여 빠른 속도로 사용이 확대되고 있다. 두 서비스의 대표적인 특징은 다음과 같다(표 1). Bard는 ChatGPT에 비해 원천자료가 최신화되어 있으며, 실시간 웹 검색이 가능하다는 장점1)이 있다. 또한, Bard는 음성으로 질의할 수 있으며, 응답결과를 워드 혹은 엑셀과 같은 포맷으로 내보내기가 가능하지만, ChatGPT는 제한된 방식을 통한 질의수행과 응답결과가 제공되고 있다. 두 서비스 모두 이미지(사진)를 활용한 프롬프트가 가능하다.
III. 지방소멸 선행연구 검토 및 실험결과
1. 지방소멸의 개념
일본의 지방소멸 담론은 장기적인 인구감소 추세와 수도권 집중에 따라 가시화된 비수도권 지역, 즉 지방의 인구위기 상황을 강조하기 위해 사용되었다(김정환 역, 2015; 김현호 등, 2021). 이러한 지방소멸 위기는 청년인구 유출이 주요 원인으로 지목되고 있다. 지역 인구구조의 급격한 변화는 인구규모에 대한 안정성에 악영향을 미치며, 악순환의 반복을 거쳐 지역의 관리역량이 감소가 나타나 적정 수준의 인구규모 유지가 힘들게 된다. 이러한 인구학적 쇠퇴 단계까지 도달한 지역은 빈집이 증가하고 결국 지방소멸의 최종단계인 한계취락지(혹은 무거주지)로 전락하게 된다(Feldhoff, 2013; Jeon and Kim, 2020). 청년인구의 주요 유출지역인 일본 열도 남부(주고쿠, 규슈, 시코쿠 지역)에선 1960년대부터 그 위험성이 경고되었으며, 1980년대에는 대부분의 비수도권 지역까지 위기가 고조되었다(Wirth et al., 2016).
지역 인구감소는 지역사회의 다양한 문제점을 일으킨다. 하지만 이로 인한 문제점과 현상들은 세부적인 특성(예: 발생지역과 배경)에 차이가 존재한다. 대표적으로 축소도시는 탈산업화 이후 변화된 경제 여건에 적응하지 못해 쇠퇴하거나, 교외화로 인해 도심에서 인구와 자원이 도심지 외곽으로 유출된 도시지역2)에서 주로 관측되고 있다(Pallagst et al., 2021; Alves et al., 2016; Haase et al., 2016). 반면에 지방소멸 위기는 (냉전시대 이후) 중앙집중형 발전정책을 추진했던 대한민국, 일본, 중국 등에서 관측되고 있다. 지방소멸은 더 나은 정주여건과 일자리 기회를 제공하는 수도권 지역의 인구과잉과 비수도권 지역의 인구과소에 따른 인구의 양극화 및 고착화의 심화가 주요 배경으로 논의되고 있다(Heuishilja, 2018; 이원도 등, 2023b). 즉, 대도시권(수도권)으로의 집중과 이에 따라 (비수도권) 지방과의 인구 불균등 문제 심화가 청년인구 유출과 지역경제 침체를 더욱 가속화시켜, 지역의 인구절벽 위기가 나타나고 있다는 것이다(이철희・황영지, 2022). 특히 일본과 우리나라는 수도권을 제외하고 최근 2000년대 이후 농어촌 지역과 지방 중소도시가 모두 소멸 위기를 경함하고 있다는 점에서 유사성을 보인다.
이러한 이론적 배경과 함께 최근 지방소멸에 관한 사전적 개념정립(정성호, 2019) 및 제도적 대응(문병효, 2021; 김남욱, 2022)에 관한 연구와 함께 공공 및 민간 빅데이터 자료를 활용한 위기 지역 유형화와 특성 분석(이민주 등, 2023; 이원도 등, 2022a; 이원도 등, 2022b; 이원도 등, 2023b)과 같이 인구감소시대에 지역이 새롭게 경험하고 있는 지방소멸 위기와 대응에 관한 연구가 활발히 진행되고 있다. 관련 연구 검토를 통한 지방소멸 용어는 다음과 같이 사전적으로 정의할 수 있다.
“(수도권 집중이 심화된 국가에서 지속적인) 청년인구 유출심화로 인해 지역쇠퇴가 진행되어, 회복(resilience)이 어려운 상태로 지역 역량이 감소하여 지역 체계의 붕괴가 우려되는 현상”
이후 해당개념은 생성형 AI가 지방소멸의 개념이 제대로 인식하여 응답결과를 제공하는지에 대한 정성적 평가의 기준으로 활용되었다.
2. 주요어 빈도 변화
ChatGPT와 Bard을 활용한 실험에선 지방소멸의 정의, 위기 지역, 해결방안에 관한 프롬프트 작성을 통해 획득한 응답결과를 검토하였다. 먼저, 두 서비스의 응답내용에 대한 일관성을 확인하기 위해 세 번 반복하여 획득한 응답결과의 길이와 주요어 빈도를 확인하였다 (표 2).
표 2.
ChatGPT와 Bard의 응답에 대한 일관성 평가(단위: 단어(개))
먼저, ① 지방소멸의 정의에 대해 ChatGPT는 평균 161단어, Bard는 평균 126단어의 응답결과를 제공하였다. 단어 사용 편차(deviation)는 ChatGPT에 비해 Bard가 다소 높게 나타났다. 반면에 ② 지방소멸 위기 지역에 대해 ChatGPT는 평균 103단어, Bard는 평균 141 단어로 응답결과를 제공하였는데, 첫 번째와는 상반되게 Bard의 응답이 다소 길게 나타났고, 반복적으로 실시한 프롬프트의 응답결과에서 단어 사용 수의 편차도 다소 높게 나타났다. 마지막으로 ③ 지방소멸 해결방안에 대해 ChatGPT는 평균 317단어, Bard는 평균 129단어로 응답결과를 제공하였다. 요약하자면, ChatGPT의 응답결과가 상대적으로 길었고, 반복된 응답결과에서 주요어 편차 또한 높은 것으로 나타났다. 이후 본 연구에서는 세 가지 프롬프트에 대한 ChatGPT와 Bard의 응답결과에 대한 정성적인 평가를 수행하였다.
3. 응답결과
1) 지방소멸의 정의
두 서비스 모두 공통으로 “인구감소가 원인, 지역경제 침체현상, 지역 활성화 방안 필요”를 포함하여 지방소멸 용어를 정의하고 있다. 하지만 발생원인과 대응방향에 대해선 차이를 보였다(표 3). 이를 살펴보면, ChatGPT는 “일본에서 유래, 지속적인 인구감소와 노령화 심화가 원인, 행정능력의 약화와 경제적인 침체현상”으로 지방소멸 위험성 및 지역 주도형 해결방안을 강조하였으며, Bard는 “인구감소에 따른 지역경제 침체, 지역 산업구조 변화와 수도권으로의 인구집중이 원인”으로 인구구조 변화에 따른 지역경제 환경이 주된 원인이라는 것과 다양한 정책수립의 필요성을 제시하였다.
표 3.
지방소멸 정의에 대한 ChatGPT와 Bard의 응답결과 비교
하지만 ChatGPT는 Bard와 달리 수도권 집중이 지방소멸 위기의 주요한 사회적 배경임을 인식하지 못하였으며, 총인구 감소와 고령화를 주요 원인으로 인식하고 지방소멸 대응방안을 제시했다는 점에서 앞서 선행연구의 검토내용과는 차이가 나타났다. 이러한 차이는 ① 선행연구에서 (지방소멸) 용어에 대한 사전적 정의의 부재, ② 불명확한 출처를 통한 학습, ③ 불완전한 개념(지방소멸) 정립에 따른 부정확한 정보에 의한 것으로 보고되고 있다(Perkel, 2023). 이러한 불완전성으로 인해 현재 생성형 AI가 제공하는 전문적인 지식에 대해선 연구자의 추가적인 검증이 필요하며, 이후 응답결과를 활용하는 것이 적절하다는 주장이 있었다(Dwivedi et al., 2023).
이후 생성형 AI 응답결과에서 반복적으로 사용된 주요어가 상대적으로 높은 중요도를 지니고 있다는 선행연구(Kiim and Lee, 2023)를 참조하여, 실험적으로 응답결과의 복잡한 문장을 간단하고 직관적인 시각화 결과물(워드 클라우드, Word Cloud)로 작성하였다(그림 1). 프롬프트에 포함된 “지방”, “소멸”을 제외하고 ChatGPT는 “지역(23회)”, “정책(15회)”, “인구(13회)”, “경제(10회)”를, Bard는 “지역(46회)”, “인구(12회)”, “경제(12회)”, “문화(9회)”, “정책(9회)” 등의 주요어가 각각 높은 빈도로 나타났다.
2) 지방소멸 위기 지역
지방소멸 위험지역은 어디인가에 대한 프롬프트의 응답결과(표 4)에는 두 서비스 간에 다소 차이가 나타났다. ChatGPT는 “시간에 따라 유동적, 인구감소와 고령화가 심한 지역, 특히 경상도・전라도・강원도 일부 지역이 포함”을 위기 지역으로 선정했지만, Bard는 `22년 기준으로 인구감소율이 전국 평균(-0.6%)보다 강원(-1.1%)과 경북이(-1.0%) 더 낮음을 지적하며, 주로 농어촌, 도서 지역이 위험지역이라고 밝혔다. 이에 더하여, Bard는 10년 후, 인구가 50% 이상 감소할 것으로 예상되는 지역은 전국 596개의 시군구이며, 광역시도 별 위험에 처한 기초 지자체의 수를 포함하여 응답하였다. 또한, Bard는 ChatGPT에 비해 지방소멸 위기 지역에 관한 내용과 함께 앞선 지방소멸의 정의와 위험성에 관한 내용을 함께 포함하여 응답결과를 제공하였다.
표 4.
지방소멸 위험지역에 대한 ChatGPT와 Bard의 응답결과 비교
하지만 세부내용에선 다음과 같은 한계점이 나타났다. ChatGPT는 지방소멸에 직면한 지역을 선정한 기준과 출처에 대해 밝히지 않았고, Bard는 근거를 밝혔으나 광역시도 내 구체적인 위기 지자체(시군구명)를 밝히지 않았다. 또한 현재 우리나라의 시군구 개수는 총 260개이지만 596개의 시군구로 구성되어 있다고 잘못된 근거를 제시하였다. 특히, 두 서비스 모두 정부가 지방소멸 위기에 적극적으로 대응하고자 지정한(`21년 10월) 89곳 기초 지자체로 구성된 인구감소지역(행정안전부, 2021)(표 5) 에 관한 내용이 응답결과에 포함되지 않았다.
생성형 AI가 이러한 응답을 제공한 이유는 정성적으로 인구감소 위기의 대응과 관련한 연구가 저출산과 고령화에 초점이 되어 있으며, 지방소멸의 개념정립과 그에 따른 위기 지역선정과 관련한 연구들이 미흡한 점과 관련이 있다고 판단된다. 이러한 한계점은 지방소멸 방지를 위해 지정된 인구감소지역(행정안전부, 2021)이 생성형 AI가 지방소멸 위기 지역으로 인식하지 못하고 있음을 통해 드러났다. 향후 연구에서는 이러한 사실관계를 훈련된 데이터를 활용해서는 인식할 수 없는 것인지, 혹은 지방소멸 위기 지역 판단에 필요한 자료가 추가되어야 하는지, 아니면 인과관계 및 현황파악을 할 수 있게 더 많은 연구가 생산되어 훈련 데이터에 포함되어야 하는지에 대한 검증을 통해 생성형 AI의 실효성을 판단할 수 있는 연구가 또한 필요하다.
표 5.
행정안전부(2021)에서 지정한 인구감소지역 현황
3) 지방소멸 해결방안
지방소멸 해결방안에 대해 ChatGPT와 Bard는 각각 7가지, 5가지의 방안을 응답결과에 포함하였다 (표 6 참조). ChatGPT는 ① 지방재정 지원 강화, ② 지방분권 및 지역특성 고려, ③ 지역 활성화 정책, ④ 지방 인프라 개선, ⑤ 인구 유입 정책, ⑥ 교육 및 인력 양성, ⑦ 협력과 네트워크 강화와 같은 지역 특성을 고려한 맞춤형 정책의 개발과 실행을 강조하였다. 반면에 Bard는 ① 지역의 특색을 살린 지역경제 활성화 정책 추진, ② 지역의 청년들이 지역에서 정착할 수 있는 여건 조성 ③ 지역의 문화를 보존하고 지역의 공동체를 활성화하는 노력, ④ 지방소멸에 대한 인식개선, ⑤ 지방소멸에 대한 정책 수립 및 추진을 방안으로 제시하였다. 하지만 두 서비스 모두 앞서 밝힌 것처럼 지정된 인구감소지역에서 정부의 행・재정적 특례지원을 위한 지방소멸대응기금(행정안전부, 2021)에 관한 내용이 포함되지 않았다.
표 6.
지방소멸 해결방안에 대한 ChatGPT와 Bard의 응답결과 비교
선행연구 고찰에서 도출하였던 지방소멸의 주요 원인과 문제점을 두 서비스 응답결과와 비교하여 정성적인 평가를 수행한 결과는 다음과 같다. ChatGPT는 지방소멸을 지역 인구감소 문제와 동일시하여, 이를 해결하기 위한 포괄적인 대안을 제시하였으나, Bard는 지방소멸의 주요 원인이 청년인구의 유출과 그에 따른 인구감소이며, 지역사회의 지속 불가능성이 지방소멸 최종단계임을 인지하고 이를 방지하기 위해 지역특성을 고려한 경제 활성화와 청년들의 지역 정착을 위한 여건 조성을 위한 정책 수립과 실행을 제안하였다. 생성형 AI의 정책분야에 대한 실험(Mohammed et al., 2023)에서 평가한 두 서비스의 특성이 상이한 응답결과의 원인임을 짐작할 수 있다. 해당 연구에 따르면, Bard는 어려운 주제를 간단한 언어로 변환하여 더 정확한 데이터를 제공을 통한 상대적으로 문제해결에 장점이 있으며, ChatGPT는 응답결과 작성 때 사실 정보와 포괄적인 맥락을 조합하여 더 자연스러운 응답결과를 제공한다는 견해를 피력하였다.3)
예컨대, 생성형 AI를 활용한 문제해결 방안은 언어모델이 질의와 연관하여 어떠한 문헌 및 자료를 바탕으로 문제를 정의하고, 이를 바탕으로 학습하여 해결방안을 제시하는지에 따라 결과가 상이할 수 있다. 이에 본 연구에선 실험적으로 연구자가 프롬프트 엔지니어링 기술을 적용하여 수정한 프롬프트에 대해 생성형 AI가 더욱 신뢰성 있는 응답결과를 제공하여 주는지에 대한 평가를 사례분석(4장)에서 수행하였다.
지방소멸 해결방안에 대한 실험결과에서 ChatGPT와 Bard는 유사한 해결방안을 제시하였다. 지역특성을 고려한 지역경제 활성화 정책이 주요 대안으로 꼽혔다. 또한 지역의 생활여건 개선(예: 인프라 개선과 현대화)을 통해 청년인구의 유출을 막고 청년인구의 유입을 추구하는 것이 포함되었다. 한편, 흥미롭게도 Bard는 지방소멸에 대한 인식개선을 지방소멸 해결방안에 포함했다.
IV. 사례분석: 강원도 횡성군 지방소멸 대응방안
이후 연구에선 강원도 횡성군을 사례지역으로 실험을 추가로 진행하였다. 사례분석에선 인구감소지역 지자체의 지방소멸 위기 극복을 위한 전략과 대응방향에 대해 앞선 실험방식과 같게 ChatGPT와 Bard에 “지방소멸 위기 극복을 위한 강원도 횡성군의 전략과 대응방안은 무엇인가”에 대한 프롬프트를 3번 반복하여 받은 응답결과를 정성적으로 분석하였다.
사례지역인 강원도 횡성군은 e-mobility 사업을 2019년부터 전략사업으로 채택하여 추진하였으며(기획재정부, 2019), 인구감소지역으로 선정된 이후(2021년 10월) 지원된 지방소멸대응기금을 이에 투자하여, 지역 일자리 창출을 통해 지방소멸 방지에 적극적으로 대응하고 있다. 두 서비스의 응답결과, 사례지역의 지자체가 진행 중인 사업현황과 같은 구체적인 정보는 포함되지 않았으며, 보편적인 해결책 제시에 가까운 응답결과를 확인하였다(표 7).
표 7.
인구감소지역 사례지역 지방소멸 해결방안에 대한 ChatGPT와 Bard의 응답결과 비교
또한, 두 서비스 모두 강원도 횡성군의 지방소멸 대응 노력(예: 관련 시책 및 지방소멸대응기금 사업내용)을 응답결과에서 찾을 수 없었다. 다만, Bard는 횡성군이 전국평균과 비교하여 고령화와 청년인구 유출률이 높은 지역으로 지방소멸 위기 지역의 근거를 포함하였다. 이는 실시간 웹 검색을 통해 획득한 정보로 판단된다.
다음으로, 프롬프트 엔지니어링(Prompt engineering) 기술을 적용하여 재 작성된 프롬프트가 생성형 AI 응답결과에 미치는 영향을 살펴보았다. 프롬프트는 생성형 AI의 응답결과를 생성하기 위한 입력값이므로, 프롬프트 엔지니어링은 질의를 구성하는 자연어의 조합을 통해 학습된 언어모델로부터 높은 품질의 응답을 얻어낼 수 있는 질의문 작성기술로 정의할 수 있다(이경님・조은경, 2023). 특히, 수행할 작업을 구체적으로 지시하고, 더욱 명확한 질문과 함께 조건 및 필요한 맥락을 제공하여 생성형 AI가 요약 및 함축적인 정보 도출에 집중할 수 있도록 도와주는 플러그인(예: WebChatGPT4))도 개발되어 배포되고 있다.
본 연구에선 해당 플러그인을 통해 프롬프트를 재작성하였다. 수정된 프롬프트에선 중괄호 기호({ })를 사용하여 질문과 현재 날짜를 질의문 형태로, 또한 연구자가 관련 정보를 사전 검색하여, 선정한 웹 페이지와 이를 축약한 내용: 인구감소지역 선정(#1), 지방소멸의 원인(#2), 학계 대응방향(#3, #4), 지방소멸 위기 심각성과 지자체 노력(#5-#10)의 시작과 끝에 따옴표 기호(“ ”)로 강조하여 생성형 AI 언어모델이 이를 인식할 수 있게 하였다. 이후 재 작성된 프롬프트(표 8)를 각각 두 서비스에 입력하여 변경된 응답결과를 획득하였다(표 9 참조).
변경된 응답결과에서 ChatGPT는 횡성군이 e-mobility 사업과 발달된 교통망을 통한 공공기관 유치에 관한 내용을 정리하고, 출처를 사전 조건에 입력한 양식으로 포함하였다. Bard 또한 e-mobility 사업을 포함한 응답결과를 제공하였지만, 대응방향에 있어 구체적인 사업내용과 출처를 요구했던 양식에 맞게 포함하지 않았다. 예컨대 Bard가 제공한 응답결과의 활용을 위해선 프롬프트와 상호대조 하여 출처 확인 및 검증과 같은 추가적인 노력이 필요하다.
표 8.
프롬프트 엔지니어링 예시(강원도 횡성군의 지방소멸 위기 극복을 위한 전략과 대응방안)
표 9.
프롬프트 엔지니어링을 활용한 응답 결과(강원도 횡성군의 지방소멸 위기 극복을 위한 전략과 대응방안)
V. 결론 및 시사점
온라인에서 누구나 쉽게 대화하듯 입력한 프롬프트에 대해 빠른 속도로 응답결과를 제공하는 ChatGPT, Bard와 같은 생성형 AI가 서비스됨에 따라 인공지능 기술은 많은 분야에서 급격하게 보편화되고 있고 활용될 것으로 기대되고 있다. 이러한 생성형 AI는 학술연구 영역에서 연구자가 수행하였던 문헌검색의 범위를 확장하고, 이를 바탕으로 함축적인 정보작성과 시사점을 제공하여 연구 효율성을 높이고, 최신동향에 관한 빠른 이해를 도울 것으로 기대하고 있다(정한민・박정훈, 2023). 나아가 다른 분야에 대한 폭넓은 검색과 접목을 통해 복잡한 (사회) 문제해결에 필요한 새로운 접근방법과 대안 마련에 기여할 것으로 기대된다. 이러한 맥락에서 본 연구는 지역현안의 탐색 및 해결방안을 도출하기 위한 보조도구로써 활용될 수 있을지를 파악해보고자 하였다. 특히, 심각한 사회문제 중 하나인 지방소멸 대응방안 마련에 생성형 AI를 활용할 수 있을지를 실험을 통해 평가하였다.
본 연구에서의 실험은 ChatGPT와 Bard에 같은 프롬프트를 통해 얻은 응답결과를 분석하여 진행하였다. 프롬프트는 간단하게 지방소멸의 정의, 위기 지역, 해결방안 제시와 같은 질문내용으로 작성하였다. 실험결과, 같은 프롬프트여도 서비스의 특성에 따라 얻은 응답결과가 다른 것을 확인할 수 있었으며, 전문적인 지식이 요구되지 않는 범위에서 두 서비스의 응답내용은 어긋난 점이 없음을 확인하였다. 하지만 선행연구를 통해 검토된 내용을 참조하여 비교한 결과, 응답결과를 정책연구에 그대로 활용하는 것은 적절하지 않으며, 연구자의 적합성 검토가 추가로 필요하다고 제언하였다. 다만, 사례연구를 통해 프롬프트 엔지니어링과 같이 연구자의 개입이 이러한 한계점 개선에 대안으로 활용될 수 있음을 확인하였다. 즉, 연구자가 해당 분야에 대한 어느 정도의 이해도가 있을 경우에 프롬프트 엔지니어링을 활용하게 되면 사회 현안과 문제해결을 파악하는데 참고하는 용도로 활용이 가능할 것이라고 판단된다.
차후 연구로는 ChatGPT와 Bard의 응답이 일반적으로 알려진 정의(예: 도시 홍수(김민준・강전영, 2022)) 혹은 최신 연구 경향(이유빈 등, 2019)에 대해서 얼마나 의미적 유사성을 띄고 있는지를 정량적으로 파악하는 것이다. 이는 단순히 단어 수의 비교보다는 ChatGPT와 Bard의 응답에 대한 신뢰도를 검증할 수 있다고 판단되기 때문이다. 또한, 연구자가 확인하고자 하는 사회 현안과 관련된 정부 보고서 등을 활용하여 생성형 AI가 학습을 하게 한 후, 본 연구의 분석 과정을 진행했을 경우 ChatGPT와 Bard의 응답을 확인하는 것은 또 하나의 차후 연구가 될 수 있을 것이다.
본 연구는 다음과 같은 의의가 지닌다. 첫째, 사회 현안과 문제해결 방안을 탐색하기 위한 도구로서 생성형 AI 활용의 유용성을 확인하였다. 둘째, ChatGPT와 Bard와 같이 현재 서비스되고 있는 생성형 AI에 프롬프트를 작성하고, 응답결과의 정성적 평가를 수행한 실험을 통해 실증적 연구를 진행하였다. 셋째, 생성형 AI를 활용한 새로운 접근방법을 통한 정책연구의 확장 가능성을 살펴보았다. 또한, 본 연구는 프롬프트와 같이 구체적인 실험방법 및 응답결과를 공개하여 동일하거나 유사한 향후 연구를 위해 재현성 및 반복가능성(강전영・황철수, 2022)을 고려하였다. 이를 통해 본 연구에서 진행된 실험방법과 결과는 생성형 AI의 응용 프로그램(application), 즉 API를 통한 응답결과 획득과 시각화 결과물 작성(예: 지도, 그래프), 사용자 대화형 UI/UX 설계에 따른 결과물 공유와 같이 범용적인 활용을 위해 참조될 수 있다.
덧붙여, 최근 한 학술지의 사설에서는 ChatGPT와 같은 생성형 AI는 아직 연구 시연단계이며, 무료로 접근할 수 있음에 따라 더 많은 실험을 통해 학술분야의 활용에 대한 검토가 필요하다고 밝혔다(Nature Machine Intelligence, 2023). 이는 학술연구 영역에서 현재 생성형 AI는 포괄적인 문헌탐색 및 연구 틀 작성으로 한정하여 활용되는 것이 적절하다고 할 수 있다. 또한 이는 연구자에게 더욱 정확한 개념과 선행연구를 인지하고 응답결과를 판단할 수 있는 능력이 요구된다고 할 수 있다.



