I. Introduction
지구온난화로 인한 여러 환경 문제들은 기후변화를 거쳐 기후 위기의 상황으로 들 어서 사태의 심각성을 알린다. 패션 산업은 지구온난화 문제와 떼려야 뗄 수 없는 산 업적 구조를 지니고 있으며, 이를 해결하기 위한 다양한 방법을 강구하는 데 앞장 서 고 있다. 특히 지속가능성과 관련한 화두는 패션업계 는 물론이거니와 범국가적 차원에서 꾸준히 논의되어 온 내용이다. UN은 2015년 제70차 총회에서 2030년 까지 인류 공통으로 미래사회의 지속가능성과 관련하 여 지향해야 할 17개의 지속가능발전목표(Sustainable Development Goals: SDGs)를 설정하였다. 또한 프랑 스 정부는 의류․신발 등 패션 재고의 폐기 처분을 전 면 금지하는 ‘폐기 방지와 순환경제법안’을 통과시켰 으며, 2019년 개최된 G7 정상회담에서 프랑스의 마크 롱 대통령은 패션 협약을 발표해 약 150개의 글로벌 패션 브랜드들이 지속가능한 패션 산업을 위한 서약 을 맺었다(Faraa, 2019). 그러나 여전히 패션 산업은 전 세계 탄소 배출량의 약 10%, 폐수 배출의 약 20% 를 차지하며, 바다에 있는 미세 플라스틱의 35%는 합 성 섬유의 세탁으로 발생한 것이라는 지적을 받고 있 다(Silvestri, 2021).
지속가능성에 있어 패션 분야의 영향이 인정되는 바, 학계에서는 이와 관련한 연구가 활발하게 진행되 고 있다. 지속가능성은 지속가능발전목표와 함께 환 경, 사회발전, 사회적 불평등, 경제발전 등을 고루 포 함하는 내용을 담고 있으나, 패션과 관련한 지속가능 성에 대한 논의는 환경과 윤리적 차원의 일부 분야에 서 진행되었다. 이에 따라 패션 분야의 지속가능성을 보다 종합적이고 거시적인 차원에서 검토할 필요성이 있다. 패션 분야의 지속가능성과 관련한 연구 동향 분 석은 에코패션과 친환경패션 연구 동향을 내용분석으 로 살펴본 연구(Choi, 2016), 영국의 지속가능 패션연 구센터의 프로젝트 사례 고찰을 통해 동향을 살핀 연 구(Lee & Ma, 2020), 윤리적 패션 연구 동향을 텍스 트 마이닝 기법과 네트워크 분석을 통해 본 연구(Choi & Lee, 2020)와 같이 그 사례가 극히 제한적이다.
이에 따라 본 연구는 지속가능패션을 주제로 한 국 내외 논문들을 수집하여 이를 분석해 보다 심층적으 로 연구 동향을 파악하고자 한다. 현실적으로 수백 편 에 이르는 데이터를 질적으로 깊이 있게 분석하는 데 에는 한계가 있으며, 내용분석 방법의 경우 연구자의 편견 개입에 따른 문제가 발생할 수 있다는 단점이 있 어 본 연구에서는 빅데이터 분석 방법 중 LDA(latent dirichlet allocation, 잠재 디리클레 할당) 기반 토픽 모 델링 방법을 사용하고자 한다. LDA 토픽 모델링 방 법은 기존의 키워드 빈도 분석이나 네트워크 분석의 한계를 보완하여 질적 분석에 준하는 의미와 해석이 도출 가능하다는 점에서 높이 평가되어 다양한 연구 분야에서 활용하고 있다(Jacobs & Tschötschel, 2019).
본 연구를 위한 데이터는 한국학술지인용색인(Korea Citation Index: KCI)과 Scopus에서 제공하는 논문을 대 상으로 하였다. Scopus는 SCI(Science Citation Index), SSCI(Social Sciences Citation Index) 그리고 A&HI (Arts & Humanities Citation Index) 저널들을 대상으 로 인용정보를 제공한다. 수집된 논문은 지속가능패 션을 주제로 2000년부터 2021년 7월까지 게재된 논 문을 대상으로 하였으며, 총 340편의 영문초록을 대 상으로 하였다. 이를 통해, 국내외 지속가능패션의 주 요 연구주제와 연구 동향을 규명하고, 지속가능패션 의 발전 방향을 제시하고자 한다.
Ⅱ. Background
1. Analysis of research trends in the field of fashion
패션 분야에서의 연구 동향 분석은 학문의 발달과 함께 꾸준히 진행되어 왔으며, 크게 특정 학술지의 연 구 동향 분석과 특정 주제에 대한 연구 동향 분석으로 나뉜다.
특정 학술지의 연구 동향 분석은 해외학술지인 Fashion Theory와 국내학술지인 복식문화연구 학술 지의 연구대상, 시대, 방법론 등을 통해 주제의 차이 를 비교한 내용분석 연구(Hahn & Kim, 2014), 한국패 션디자인학회지의 창간호부터 2015년까지 게재된 논 문의 주제어와 초록을 중심으로 토픽 모델링을 통해 연구주제와 동향을 살핀 연구(Jang & Kim, 2017), 산 학활동에 따른 사례, 시장분석 등의 연구를 포함하는 것을 학술지 발간의 목표로 삼은 패션비즈니스 학술 지의 패션디자인 및 마케팅 분야의 연구 동향을 키워 드 네트워크 분석을 통해 살펴 타 학술지와의 차별점 을 고찰한 연구(Lee & Lee, 2019) 등이 있다.
특정 주제에 따른 연구 동향 분석은 트렌드를 반영 한 주요 이슈를 중심으로 진행되었다. 패션 일러스트 레이션과 관련한 국내 석․박사 학위논문을 내용분석 한 연구(Kim, 2009), IT 패션과 관련한 선행연구를 토 대로 내용분석을 통해 키워드를 도출하고, 키워드 간 IT 패션 가치 사슬 맵을 제작한 연구(Choo et al., 2012), 에코패션과 친환경패션에 대한 연구를 주제, 연구방법, 연구분야 등으로 내용분석한 연구(Choi, 2016), 패션문화상품 관련 논문의 연구방법, 상품유형, 제작기법에 대한 내용분석을 진행한 연구(Kim, 2018), 패션디자이너와 관련한 연구를 연구방법, 주제, 대상 등의 내용분석을 중심으로 살펴 본 연구(Kim, 2019), 영국의 지속가능 패션연구센터의 프로젝트 사례 고찰 을 통해 동향을 살핀 연구(Lee & Ma, 2020), 윤리적 패션 연구 동향을 텍스트 마이닝 기법과 네트워크 분 석을 통해 본 연구(Choi & Lee, 2020), 디지털 전환을 키워드로 한 논문 159편을 수집하여 키워드 네트워크 분석을 실시한 연구(Choi, Jeong, & Lee, 2021) 등이 있다.
이러한 연구 동향 분석은 과거 내용분석 연구에서 점차 컴퓨팅 프로그래밍을 활용하거나, 빅데이터 기 반 분석 등 새로운 분석 방법을 시도하는 것으로 변화 하고 있음을 확인할 수 있다.
2. LDA topic modeling
토픽 모델링은 텍스트 마이닝 방법 중 하나로 비정 형 텍스트 자료로부터 핵심 주제를 추출하거나, 각 토 픽에 대응하는 문서를 식별하는 방법이다. 텍스트 마 이닝의 분석 대상인 언어를 분석하기 위해서는 정보 검색 기술과 데이터 마이닝 및 자연어 처리 기술이 복 합된 방법이 필요하며, 온라인에서 생성되는 텍스트 등 비정형 데이터의 기하급수적 증가로 인해 텍스트 마이닝과 관련한 학문적 관심이 증가하였다(Suh & Shin, 2017).
토픽 모델링은 구조화되지 않은 대량의 문헌에서 토픽을 찾아내기 위한 방법으로 문헌과 단어 사이의 구조와 보이지 않는 변수를 추론하는 데 목적이 있다 (Blei, 2012). 토픽과 키워드의 비율 그리고 키워드가 특정 토픽에 포함된 확률 등을 파악할 수 있으며, 의 미론적 분석 방법에서 많이 활용한다(Leydesdorff & Nerghes, 2017). 또한 하나의 문헌에 하나의 주제만 매칭되는 일반적인 군집화 기법과 달리 단일 문헌이 여러 주제에 동시에 대응할 수 있다는 점과 텍스트 집 합을 가장 잘 표현한다는 장점이 있다(Kim, Lee, Choi, & Wong, 2017).
토픽 모델링은 방대한 양의 비구조화된 문서들의 집합체인 말뭉치(corpus)와 문서-단어 행렬에 대한 이 해를 바탕으로 진행되며, 이 행렬을 기반으로 단어들 이 문서에 등장한 횟수를 데이터화 한다. 초기의 토픽 모델링 방법인 문서단어행렬(document-term matrix: DTM)과 단어빈도-역문서빈도(term frequency-inverse document frequency: TF-IDF) 방법은 단어의 빈도수만 을 계산하여 결과를 도출하기 때문에 단어의 의미를 전혀 고려하지 못했다. 이러한 단점을 보완하기 위해 선형대수학적 방법인 LSA(latent semantic allocation, 잠재 의미 할당)가 발달하였다. 그러나 이 또한 수학 적 방법으로 토픽의 유사성은 분석하지만, 그 의미를 해석하는 데 한계가 있다는 단점이 있다(Kim, Ryu, & Paek, 2020).
2003년 Blei, Ng, and Jordan이 제시한 잠재 디리클 레 할당은 특정 단어가 특정 토픽에 존재할 확률과 문 서에 특정 토픽이 존재할 확률 간의 결합 확률을 디리 클레 분포(dirichlet distribution)로 표현하고, 이로부터 토픽을 추출하는 확률기반 알고리즘이다(Blei, Ng, & Jordan, 2003;Park & Song, 2013). LDA 토픽 모델링 에서 각 토픽은 키워드 간의 조합이며, 각 키워드가 특정 토픽에 일정한 가중치를 부여하게 된다. 이를 통 해 각 토픽의 키워드와 각 키워드의 중요도를 확인할 수 있어 의미가 있는 연구 방법으로 고려되며, 다수의 비교평가 사례에서 LSA에 비해 LDA가 우수한 평가 를 받고 있다(Mohammed & Al-augby, 2020).
이와 같은 장점으로 다수의 학문 분야에서 Python 을 활용한 LDA 토픽 모델링을 통한 연구 동향 분석 이 이루어졌다. 국내 산업보안과 관련한 국내 학술 논 문과 산업보안 관련 기사 데이터를 분석 후 비교를 진 행한 연구(Yoo, Park, Lee, Hwang, & Kim, 2020), 한 국과 중국, 미국의 블록체인 연구 동향이 어떠한가를 비교 분석한 연구(Jo, Kim, & Lee, 2019), 2000년 이 후 최근 20년간 국내 영어교육 학술지에 나타난 연구 동향을 분석한 연구(Won & Kim, 2021), 공공데이터 분야의 국내외 연구 동향을 비교 분석한 연구(Park, Kim, & Kim, 2021) 등 최근 발간된 논문들을 중심으 로 Python을 활용한 LDA 토픽 모델링 기법이 연구 방법 중 하나로 주목받고 있다.
Ⅲ. Methods
1. Data collection
본 연구에서는 KCI와 Scopus에서 제공하는 논문 을 대상으로 하였다. 분석대상 논문들은 Sustainable fashion, Sustainability, Fashion 등을 키워드로 하여 검색되었으며, KCI 등재 논문 140건과 Scopus 등재 논문 200건이 수집되어 총 340편의 논문이 추출되었 으며, 논문의 영문초록을 데이터로 사용하였다.
2. Analysis tools and procedures
LDA 토픽 모델링 알고리즘을 적용하기 위해 사용 한 프로그램은 오픈 소스 프로그램인 Python 3.8.3 버 전이다. 분석 절차는 4단계로 구분하였으며, 데이터 변환, 데이터 전처리, LDA 토픽 모델링 분석, 핵심 토 픽 도출 및 토픽 모델링 시각화 단계로 구성되었다 (Fig. 1).
첫 번째 단계인 데이터 변환은 수집된 데이터를 Python 상에서 분석할 수 있도록 데이터를 전환하는 과정이다. 자료 수집으로 선정된 영문초록은 엑셀 파 일로 저장되어 프로그래밍 언어에서 지원하지 않는 형식으로 분석이 불가하였다. 따라서 이를 JSON(Java Script Object Notation) 파일로 변환하여 Python이 변 수 값을 인식하는 데 용이하도록 하였다.
두 번째 단계는 데이터 전처리 과정이다. 이 단계에 서는 NLTK 및 Gensim 패키지를 통해 Stopword list 를 설정하였다. 이를 통해 기본적인 구두점 및 불용어 등과 같은 불필요 단어를 제거할 수 있다. 본 연구에 서는 자료 수집 과정에서 검색어로 활용한 Sustainable fashion, Sustainability, Fashion 등의 키워드를 추가 로 제거하였다. 이 단어들이 가장 많은 빈도수를 나타 내는 키워드이기 때문이다. 또한, Tokenizing 과정을 통해 문장들을 단어로 쪼개는 과정을 진행하였고, Lemmatize를 통해 품사에 따라 단어를 나누는 작업 을 진행하였다. 이를 통해 생성된 Corpus에 해당하는 총 Token의 수는 34,846개가 추출되었다.
세 번째 단계는 전 단계에서 생성된 정제 데이터를 기반으로 Mallet 패키지를 활용하여 LDA 모델을 통해 토픽 모델링을 실시하는 단계이다. 토픽의 수는 최대 30개로 한정하여 분석하였다. 5개 단위로 토픽의 수에 따른 Perplexity score(혼잡도)와 Cohrerence score(일 관성 점수)를 확인하여 최적의 토픽 수를 확인하였다.
네 번째 단계는 핵심 토픽을 도출하고, 각 토픽 내 키워드 가중치를 분석하는 단계이다. 또한 이 단계에 서는 pyLDAvis 라이브러리를 적용하여 분석 결과의 시각화를 진행하였다. pyLDAvis는 토픽과 단어의 관 계는 물론이거니와 토픽과 토픽 내 단어의 중요도에 따라 순위화하여 시각화하는 도구로 결과를 직관적으 로 이해할 수 있도록 돕는 장점이 있다. 또한, 전체 토픽의 위치와 관계를 파악하는 점에서도 유용하다 (Sievert & Shirley, 2014).
Ⅳ. Results
1. Total analysis
340편의 논문 초록을 대상으로 추출한 34,846개 의 단어를 활용하여 LDA 알고리즘을 통한 토픽 모델 링을 진행하였으며, 이에 따른 핵심 토픽은 8개가 도 출되었다. 토픽 모델링의 결과 도출에서 Perplexity score(혼잡도)는 모델의 내재적 기법으로, Cohrerence score(일관성 점수)는 모델의 외재적 기법으로 적정 토픽 모델의 개수를 판단하는 지표로 사용되었다. Perplexity의 값은 샘플링의 반복이 많아질수록 감소 하는 경향을 보여 이 값이 작을수록 해당 토픽 모델은 실제 데이터 결과를 잘 반영한다는 뜻으로 여겨지며, 학습이 잘 되었다는 의미로 쓰인다(Choi, Sul, Jeong, & Yoon, 2018). 그러나 Perplexity 값이 늘 해석에 적 합한 결과를 보이지 않는다는 견해가 있어 이를 해결 하기 위해 제시된 척도가 Cohrerence score이다(Chang, Boyd-Graber, Gerrish, Wang, & Blei, 2009). 토픽 모 델링 결과로 나온 주제들에 대해 각각의 주제에서 상 위 단어를 뽑고, 상위 단어들 간의 유사도를 통해 의 미론적 유사성을 확인하는 값이다. 본 분석의 혼잡도 와 일관성 점수의 그래프는 <Fig. 2>와 <Fig. 3>에서 확인할 수 있으며, 본 연구에서는 Cohrerence score가 .4483으로 가장 높은 값을 지닌 8개를 적정 토픽의 수 로 설정하였다.
<Fig. 4>는 개별 문서가 어떠한 토픽과 연결되어 있 는지를 나타내는 결과로 제일 왼쪽 열의 숫자는 문헌 의 번호, 즉 데이터에 정리된 초록의 문서 번호이며, 두 번째 열의 번호는 문서에 해당하는 토픽의 번호이 다. 또한 세 번째 열에는 토픽의 키워드가 나열되어 있 다. 이러한 결과를 통해 각 문헌에 따라 어떠한 토픽이 도출되었는지 점검이 가능하며, 각 토픽에 대응하는 가장 적합한 문헌이 무엇인지도 함께 확인할 수 있다.
<Table 1>은 토픽 모델링의 결과로 8개의 토픽과 이 에 해당하는 키워드이다. 해당 토픽의 명칭은 토픽의 상위 키워드를 바탕으로 연구자가 선정하였다. 토픽 당 키워드는 30개를 추출하였으나, 그 중 상위 10개 키워드를 가중치(중요도)가 높은 순으로 나열하였다.
토픽 1은 전체 340개의 논문 중 15.92%를 차지해 52편의 논문이 이에 해당한다. 소비자, 소비, 의류, 제 품, 행동, 결과, 환경, 영향 등과 같은 키워드를 포함하 고 있어 토픽명을 “소비자의 의류 소비 행동과 환경” 으로 설정하였다. 소비자의 제품 소비가 환경에 미치 는 영향과 그에 따라 제품 구매 행동이 어떻게 변화하 는가와 관련된 논문들이 해당되었다. 토픽 1의 키워 드에 가장 적합한 논문으로 꼽힌 논문의 내용은 패션 소비자의 처분행동과 관련한 연구로 처분행동 또한 구매나 사용과 마찬가지로 중요한 소비행동의 한 단 계로 보았다. 따라서 패션제품 처분행동의 유형을 분 류하고, 환경의식과 패션소비태도가 미치는 영향을 분석하여 지속가능한 패션소비 행동을 선도할 수 있 는 방안을 연구하였다(Suk & Lee, 2017).
토픽 2는 13.82%에 해당하는 47편의 논문이 해당 하는 주제로 디자인, 방법, 특성, 결과, 업사이클, 적 용, 개발, 패턴, 기술 등의 키워드를 포함하는 “업사이 클 제품 개발”이다. 토픽 2에 해당하는 논문들은 패턴 개발을 통해 지속가능패션 디자인을 개발하거나 업사 이클을 통해 디자인 및 제품을 개발하는 사례 및 방법 에 대한 연구들이다. 47편 중 토픽 2에 가장 적합한 논문은 해체주의 개념을 중고셔츠에 적용하여 업사이 클링 셔츠 디자인을 제안한 연구로 다양한 디자인 발 상 방법과 표현기법을 통해 디자인을 제안한 사례연 구이다(Heo, 2020).
토픽 3은 전체 중 9.71%에 해당하는 33편의 논문 이 있다. 키워드는 환경, 케이스, 제품, 유형, 분석, 문 제 등으로 본 토픽의 주제는 “환경적 접근에 따른 제 품 유형”이다. 이에 해당하는 논문의 주제들은 친환경 의류 제품의 유형 및 친환경과 관련한 의류제품이 지 닌 문제점을 연구한 논문들이 있었다. 가장 적합한 논 문은 유기농 면 의류 제품에 대한 수요와 그에 따른 환경적 인식에 대한 연구로 유기농 면이라는 구체적 인 제품 유형을 연구의 주제로 제시하였다(Hustvedt & Dickson, 2009).
토픽 4는 전체 논문의 11.76%로 40편의 논문이 이에 해당한다. 이 토픽의 주제는 “ESG 기업 경영” 으로 키워드는 사회, 윤리, 기업, 친환경, 활동, 마케 팅 등이다. ESG는 기업의 비재무적 요소인 환경 (environmental), 사회(social), 거버넌스(governance) 의 머리글자를 따온 단어로 기업의 가치를 지속가능 성에 영향을 주는 요소를 반영해 평가하는 기준이 발 달하며 논의되어 왔다(Koh, An, & Suh, 2021). 의류 패션 기업들이 사회적․윤리적․친환경적 마케팅 전 략 및 활동을 진행하고 있는지에 대한 내용으로 기업 의 윤리적 경영방침과 관련한 접근을 통해 논문을 전 개하였다. 이는 지속가능성에 대한 기업의 사회적 책 임(corporate social responsibility: CSR)활동에 대한 논의와도 깊은 관련이 있다. 그간 패션산업이 지니는 인권보호, 노동력 착취, 에너지 절약과 재활용, 소비 자 권리 보호 등의 다양한 문제에 대한 해결책으로 기 업의 사회적 책임이 요구되어 온 바와 일맥상통한다 (Ju & Chung, 2015). 토픽 4의 키워드 내용을 가장 잘 반영하고 있으며, 주제에 적합한 논문으로는 한국 패 션기업의 사회적 책임 활동에 대한 사례연구로 매출액 1조 원대 이상의 6개 기업에 대한 활동을 조사하여 분 석하고, 이러한 활동이 소비자의 태도에 긍정적인 영 향을 미치는 것으로 보고하였다(Jeong & Rhee, 2018).
토픽 5는 “소재 및 재료 개발”이 주제이다. 이에 해 당하는 논문은 31편으로 전체의 9.12%를 차지한다. 상위 키워드는 재료, 직물, 상품, 폐기물, 개발, 기술, 생산 등이며, 관련한 연구로는 텍스타일의 개발 혹은 폐기물로부터 소재를 개발하는 방법 등에 대한 연구 가 진행되었다. 토픽 5를 가장 잘 반영하고 있는 논문 은 뉴욕주에 위치한 섬유 가공 공장을 대상으로 슬로 패션을 위한 지역 기반 제품 생산을 위한 소재를 개발 하는 연구를 진행한 논문으로 친환경적 접근은 물론 이거니와 농부들의 소득과 관련한 연구를 진행하여 뉴욕주의 농업 생산량의 지속성에 대해서도 논하였다 (Trejo, Smith, Trejo, & Lewis, 2019).
토픽 6은 가장 많은 논문 수인 63편이 꼽혔으며, 18.53%에 해당한다. 토픽 6의 주제는 “프로세스 기반 접근 방식”으로 키워드는 산업, 실습, 디자이너, 접근 방식, 프로세스, 기반, 관점, 프로젝트, 솔루션 등이다. 이 주제는 기업 차원의 패러다임 전환에 대한 접근 방 식이나 교육기관에서 프로젝트 수업을 통해 학생들에 게 새로운 경험을 적용하는 연구들이 주를 이루었다. 따라서 기존의 관행을 벗어나 어떻게 하면 변화하는 시장에 대비할 수 있는지 산업적 차원과 미래 세대 양 성의 차원에서 고민하고 있는 연구들이다. 토픽 6의 주제와 가장 잘 부합하는 논문으로는 차세대 패션디 자이너를 위해 체험학습 기반의 지속가능패션 수업을 진행한 두바이 대학의 사례연구이다(Agarwal, 2021).
토픽 7은 “라이프스타일 및 소비자의 경험”이 주 제로 10.88%에 해당하는 37편의 논문이 이에 해당한 다. 키워드는 의류, 제공, 발견, 그룹, 의복, 이해, 경 험, 컨텍스트 등이다. 이에 해당하는 논문은 소비자의 특정 가치관 혹은 라이프스타일을 반영한 경험이 새 로운 패션 산업에 미치는 가치 혹은 발전 기회를 모색 하는 연구들이 해당된다. 의류 렌탈업을 이용하는 라 이프스타일을 지닌 소비자에 대한 연구나(Mukendi & Henninger, 2020), 평균 연령 72세 이상의 여성의 의 류생활에서 가치를 창출할 수 있는 지속가능한 사례 를 도출하는 연구(DeLong & Bang, 2021) 등이 진행 되었다.
마지막으로 토픽 8은 전체의 10.88%에 해당하는 37편의 논문이 있으며, 주제는 “브랜드 전략”이다. 키 워드는 브랜드, 전략, 탐색, 시장, 모델, 생산 등으로 해당 논문은 앞서 등장한 토픽 4에 해당하는 기업의 경영이념과는 달리 제품 판매를 위한 마케팅 전략을 어떠한 방법으로 활용했는지에 대한 연구들이 주를 이루었다. 대표적인 논문으로는 H&M이 유기농 면, 재활용 섬유 및 리오셀 활용 등의 전략 활용에 대한 구체적인 사례를 설명한 연구이다(Shen, 2014).
이상과 같이 토픽 모델링을 통해 선정된 8개의 토 픽은 소비자의 의류 소비 행동과 환경, 업사이클 제품 개발, 환경적 접근에 따른 제품 유형, ESG 기업 경영, 소재 및 재료 개발, 프로세스 기반 접근 방식, 라이프 스타일 및 소비자의 경험, 브랜드 전략이다.
<Fig. 5>는 pyLDAvis 라이브러리를 활용해 토픽 모델링 결과를 시각화한 것이다. Intertopic Distance Map은 학습된 토픽 모델링의 결과로 나타난 전체 토 픽을 2차원 척도로 나타낸 것이다. 각 토픽은 원으로 표현되고 원의 크기가 클수록 해당 토픽이 차지하는 비중을 의미하며, 토픽 사이의 거리는 토픽 간의 연관 성을 의미한다(Park & Oh, 2017). 분석 결과, 8개의 토픽은 대체로 널리 퍼져 있으나, 토픽 2와 5가 상당 히 가까이 배치되어 있다는 것을 알 수 있다. Top-30 Most Salient Terms는 전체 토픽에 해당하는 30개의 주요 키워드들을 순위대로 나타내어 보여주고, Top-30 Most Relevant Terms for Topic N은 특정 토픽에서 가장 중요한 가중치를 나타낸 30개의 키워드를 순위 대로 보여주어 각 토픽의 의미를 파악할 수 있게 해준 다. <Fig. 5>의 하단에 토픽 1에 해당하는 30개의 단어 와 각 단어의 중요도를 확인할 수 있다. 토픽 2~8에 해당하는 내용은 <Fig. 6>과 같다.
2. Comparative analysis of KCI and Scopus
1) KCI topic modeling
KCI의 논문 140편의 초록을 토픽 모델링한 결과, Perplexity score와 Cohrerence score에 의해 8개의 모 델이 가장 적절하여 아래와 같이 8개의 모델이 생성 되었다(Table 2). Cohrerence score가 토픽이 2개일 때 가장 높은 값을 나타냈으나, 토픽 수가 너무 적으면 주제를 세분화할 수 없기 때문에 다음으로 가장 높은 값을 지닌 8개를 선정하였다. <Fig. 7>과 같이 KCI 논 문에서 추출된 8개의 모델은 연관성이 없으며, 원의 크기를 바탕으로 비중 또한 전체적으로 큰 차이가 없 음을 알 수 있다. 가장 비중이 큰 토픽은 3과 8로 토픽 3은 패션기업의 사회적 기업과 관련한 연구들을 바탕 으로 종합분석의 토픽 4인 ESG 기업 경영과 유사하 며, 토픽 8은 키워드의 나열로 토픽의 주제를 선정하 는 데 어려움이 있다. 이는 데이터의 수와 관계가 있 으며, 보다 많은 수의 논문이 분석에 필요할 것으로 사료된다.
2) Scopus topic modeling
Scopus의 논문 240편의 초록을 토픽 모델링한 결 과, Cohrerence Score 값이 가장 큰 8개의 토픽을 지 니는 모델이 생성되었다(Table 3). <Fig. 8>에서 원의 위치를 통해 토픽 6과 7, 2와 3, 8과 5가 가까이 위치 하여 연관성이 있음을 추측할 수 있다. 가장 비중이 큰 토픽은 3으로 디자인 과정에서 지속가능성을 고려 한 프로세스를 제안하는 연구들로 종합분석의 토픽 2 인 업사이클 제품 개발과 유사함을 알 수 있다.
3) Connectivity analysis
의류학 분야 박사급 연구자 3인에게 검토받아 KCI 와 Scopus의 토픽 모델링 분석 결과로 도출된 8개의 토픽을 종합분석에서 도출한 주제에 대입한 결과는 아래 <Fig. 9>와 같다. KCI의 결과는 종합분석 토픽의 1: 소비자의 의류 소비 행동과 환경, 2: 업사이클 제품 개발, 4: ESG 기업 경영, 5: 소재 및 재료 개발, 6: 프 로세스 기반 접근 방식에 해당하는 주제와 관련성이 있으며, Scopus는 2: 업사이클 제품 개발, 3: 환경적 접근에 따른 제품 유형, 5: 소재 및 재료 개발, 6: 프로 세스 기반 접근 방식, 7: 라이프스타일 및 소비자의 경험, 8: 브랜드 전략에 해당하는 토픽과 관련성이 있 다. 종합분석의 결과와 차이를 보이는 이유는 각 데이 터 간의 존재하는 말뭉치의 차이에 따른 결과라고 볼 수 있다. LDA 토픽 모델링이 각 말뭉치에서 잠재적 의미가 있는 키워드를 추출하는 확률 분포 알고리즘 방법이기 때문이다. 추후 지속가능패션을 주제로 한 다양한 데이터의 확충과 축적을 통해 이 격차를 점차 좁혀갈 수 있을 것으로 사료된다.
Ⅴ. Conclusion
본 연구는 국내외 발간된 지속가능패션 관련 논문 의 연구 동향을 텍스트 마이닝 기법을 활용해 알아보 고자 하였다. KCI와 Scopus에 등재된 논문을 바탕으 로 국내외 지속가능패션의 연구 동향을 파악하고자 하 였다. 지속가능패션을 주제로 수집한 데이터를 Python 을 이용해 정제 후 잠재 디리클레 할당 토픽 모델링을 실시하였으며, 그 결과를 시각화하여 분석하였다. 연 구 결과는 다음과 같다.
첫째, 종합분석의 결과, 도출된 토픽은 8개이다. 토 픽 모델링을 통해 분석된 지속가능패션의 연구 분야 는 패션 업계를 구축하고 있는 생산자와 소비자의 관 점을 다양하게 반영하고 있는 것은 물론, 교육프로그 램과 같은 학문적 접근도 진행 중인 것을 확인하였다. 생산과 관련한 토픽은 2: 업사이클 제품 개발, 3: 환경 적 접근에 따른 제품 유형, 4: ESG 기업 경영, 5: 소재 및 재료 개발, 6: 프로세스 기반 접근 방식, 8: 브랜드 전략이 해당한다. 소비와 관련한 토픽은 1: 소비자의 의류 소비 행동과 환경, 7: 라이프스타일 및 소비자의 경험이 있으며, 교육과 관련한 토픽은 6: 프로세스 기 반 접근 방식이 일부 내용을 포함하고 있다. 토픽 6은 상위 10개 단어 이외에 education, student, challenge, academic 등 교육과 관련한 단어가 추가로 존재하였 으며, 문헌-토픽 매칭을 살핀 결과에서도 교육과 관련 한 논문이 다수 확인되어 교육과의 관련성도 인정되 었다. 따라서 전반적인 주제가 지속가능패션의 생산 자에 초점이 맞춰져 있음을 알 수 있었다. 생산과 관 련한 주제는 마케팅 전략을 비롯해 제품 디자인 및 기 획 과정, 그리고 브랜드와 기업의 운영과 관련한 사회 적 책임에 대한 논의도 다수 진행되었다.
둘째, KCI와 Scopus 논문을 개별분석한 결과, 도출 된 토픽은 각각 8개이다. KCI에서 도출된 토픽 8개 중 종합분석의 토픽 모델링 결과에 해당하는 토픽과 연관성이 있는 토픽은 5개이며, 종합분석의 토픽 중 3: 환경적 접근에 따른 제품 유형, 7: 라이프스타일 및 소비자의 경험, 8: 브랜드 전략에 해당하는 토픽을 연 결지어 설명할 수 없다. 또한, Scopus에서 도출된 토 픽도 3: 환경적 접근에 따른 제품 유형, 4: ESG 기업 경영에 해당하는 토픽도 부재하다. 이러한 결과는 데 이터에 근거한 말뭉치의 확률적 분포에 따른 차이로 보여지며, 데이터 축적을 통해 해결될 수 있을 것으로 사료된다. 따라서, 다양한 지속가능패션과 관련한 국 내외 연구자들의 다양한 주제 탐색 과정이 필요할 것 으로 보인다.
본 연구는 지속가능패션에 대한 학문적 자료를 바 탕으로 지속가능패션의 동향을 살펴보았다. 연구 방 법 차원에서 연구자의 주관적 가치를 배제한 연구 방 법을 활용하여 확률에 기반하여 데이터를 분석하였다 는 점에 의의가 있으며, 빅데이터 기반의 컴퓨팅 프로 그램을 활용하여 최근 연구 동향 분석의 트렌드와 그 방향과 나란히 하였다. 후속 연구에서는 보다 많은 수 의 데이터 확보를 통해 토픽 모델링의 일관성 점수가 상승할 것으로 예측되는 바이다. 또한, 전 세계적으로 지속가능패션이 주요 논제로 자리 잡은 현대 사회의 지속가능패션 연구 동향을 살펴 후속 연구의 방향성 을 제시할 수 있다는 점에 가치가 있다. 지속가능발전 목표에서 제시하는 17개의 목표와 관련하여 패션 분 야에서 노력할 다양한 주제들이 산재하여 있음을 확 인하고, 이를 달성하기 위한 생산, 소비, 교육 차원의 다양한 연구가 지속되어야 할 것이다. 지속가능패션이 사회적으로도 큰 관심사에 있는 점을 고려하여 다양 한 자료를 통해 동향을 분석하는 후속 연구가 진행되 어야 할 것이다. 예를 들어, 연도별로 어떠한 토픽의 연구 주제가 활발하게 이루어졌는지를 확인하는 시계 열 분석이나 국가별 연구 동향이 어떠한 차이를 지니 는지 비교하는 연구, 동시대의 뉴스 데이터와의 비교 를 통한 학문적․사회적 동향의 비교 분석 등의 연구 가 진행될 수 있으며 본 연구를 바탕으로 지속가능패 션에 대한 발전 가능성의 지표가 되리라 기대한다.