• Crossref logo
Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1226-0401(Print)
ISSN : 2383-6334(Online)
The Research Journal of the Costume Culture Vol.31 No.1 pp.34-52
DOI : https://doi.org/10.29049/rjcc.2023.31.1.34

Text mining analysis of terms and information on product names used in online sales of women’s clothing

Yeo Sun Kang†
Professor, Dept. of Fashion Design, Duksung Women’s University, Korea

This paper was supported by Duksung Women’s University Research Grants 2021.


Corresponding author (yskang@duksung.ac.kr)
December 29, 2022 February 2, 2023 February 4, 2023

Abstract


In this study, text mining was conducted on the product names of skirts, pants, shirts/ blouses, and dresses to analyze the characteristics of keywords appearing in online shopping product names. As a result of frequency analysis, the number of keywords that appeared 0.5% or more for each item was around 30, and the number of keywords that appeared 0.1% or more was around 150. The cumulative distribution rate of 150 terms was around 80%. Accordingly, information on 150 key terms was analyzed, from which item, clothing composition, and material information were the found to be the most important types of information (ranking in the top five of all items). In addition, fit and style information for skirts and pants and length information for skirts and dresses were also considered important information. Keywords representing clothing composition information were: banding, high waist, and split for skirts and pants; and V-neck, tie, long sleeves, and puff for shirts/blouses and dresses. It was possible to identify the current design characteristics preferred by consumers from this information. However, there were also problems with terminology that hindered the connection between sellers and consumers. The most common problems were the use of various terms with the same meaning and irregular use of Korean and English terms. However, as a result of using co-appearance frequency analysis, it can be interpreted that there is little intention for product exposure, so it is recommended to avoid it.



텍스트마이닝을 활용한 온라인 판매 여성 의류 상품명에 나타난 용어 및 정보분석

강 여 선†
덕성여자대학교 의상디자인학과 교수

초록


    I. Introduction

    인터넷 및 모바일 쇼핑환경에서 검색어는 소비자들이 원하는 제품을 찾기 위한 키워드로서 제품의 노출 빈도를 결정짓는 핵심 요소이다. 소비자들은 브랜드명이나 제품명뿐 아니라 제품 특징을 알 수 있는 스타일, 소재, 구성 디테일, 색상 및 사이 즈 등 다양한 용어로 검색한다. 그러나 같은 의미라도 소비자에 따라 사용한 용어가 다르거나, 브랜드에 따 라 유사한 디자인을 다른 용어로 설명한다면 검색 결 과는 달라질 수밖에 없다. 또한, 의류나 화장품의 상 품명은 한글보다 외래어의 비중이 매우 크므로(Jeong & Lee, 2016;Kim, 1985;Kuk, 2010) 외래어의 한글 철자법에 따라서도 결과는 달라질 것이다. 따라서 패 션 브랜드들은 소비자와 효율적으로 소통할 수 있는 용어와 표기법으로 상품명을 구성하여 상품의 노출 빈도를 높이고 구매를 유도하길 원하며, 이를 위해서 는 상품명의 구성 특징을 파악하는 것이 선행되어야 할 것이다.

    상품명은 제품 판매를 목적으로 판매자가 상품에 붙인 명칭으로 구매를 자극하고 소비자를 설득하는 광고 수단으로 타 브랜드나 타사 제품과 차별되어야 하고, 정보를 지녀야 하며, 소비자에게 긍정적 연상을 불러일으켜야 한다(J.-S. Kim, 2005). 또한, 상품명은 해당 시대 소비자의 요구를 파악하여, 매출을 높일 수 있는 방향으로 작명되므로 사회의 트렌드나 요구가 반영되는 경향이 높고(Hong & Song, 2015) 기능, 구 성 요소 등을 포함하면서 다른 브랜드의 동일 제품과 차별을 두는 경향이 있다(Suh, 2002). 더불어 온라인 상품의 상품명은 외래어 비중이 높고, 소비자들이 관 심과 친근감을 갖고 구매하도록 하기 위해 문법이나 우리말 특성을 고려하지 않고 만들어지는 경우가 많 으며 특히, 외래어가 그런 경향이 크다(Jeong & Lee, 2016). 또한, 온라인 여성 의류 상품명에는 소재, 구 성, 이미지 관련 내용이 많으나 대부분 판매자가 주관 적으로 선택한 단어이기 때문에 소비자 불만요인이 될 수 있어 객관적 설명체계가 필요하다(Sim & Kim, 2008).

    이렇듯 정보전달과 차별성을 바탕으로 소비를 유 인하는 상품명은 80년대 중반 이후 상품의 품질, 기업 이미지, 마케팅에 대한 사회적 관심이 높아지면서 그 중요성이 높아졌으며(Kuk, 2010), 이후 현재 온라인 거래의 활성화에 따라 그 역할이 더 커졌다. 특히, 의 류는 2021년 온라인 거래 상품군 4위이며(Statistic Korea, 2022) 타 제품군과 달리 수시로 많은 신상품이 소개되고 있다. 따라서 소비자의 구매를 자극하고 거 래를 유도하는 상품명의 역할은 더욱 크다고 하겠다. 그런데 의류는 다른 제품과 달리 색상, 촉감, 맞음새 등 직접 확인이 필요한 특성을 가지므로 이를 효율적 으로 전달하는 용어를 사용할 필요가 있다. 따라서 의 류 상품명에 포함된 용어 및 정보 종류를 구체적으로 분석한다면, 판매자와 구매자의 효율적 연결 도모에 활용할 수 있는 유용한 자료가 될 것이다. 그러나 선 행연구를 살펴보면, 온라인쇼핑 환경에서 제품과 소 비자의 첫 연결고리인 상품명에 관한 연구는 매우 미 흡한 상황이다. 이에 본 연구는 여성 의류 중 스커트, 팬츠, 셔츠/블라우스 및 드레스 상품명 중, 최근 2년간 구매로 연결된 상품명을 대상으로 특징과 문제점을 분석함으로써 판매자와 소비자의 연결에 도움이 되는 자료를 제공하고자 한다.

    Ⅱ. Review of Literature

    1. Characteristics of clothing product names

    상품명은 해당 시대 소비자의 요구를 정확하게 파 악하여, 상품의 매출을 높일 수 있는 방향으로 작명되 므로 사회의 트렌드(trend)나 요구를 반영하고 있을 가능성이 높다(Hong & Song, 2015). 소비자들은 브 랜드 이미지의 광고 속 문구, 상품 설명, 상품의 이름 등에 의해서 상품에 대한 이미지를 형성하게 되고, 이 것이 구매행동으로 이어지므로(Jeong & Lee, 2016), 소비자 요구를 반영하는 것과 더불어 상품정보를 정 확히 전달할 수 있도록 상품명을 정할 필요가 있다. 특히, 온라인쇼핑의 경우 상품을 확인하지 못한 상태 로 구매를 결정해야 하므로 상품명에 포함된 상품정 보의 영향력은 더 크다고 하겠다.

    상품명에 관한 선행연구들을 살펴보면, J.-S. Kim (2005)은 독일 광고에 나타난 상품명의 조어유형과 특징을 분석하여 정보전달, 소비자 각인, 연상 작용, 특정 타겟(target) 집단의 4가지 전략을 제시하였다. 또한 상품명은 구매를 자극하고 소비자를 설득하는 수단인 동시에 생산자, 판매자, 소비자에게 정보를 제 공하기 때문에 상품명에서는 간결성, 쉬운 표기, 발음 의 수월성, 인지도 등이 중요하다고 하였다. Hong and Song(2015)은 상품명을 언어학적으로만 분석하면 그 형태적, 의미적 특징 파악은 용이하나 상품명에 포함 된 당대 소비자들의 요구나 사회적 흐름을 파악하기 어렵다는 점에 기반하여 식품 상품명의 구조적, 의미 적 특징과 더불어 4가지 사회문화적 의미를 분석하였 다. Jeong and Lee(2016)는 국내 화장품 브랜드의 상 품명을 분석하여 외래어 및 외국어 사용이 가장 많고 7~15음절로 구성한 경우가 많으며 제품라인에 소비 자 피부고민을 반영한 경우가 많다고 하였다.

    의류 상품명 연구로는 Kim(1985)이 의류, 제화류, 제과류, 가전제품류 및 화장품류의 상품명을 분석하 여 전반적으로 외래어, 특히 영어의 사용이 매우 많고 의류, 제화류, 제과류에서 그 경향이 두드러졌으며 전 문적인 문법적 규칙이 유명무실하다고 하였다. Shim and Kim(2008)은 사이버 쇼핑몰에서 판매되는 여성 의류 Best 100의 제품명을 묘사법, 연상법, 모음법, 고 유 번호 사용법으로 분류하였고, 소재나 의복구성 내 용은 명사가 주로 사용되었고 이미지나 소재의 느낌 에 관한 내용은 형용사가 주로 사용되었음을 밝혔다. 또한, 쇼핑몰에서 판매되는 의류 제품명은 자세한 설 명을 위해 많은 단어를 사용하나 대부분 판매자가 주 관적으로 선택한 단어이기 때문에 소비자 불만의 원 인이 될 수 있으므로 객관적 설명체계를 갖출 필요가 있다고 하였다.

    이처럼 상품명에 관한 선행연구들은 언어적, 사 회문화적 접근이 많고 그 대상도 광고나 포장에 사용 된 상품명이었다. 그러나 온라인쇼핑에서의 의류 상 품명은 상품정보 전달 성격이 강하고 디자인, 색상, 소재, 구성 디테일 등 다양한 정보를 포함하므로 1~2 음절보다 긴 경우가 많다. 또한, 소비자 중심으로 상 품검색이 이루어지므로 소비자가 원하는 단어를 포함 하여야 쉽게 노출되고 구매로 이어질 수 있다. 이에 본 연구는 현시점에서 구매로 연결된 상품명에 포함 된 정보의 종류와 특징을 구체적으로 분석함으로써, 상품명에 반영된 소비자 관심을 파악하고 나아가 상 품명 구성 방안을 위한 참고자료를 제시하고자 한다.

    2. Text mining analysis in fashion

    현재 온라인 환경에는 기사와 논문 등 전문가들의 의견이 나타난 글뿐 아니라 블로그와 소비자 리뷰 등 일반인의 생각을 알 수 있는 글들이 넘쳐나고 있다. 이런 글들은 다수에 의해 수시로 생성되기 때문에 그 규모가 방대하고 다양한 사람들의 생각을 내포하고 있다. 특히 수년 전부터 텍스트형 빅데이터를 분석하 는 텍스트마이닝 방법이 발달하면서 온라인 환경에 존재하는 텍스트데이터는 유용한 분석 자료로서 그 가치가 증가하였다. 더불어 기존 연구의 설문조사는 고정된 질문에 관한 답변을 수집하므로 내용이 제한 적이고 결과 추출에도 한계가 있으나 텍스트데이터는 이런 단점을 극복하는 대안이 되고 있다. 이에 패션 분야에서도 텍스트데이터로부터 필요한 정보를 추출 하는 텍스트마이닝 연구들이 활발히 진행되고 있다.

    먼저, 특정 아이템에 대한 소비자 인식분석 연구로 Kim(2020)은 2018년~2020년 아노락 관련 텍스트데 이터로부터 TF(term freauency)기반의 빈도분석과 N-gram 네트워크분석으로 연도별로 50개 키워드를 분석하여 아노락이 아웃도어 아이템에서 에슐레저웨 어로 용도와 사용범위가 확장되고 있음을 밝혔으며, Lee and Lee(2018)는 골프웨어 관련 텍스트데이터의 빈도, 공출현빈도 및 상위 30개 키워드의 중심성 분석 을 통해 브랜드, 사이즈, 가격, 용품, 기능 등의 키워드 를 추출함으로써 소비자들의 관심을 파악하였다. 또 한, Lee, Lee, Kim, and Kim(2017)은 수영복 관련 텍 스트데이터의 빈도, 공출현빈도, 연결중심성을 분석 한 결과, 남성수영복보다 여성수영복과 아동수영복에 대한 관심이 많고 구입 시 사이즈와 브랜드를 주로 고 려함을 밝혔다.

    다음으로 브랜드 인식에 관한 연구로 Lee, Chung, and Park(2021)는 나이키와 아디다스 브랜드 관련 빅 테이터를 텍스트마이닝하여 제품 관련 용어가 50%로 가장 많았고 다음으로 유통, 마케팅 용어임을 밝혔으 며, Kim and Lee(2018)은 나이키, 아디다스, 휠라, 프 로스펙스 브랜드의 공통 단어를 분석하여 가격과 사 이즈가 가장 중요한 구매요인이며 블랙과 화이트에 대한 높은 관심과 주 구매상품이 신발임을 밝혔다.

    또한 제품 리뷰 데이터를 분석한 연구로는, 티셔츠 상품의 소비자 리뷰를 텍스트마이닝하여 TF-IDF 빈 도와 연결중심성을 분석하여, 제품의 사이즈, 색상과 프린팅 등의 심미적 요인, 소재 품질, 세탁 및 활용성 에 대해 소비자들이 관심이 높음을 밝혔다(Han, 2021). 사이클웨어의 소비자 리뷰의 주요 키워드로 사이즈, 가성비, 패드를 추출한 연구도 있다(Kim & Na, 2022).

    그 외, An and Park(2018)은 디자인 속성 중심의 빅데이터 분석법의 체계를 확립하기 위해 블로그에서 수집한 남성 스트라이프 셔츠 관련 텍스트데이터로부 터 67개 감성 어휘를 추출, 분석하여 셔츠의 디자인, 일상복, 형태 및 기능의 4가지 특성을 파악하였다. Jang and Kim(2020)은 빅데이터를 이용해 패션트렌 드를 분석하기 위해 매년 소재와 연관된 단어 특성을 분석하였다.

    그러나 선행연구를 살펴보면, 온라인쇼핑 환경에서 판매자와 소비자의 첫 연결고리가 되는 상품명의 텍 스트데이터 분석에 관한 연구는 매우 적은 상황이다. 또한, 대부분 방대한 규모의 문장형 데이터를 텍스트 마이닝한 연구로 상품명처럼 단어나 구의 단순 나열 형태의 텍스트데이터를 대상으로 한 연구도 흔치 않 은 상황이다. 이에 본 연구는 구매로 연결된 상품명의 특징과 문제점을 분석하여 상품명 구성에 도움이 되 는 자료를 제공하는 동시에 단어 나열형 텍스트데이 터 연구의 예시를 제공하고자 한다.

    Ⅲ. Research Methods

    1. Data crawling and refinement

    1) Data crawling

    상품명 데이터는 네이버 쇼핑몰 분류에 따라 스커 트, 팬츠, 셔츠/블라우스, 재킷, 원피스 아이템을 ‘리뷰 많은순’으로 정렬하고 최근 2년간의 상품명을 리스틀 리(listly)로 크롤링하였다. 구매로 연결된 상품명을 분석함으로써 소비자에게 긍정적 영향을 미친 용어와 정보 특성을 분석할 수 있다고 판단했기 때문이다. 또 한, 네이버는 2022년 12월 국내 포털 64.47%를 차지 하는 1위 검색엔진이며(Internet Trend, 2022), 브랜드 나 타겟집단을 대상으로 하는 의류 전문 사이트에 비 해 불특정 다수가 사용하므로 상품명의 일반적 특징 을 분석하기 적합하다고 생각했다. 수집시기는 2022 년 2월 21일~28일이었다.

    그러나 재킷의 경우, 텍스트마이닝 결과 블레이저 외에 청재킷, 집업재킷, 보머재킷, 윈드재킷, 퍼집업, 퀼팅재킷 등 다양한 아이템이 섞여 있어, 분석 결과를 특정 아이템의 상품명 정보로 보기 어려워 제외하였 다. 따라서 최종적으로 스커트, 팬츠, 셔츠/블라우스는 약 1만~1만 5천 개를 수집하였고, 드레스는 미니, 미 디, 롱으로 나뉜 상품을 모두 크롤링하여 약 3만 개를 수집하였다.

    2) Data refinement

    수집한 데이터 중 2021년~2022년 이외의 데이터와 중복데이터 및 다른 아이템 데이터를 삭제하였다. 아 이템별 최종 분석 데이터 수는 스커트 7,916개, 바지 7,989개, 셔츠/블라우스 8,003개였고 원피스는 미니, 미디, 롱을 합하여 22,376개였다(Table 1).

    2. Analysis method

    1) Text mining

    텍스트마이닝은 비정형 텍스트데이터에서 원하는 정보를 추출하는 빅데이터 분석 방법이다. 패션 분야 선행연구에서는 주로 기사, 논문, 블로그 등 문장형 데이터에서 단어를 추출하였으나, 본 연구는 수 개의 단어나 구가 나열된 상품명으로부터 단어를 추출하기 때문에 정제과정에 차이가 있을 수 있다. 특히, 의류 제품 용어는 외래어가 많고(Kim, 1985;Sim & Kim, 2008), 시즌이나 의류 호칭과 같이 숫자나 영문 축약 어가 포함된다. 또한, 온라인 상품명은 소비자 관심과 친근감을 위해 문법과 우리말 특성을 고려하지 않을 때가 많으며(Jeong & Lee, 2016), 대부분 판매자가 주 관적으로 선택한 단어일 때가 많다(Sim & Kim, 2008). 따라서 패션 분야 텍스트마이닝 분석에서 주로 사용 하는 Espresso K나 MeCab 사전으로 단어를 추출하는 데 부적합한 경우가 발생함에 따라 수동정제로 단어 를 추출하였다.

    1차로 추출된 단어 수는 스커트 4,434개, 팬츠 5,007 개, 셔츠/블라우스 4,721개, 드레스 5,241개였다. 이는 아이템별 전문용어의 범위를 고려할 때 너무 많은 편 이다. 유사한 의미라도 띄어쓰기나 철자법, 한글 표기 와 외국어 표기가 다르면 모두 다른 용어로 추출되는 텍스트마이닝의 특징을 고려할 때, 추출된 용어를 모 두 다른 용어로 보기에는 무리가 있다. 따라서 분포율 0.01% 이상, 즉 전체의 90% 이상을 차지하는 용어들 을 대상으로 불용어를 삭제하고 복수 표현, 띄어쓰기, 오타를 수정하였다. 다만, 본 연구의 목적이 상품명에 포함된 정보분석과 더불어 주로 사용하는 용어를 구 체적으로 파악하는 것이므로 같은 의미의 한글 용어 와 영어 용어는 통일하지 않고 그대로 두었다.

    2) Frequency and N-gram analysis

    상품명은 문장형이 아니므로 TF(term frequency) 기반으로 빈도를 분석하고 중요 키워드를 추출하였 다. 의류 분야의 텍스트마이닝 선행연구에서 30개~ 100개(Jang & Kim, 2020;Kim, 2020;Lee et al., 2021;Lee & Lee, 2018)의 노드를 분석하는 경향에 따라 본 연구도 100개 내외의 노드를 분석하고자 하 였다. 다만, 노드의 수를 정하는 대신 선행연구와 유 사한 수의 노드가 추출되는 분포율을 기준으로 하였 다. 그 결과, 0.1% 이상을 기준에서 스커트 142개, 팬 츠 144개, 셔츠/블라우스 171개, 드레스 151개 용어가 추출되었다.

    먼저, 아이템별로 상품명을 구성하는 중요 용어와 그 특징을 파악하기 위해 출현율 0.5% 이상의 최다빈 도 용어들의 순위와 정보 종류를 분석하였다. 다음으 로, 아이템 간 정보별 중요도를 파악하기 위해 출현율 0.1% 이상인 용어를 정보에 따라 분류하였다. 정보 종류는 아이템, 의복구성, 핏&스타일, 길이, 소재, 시 즌, 타겟집단(성별, 연령), 용도, 색상, 컨셉, 사이즈, 브랜드 및 판매정보(판매점, 배송정보, 가격정보)의 13가지로 구분하였다. 더불어, 정보별 용어분석에서 드러난 용어의 혼용이 상품의 노출에 미치는 영향을 파악하기 위해 N-gram 네트워크 분석으로 혼용되는 용어 간 공출현빈도를 파악하였다. TF 기반 빈도분석 과 N-gram 분석은 TEXTOM을 활용하였다.

    Ⅳ. Results and Discussion

    1. Frequency analysis

    1) Distribution and number of terms by item

    각 아이템에서 수동정제과정을 거쳐 추출된 최종 용어 수는 스커트 2,652, 팬츠 1,669, 셔츠/블라우스 2,290, 드레스 3,558개였다(Table 2). 분포율 구간별로 살펴보면, 0.5% 이상 출현한 최다빈도 용어는 스커트 35개, 팬츠 31개, 셔츠/블라우스 36개, 드레스 36개였 고 이 용어들의 누적분포율은 53%~59%였다. 또한 분 포율 0.1% 이상인 다빈도 용어는 스커트 146개, 팬츠 143개, 셔츠/블라우스 169개, 드레스 150개였고 누적 분포율은 78%~82%였다. 이를 통해 온라인 판매에서 거래로 연결된 의류 상품명의 약 50%는 약 30개의 용 어에 의해 구성되며, 약 80%는 150개 내외의 용어로 구성됨을 알 수 있다. 특히, 텍스트마이닝으로 추출한 총 용어 수가 수천에 달함을 고려할 때 이들 용어의 비중을 짐작할 수 있다. 따라서 다빈도 용어와 용어가 전달하는 정보를 분류, 분석함으로써 구매로 연결되 는 상품명의 용어 특성을 밝힐 수 있을 것이다.

    2) Frequent term by item (more than 0.5%)

    아이템별로 분포율 0.5% 이상의 다빈도 용어는 <Table 3> 및 <Table 4>와 같다. 스커트에서 10위권 안에 든 용어는 스커트, 롱, 밴딩, 여성, 플리츠, 미니, 플레어, H라인, A라인, 니트였다. 스커트(1위)는 아이 템 용어이고 롱(2위)과 미니(6위)는 길이, 밴딩(3위)과 트임(9위)은 의복구성, 플리츠(5위)와 플레어(7위), H 라인(8위), A라인(9위)은 핏&스타일(실루엣) 용어이 다. 팬츠의 경우는 팬츠, 밴딩, 여성, 슬랙스, 와이드, 바지, 핏, 조거, 부츠컷, 일자가 10위에 포함되었으며, 스커트와 마찬가지로 아이템 용어인 팬츠, 슬랙스, 바 지가 1위, 4위, 6위였고 의복구성 용어인 밴딩이 2위 였다. 그 외 핏&스타일 용어인 와이드(5위), 핏(7위), 조거(8위), 부츠컷(9위), 일자(10위)가 10위권에 들었 다. 셔츠/블라우스에서는 아이템 용어인 블라우스, 셔 츠, 남방이 각각 1위, 2위, 5위였고 의복구성 용어인 카라와 프릴이 4위와 8위였으나, 스커트나 팬츠와 달 리 핏&스타일 용어는 핏(6위) 1개였다. 반면 소재 용 어인 레이스(9위), 면(10위)이 포함되었다. 원피스는 아이템 용어인 원피스와 드레스가 1위와 6위였고 스 커트와 마찬가지로 길이를 나타내는 롱, 미니, 미디가 2위, 4위, 5위였으며, 셔츠/블라우스와 마찬가지로 핏 &스타일 용어 1개(핏, 10위), 소재 용어 2개(플라워, 7위; 니트, 8위)가 포함되었다. 원피스에서 구성 용어 는 V넥(9위)과 카라(10위)였고 다른 아이템과 달리 시즌 용어(봄, 9위)도 나타났다. 한편, 성별 용어인 여 성은 모든 아이템에서 3위~4위였다. 이를 종합하면, 상품명에서 10위권 내의 다빈도 용어는 주로 아이템, 핏&스타일 및 의복구성 정보를 전달하는 용어들이었 고 더불어 길이와 소재 용어도 다수 포함됨을 알 수 있다. 따라서, 상품명 용어들을 정보 종류에 따라 분 류하고 그 비중을 분석함으로써 상품명에서 중요한 정보군을 파악할 필요가 있겠다.

    3) Information on frequent terms by item

    아이템별 정보 종류의 비중을 비교하기 위해 출현 율 0.1% 이상인 용어를 아이템, 의복구성, 핏&스타 일, 길이, 소재, 시즌, 타겟집단(성별, 연령), 용도, 색 상, 컨셉, 사이즈, 브랜드 및 판매정보(판매점, 배송정 보, 가격정보)로 구분하였다(Table 5).

    모든 아이템에서 아이템 용어가 1위~2위였다. 아이 템 용어와 더불어 소재, 핏&스타일 및 의복구성 용어 가 모든 아이템에서 5위권에 들었다. 그 외 길이(스커 트, 드레스), 타겟집단(팬츠, 셔츠/블라우스, 드레스), 그리고 브랜드(셔츠/블라우스)가 특정 아이템에서 5 위권에 포함되었다. 따라서 상품명에서 아이템, 소재, 핏&스타일 및 의복구성 정보가 가장 중요한 정보군 이라 할 수 있으며, 스커트와 드레스에서는 길이 정보 도 중요하다고 하겠다.

    정보 그룹별 용어의 수를 비교하면 다음과 같다. 먼저, 아이템, 타겟집단, 길이 관련 용어 수는 2~7개 로 적었다. 그러나 소재는 스커트 33개, 팬츠 25개, 셔 츠/블라우스 25개, 드레스 30개로 많았다. 의복구성 정보도 스커트와 팬츠는 25개, 27개였고 셔츠/블라우 스와 드레스는 54개, 47개로 많았다. 브랜드 정보는 스커트와 셔츠/블라우스는 31개, 33개, 팬츠와 드레스 는 18개, 6개였다. 그 외 색상 정보는 7~14개, 계절 정 보는 5~10개였다.

    2. Frequent term by information type

    아이템, 의복구성, 소재, 핏&스타일 및 길이가 중 요 정보로 파악됨에 따라 정보별 다빈도 용어를 분석 하였다. 이를 통해 현시점에서 소비자가 관심을 보인 정보의 종류와 구체적인 용어를 파악할 수 있을 것이 며, 이는 추후 각 아이템의 상품명 구성 시 참고자료로 활용할 수 있을 것이다. 다만, 1위~2위에 오른 아이템 용어는 2~7개로 이미 파악되었으므로 제외하였고, 색 상 정보는 6위~9위이나 직접적인 상품정보로서 상품 이미지 연상에 미치는 영향이 크므로 포함하였다.

    1) Characteristics of terms related to clothing making

    의복구성 정보는 스커트와 팬츠에서 3위, 셔츠/블 라우스와 드레스에서 1위로 그 비중이 매우 컸다. 용 어의 수도 스커트와 팬츠는 25개와 27개, 셔츠/블라우 스와 드레스는 54개, 47개로 소재 정보와 더불어 그 수가 가장 많은 정보 중 하나였다(Table 5).

    용어 특징을 구체적으로 살펴보면(Table 6), 스커 트와 팬츠의 다빈도 용어들은 2가지 특징으로 나뉘었 다. 첫째, 허리의 구성법 용어가 많았다. 밴딩, 뒤, 하 이웨이스트, 허리는 출현율 0.5% 이상의 최다빈도 용 어였고 벨트, 고무밴드, 히든(밴드), 스트링은 0.1% 이 상이었다. 특히, 스커트와 팬츠의 최다빈도 용어가 5 개, 6개이며 이 중 허리 관련 용어가 3개, 4개이므로 매우 큰 비중이다. 둘째, 디테일 표현과 그 위치를 설 명하는 용어가 많았다. 트임과 핀턱, 언밸런스를 비롯 해 버튼, 포켓, 턱, 셔링, 프릴 등의 디테일 용어와, 밑 단, 앞, 옆 등의 위치 용어가 많았다. 이를 통해 소비 자들이 스커트와 팬츠의 허리 구성법과 턱, 셔링, 프 릴 등의 디테일에 관심이 있음을 알 수 있다.

    셔츠/블라우스는 목둘레와 칼라(collar)의 형태에 관한 용어가 가장 많았고 다음으로 소매 용어가 많았 다. 목둘레는 V넥과 라운드넥이 많았고, 칼라 용어는 카라, 타이, 리본, 빅(카라)이 많았다. 소매는 소매, 긴 팔, 퍼프가 많았다. 더불어 프릴, 셔링, 버튼, 포켓 등 도 다빈도 용어였다. 이를 통해, 현시점에서 소비자들 이 긴팔과 퍼프소매 그리고 V넥과 라운드넥, 타이, 리 본, 빅(카라)에 관심이 많음을 알 수 있다.

    드레스도 셔츠/블라우스처럼 목둘레와 칼라에 관 한 용어, 그리고 소매 용어가 많았으며 더불어 스커트 에 관한 용어가 많은 편이었다. 목둘레는 V넥, 칼라는 카라로 대표되는 반면, 소매 용어는 나시, 퍼프, 소매, 긴팔 등이 다빈도 용어였다. 스커트 부분은 플레어와 스커트로 대표되었으나 플레어 이외에 랩, 플리츠, 캉 캉이 다빈도 용어에 포함되었다. 또한 프릴, 셔링, 벨 트, 스트링, 트임, 랩 등의 디테일 용어도 많은 편이었 다. 역시 소비자가 선호하는 네크라인, 소매 및 스커 트 스타일을 알 수 있다고 하겠다.

    그러나 유사한 의미의 다양한 용어 사용 문제도 드러났다. 주름을 나타내는 주름과 플리츠, 트임을 뜻하는 트임과 슬릿이 모두 다빈도 용어에 포함되 었다. 또한, 옆을 뜻하는 옆과 사이드, 다층구조를 뜻하는 이중과 레이어드도 다빈도 용어였다. 이렇 듯 같은 의미의 한글 용어와 한글로 표기된 영어 용어가 혼용되는 상황이었다. 검색 단어에 따라 결 과가 달라지므로 한글 용어와 영어 용어를 혼용하는 것은 상품의 노출을 감소시키는 원인이 되므로 지양 해야 할 것이다. 다음으로, 아이템에 따라 품사나 철 자가 다른 문제도 있었다. 예로, 벨트 용어는 스커트 에서는 벨트, 바지에서는 벨티드로 품사가 달랐고, 언 밸런스는 스커트와 셔츠/블라우스는 언발로 팬츠는 언발란스로 표현하는 경향이 있었으며, 하이웨이스트 도 하이웨스트, 하이웨이스트, 허리 등 철자가 다르거 나 다른 용어를 혼용했다. 한편, 핀턱의 경우, 셔츠/블 라우스나(42위) 드레스보다(88위) 팬츠와 스커트에서 의 순위가 2위, 12위로 매우 높았으나 스커트와 팬츠 에 흔하게 사용되는 디테일로 보기 어렵다. 더불어 팬 츠는 핀턱 이외에 플리츠도 7위의 다빈도 용어였으나 마찬가지로 적합한 용어 사용을 확신하기 어려운 상 황이다. 더불어 프릴넥, 카라넥처럼 전공용어가 아닌 용어들도 다빈도 용어에 포함되었다.

    2) Characteristics of terms related to fabric

    소재 용어도 모든 아이템에서 4위권에 드는 정보였 고 용어의 수도 24~30개로 많은 편이었다(Table 5). 대체로 소재 종류, 문양 종류 및 물성 용어들이었고, 소재 종류의 비중이 가장 컸고 다음으로 문양 종류, 물성 순이었다(Table 7). 출현율 0.5% 이상의 최다빈 도 용어를 보면, 스커트는 소재 종류 9개(니트, 울, 데 님, 레이스, 샤, 레더, 코듀로이, 면), 문양 3개(체크, 플라워, 무늬)였고 드레스도 소재 종류 4개(니트, 코 튼, 레이스, 쉬폰), 문양 2개(플라워, 프린트)로 소재 종류가 많았다. 팬츠는 소재 종류만 4개(면, 스판, 코 듀로이, 린넨)였고 물성 용어가 1개(기모)가 포함되었 다. 한편 셔츠/블라우스는 소재 종류 4개(레이스, 면, 데님, 쉬폰), 문양 4개(스트라이프, 체크, 플라워, 프린 트)였고 물성 용어 1개(시스루)가 포함되었다. 따라서 현시점에서 소비자들이 선호하는 소재 종류는 면(모 든 아이템), 레이스(팬츠 제외), 데님(스커트와 셔츠/ 블라우스), 코듀로이(스커트와 팬츠), 쉬폰(셔츠/블라 우스와 드레스), 니트(스커트와 드레스) 등이라 할 수 있고, 선호하는 문양은 체크, 플라워, 스트라이프라 하겠다. 그러나 문양의 경우, 스커트와 팬츠는 체크, 셔츠/블라우스는 스트라이프, 드레스는 플라워의 빈 도가 가장 많아 아이템에 따라 선호 문양이 다름을 알 수 있다.

    한편, 소재 용어도 의복구성 용어와 같은 문제점을 보였다. 첫째, 쭈리와 같은 비표준어나 찰랑 등의 비 전문 용어의 사용이 많았다. 둘째, 블렌디드와 혼방처 럼 영어 표기와 한글 표기가 혼용되었으며, 셋째, 무 늬, 패턴, 프린트, 나염 등 유사어들이 혼용되었다. 비 표준어나 비전문 용어, 그리고 다양한 유사어 사용은 검색 결과를 분산시킴으로써 판매자와 소비자 모두의 만족도를 떨어뜨리는 원인이 될 수도 있으므로 지양 할 필요가 있겠다.

    3) Characteristics of terms related to length, fit & style and color

    핏&스타일 정보는 스커트와 팬츠에서 각각 4위와 3위로 비중이 큰 편이었고, 다빈도 용어의 수도 15개, 18개로 적지 않았다. 그러나 셔츠/블라우스와 드레스 에서는 7위로 중간이었으며 용어 수도 각각 5개, 9개 로 적은 편이었다(Table 5).

    스커트와 팬츠의 핏&스타일 용어를 살펴보면 (Table 8), 스커트는 종류(플리츠, 플레어, 머메이드, 베이직, 랩, 캉캉 등)와 실루엣(H라인, A라인 등)을 나 타내는 용어가 많았다. 팬츠도 종류(와이드, 조거, 부 츠컷, 일자, 배기, 통바지 등)와 핏(핏, 슬림, 세미 등) 을 표현한 용어가 많았다. 그러나 셔츠/블라우스와 드 레스는 종류보다는 실루엣이나 핏 용어가 많았다. 셔 츠/블라우스에서는 핏, 루즈, 오버핏, 박시, 슬림이 다 빈도 용어였고 드레스에서는 핏, 슬림, 루즈, A라인, 라인, 오버핏, 박시, 타이트, H라인이 다빈도 용어였 다. 한편, 종류를 나타내는 용어는 드레스의 바디콘이 0.04%였고, 스윙, 베이비돌, 썬드레스, 서플리스는 모두 0.01%로 하위권이었다. 기본 스타일인 시프트 (shift)도 0.01% 미만이었으나 이는 슬림(0.84%), H라 인(0.12%)이 주로 사용된 결과라 하겠다. 스커트 팬츠 와 달리 드레스 종류가 하위권에 나타난 결과는 소비 자의 비선호보다는 전공용어 사용으로 인한 노출 감 소로 해석할 수 있으므로 상품명 용어 구성의 또 다른 주의점이라 하겠다.

    더불어, 핏&스타일 관련 다빈도 용어에서도 일자 와 스트레이트, 기본과 베이직 등 한글과 영어의 혼용 문제가 드러났으며, 유사어는 아니나 루즈, 박시핏, 오버핏 등 핏이 명확히 구분되지 않아 혼란을 유발할 수 있는 용어도 있었다.

    길이 정보를 전달하는 용어는 스커트와 드레스는 4 위~5위로 상위권이었으나 팬츠와 셔츠/블라우스는 모 두 12위로 하위권이었다. 분포율도 스커트와 드레스 는 7.48%, 13.81%로 매우 컸으나, 팬츠와 셔츠/블라 우스는 1% 내외로 매우 적었다. 스커트와 드레스의 길이 용어는 모두 롱, 미니, 미디 순이었다(Table 9). 스커트는 롱이 4.70%로 미니(2.10%)나 미디(0.68%) 에 비해 매우 많았다. 이는 롱에 대한 소비자들의 강 한 선호가 반영된 것이라 하겠다. 그러나 드레스는 롱 5.18%, 미니 4.53%, 미디 3.86%로 비교적 유사하였 다. 이는 데이터수집 과정의 영향으로 롱, 미디, 미니 의 3개 폴더로 나뉘어 있는 상품명을 각각 수집한 후 합쳐 분석했기 때문이라 하겠다.

    색상 정보는 상품 이미지를 결정하는 중요한 요소 이나 상품명에 포함된 색상 정보는 셔츠/블라우스 6 위, 팬츠 8위, 스커트와 드레스 9위로 높지 않았고 그 비중도 1.78%~3.45%로 적은 편이었다(Table 5). 사용 된 용어로는(Table 10) 배색, 블랙, 청, 블루, 화이트, 핑크, 베이지 등의 순위가 높았으나 아이템별 비중은 달랐다. 스커트는 배색, 블랙, 청, 베이지, 블루 순이었 으나 팬츠는 블랙, 아이보리, 배색, 베이지, 핑크, 화이 트 순이었고, 셔츠/블라우스는 배색, 화이트, 청, 블랙, 블루, 아이보리 순이었으며, 드레스는 배색, 블랙, 화 이트, 블루, 청, 핑크 순이었다. 색상 용어는 다른 정보 와 달리 대부분 영어의 한글표기였으나 청과 블루와 같이 한글과 영어가 혼용되기도 하였다.

    3. Use of various synonyms and product exposure

    1) Reduction in product exposure due to terminology mixing

    아이템별, 정보 종류별 다빈도 용어를 분석한 결과 현시점에서 소비자들이 관심을 보이는 구체적인 용어 를 파악할 수 있었으나, 동시에 판매자와 소비자 연결 을 방해하는 용어 사용 문제도 있었다. 유사어의 혼 용, 같은 의미의 한글 용어와 영어 용어의 혼용, 비표 준어 또는 줄임말 사용, 다른 품사 사용 등의 문제였 다. 온라인 상품검색에서 사용되는 용어는 의미와 상 관없이 철자에 따라 검색 결과가 달라지므로 이런 문 제는 모두 개선될 필요가 있다. 다만, 상품 노출을 배 가시키기 위해 용어를 혼용했는지 확인할 필요가 있 으며, 그 결과는 소비자 친화적 상품명 구성에 활용할 수 있는 중요한 참고자료가 될 것이다.

    용어 혼용은 크게 유사어의 혼용과 한글과 영어의 혼용으로 구분되었다. 먼저, 유사어의 혼용은 아이템 용어 간 혼용이 두드러졌다(Table 11). 아이템 용어는 상품 분류의 첫째 기준이며 다른 정보에 비해 용어의 수도 수 개뿐이고 대부분 최다빈도 용어들이므로 그 영향력은 더 클 수 있다. 스커트에서는 스커트(1위)> 치마(14위)가 혼용되었고, 팬츠에서는 팬츠(1위)>슬 랙스(4위)>바지(6위)가 혼용되었으며, 셔츠/블라우스 에서는 블라우스(1위)>셔츠(2위)>남방(5위), 드레스 에서는 원피스(1위)>드레스(6위)가 혼용되었다.

    아이템 용어들의 혼용과 상품명의 노출 확대 간의 연계성을 파악하기 위해 공출현빈도를 분석하였다. 블라우스-셔츠의 공출현빈도가 389로 가장 많았고 팬 츠-슬랙스가 260, 셔츠-남방이 186으로 많은 편이었 으나, 그 외 스커트-치마 21, 팬츠-바지 38, 슬랙스-바 지 42, 블라우스-남방 53으로 적었다. 다만, 원피스-드 레스의 공출현은 658이었다.

    이처럼 원피스-드레스, 블라우스-셔츠, 팬츠-슬랙스 의 공출현빈도가 많은 편이나, 각 용어의 빈도가 원피 스 21,065, 드레스 3,879, 셔츠 2,806, 블라우스 5,720, 팬츠 5,698, 슬랙스 1,866인 점을 고려하면 결코 많다 고 볼 수 없으며, 특히 원피스는 다른 아이템에 비해 데이터 수가 약 3배에 달하므로 이를 고려하여 해석 해야 한다. 빈도가 높은 용어들의 공출현빈도가 높다 면 이는 노출을 배가시키는 긍정적 효과를 가져오나 공출현빈도가 높지 않은 용어의 단순 혼용은 검색에 서 제외되는 결과를 가져올 뿐이므로, 낮은 빈도의 용 어 사용을 지양하고 상위빈도 용어를 사용할 것은 추 천한다.

    유사어 혼용의 다른 예는 셔츠/블라우스와 드레스 에 나타난 루즈, 박시, 오버핏, 팬츠의 골지와 쭈리, 드 레스의 프린트, 패턴, 무늬, 나염 등이다. 루즈, 박시, 오버핏은 핏&스타일 정보분석에서 언급한 바와 같이 구분이 명확하지 않으므로, 판매자나 소비자의 주관 적 판단에 따라 서로 다르게 판단할 수 있다. 이 용어 들의 공출현빈도도 3~22로 매우 적었으므로 노출 확 대 의도보다는 판매자의 단순 혼용으로 볼 수 있다. 마찬가지로 니트의 리브직을 표현한 골지와 쭈리도 공출현빈도가 없었으므로 단순 혼용이라 하겠다. 드 레스의 프린트, 패턴, 무늬, 나염도 각 용어의 빈도에 비해 공출현빈도는 8~11로 매우 적으므로 역시 단순 혼용이라 하겠다.

    두 번째 특징은 같은 의미의 국어와 한글식 영어 용어의 혼용이다. 주름과 플리츠(스커트, 셔츠/블라우 스, 드레스), 일자와 스트레이트(팬츠), 기본과 베이직 (팬츠), 트임과 슬릿(스커트, 팬츠), 그리고 블루와 청 (셔츠/블라우스)이 그 예이다. 마찬가지로 상품 노출 을 늘리기 위해 2가지 용어의 동시 사용을 확인하기 위해 공출현빈도를 분석하였으나(Table 12), 각 용어 의 빈도에 비해 공출현빈도는 매우 적었다. 가장 많은 공출현은 스커트와 드레스에서 플리츠-주름의 공출현 이 각각 73, 76이었으나 이 또한 플리츠가 1,000 이상, 주름 400~600의 빈도임을 고려할 때 매우 적다고 하 겠다. 따라서 노출 확대보다는 판매자의 주관적 선택 에 의한 혼용으로 볼 수 있으므로 상위빈도의 용어 사 용이 바람직하다고 하겠다.

    2) Other terms hindering product exposure

    0.1% 이상의 다빈도 용어에 포함되지 않으나 판매 자와 소비자의 연결을 방해하는 용어들도 파악되었 다. 다양한 색상 표현과 비전문용어 사용이다. 먼저 색상은 유사한 색상을 표현하는 용어가 매우 많았다. 파란색을 나타내는 용어는 블루, 청, 네이비, 파란색, 코발트, 진청, 연청, 흑청, 스카이블루, 스카이, 청청, 딥블루, 소라, 하늘색 등이었고, 베이지도 아이보리, 바닐라, 크림, 상아, 라떼, 오트밀, 모카, 리코타, 파우 더리, 와플, 샌드, 팝콘 등 매우 다양하였다. 이로 인해 색상이 상품구매 시 중요한 정보임에도 불구하고(Han, 2021;Kim & Lee, 2018) 색상 용어가 분포율 0.1% 이상의 다빈도 용어에 포함되지 못했다고 하겠다. 물 론 고유한 색상명이 전달하는 이미지는 각각 다를 것 이나 상품노출을 확대하기 위해서는 고유한 색상보다 색상계열 명칭을 활용하는 것이 좋겠다.

    다음으로 비전문용어 사용의 예로 네크라인 용어 를 들 수 있다. 셔츠/블라우스와 드레스에서 V넥, 라 운드넥, 하이넥, 스퀘어넥, 프릴넥, 카라넥은 다빈도 용어였다. 이 중 프릴넥과 카라넥은 비전문용어로 직 관적 표현이 특징이다. 그 외 러플넥, 셔링넥, 타이넥, 리본넥, 히든넥, 플리츠넥, 리브넥, 레이스넥, 물결넥, 일자넥도 같은 맥락이다. 직관적 표현으로 제품 특징 을 전달하기는 용이할 수 있으나 정식용어가 아니므 로 인지도가 낮을 수 있고, 러플넥, 셔링넥, 플리츠넥 과 같이 명확하게 구분하기 어려운 경우는 오히려 혼 란스러울 수 있다. 다만 상품명이 소비자의 언어적 성 향을 무시한 채 만들 수 없으므로(J. H. Kim, 2005), 직관적 용어표현 특성은 주의 깊게 살펴볼 필요가 있 겠다.

    상품 노출을 방해하는 용어 혼용에 관한 내용을 요 약하면 <Table 13>과 같다.

    Ⅴ. Conclusion

    본 연구는 온라인쇼핑 여성 의류 중 스커트, 바지, 셔츠/블라우스, 원피스의 상품명을 구성하는 다빈도 용어를 추출하고 그 정보를 분석하여, 상품명 구성 특 징과 문제점을 파악하고자 하였다. 이는 온라인 판매 의류 상품의 소비자 노출을 늘리고 정확한 정보를 전 달하는 방안을 모색하기 위한 자료로 활용될 수 있을 것이다. 또한 상품명처럼 단어의 단순 나열형 텍스트 빅데이터의 연구 사례를 제시하여 추후 다양한 텍스 트마이닝 연구의 참고자료로 활용될 수 있을 것이다. 이를 위해 네이버에서 구매로 연결된(리뷰많은순) 최 근 2년간의 상품명을 수집하고 수동정제과정을 거쳐 키워드를 추출한 후, TF 기반의 빈도 분석으로 다빈 도 용어와 각 용어의 정보를 분석하였다. 더불어 유사 어의 혼용, 국어와 영어의 한글표기 혼용 등의 특징이 파악됨에 따라 N-gram 네트워크 분석으로 용어 혼용 과 상품 노출의 연계성을 분석하였다. 상품명 수집 시 기는 2022년 2월 21일~28일이었다.

    스커트 7,916개, 바지 7,989개, 셔츠/블라우스 8,003 개, 원피스는 미니, 미디, 롱을 합하여 22,376개의 상 품명을 텍스트마이닝하여, 스커트 2,652, 팬츠 1,669, 셔츠/블라우스 2,290, 드레스 3,558개의 용어를 추출 하였다. 이 중 분포율 0.1% 이상을 다빈도 용어로 구분 하여 분석하였다. 분포율 0.5% 이상인 용어는 31~36 개였고 누적분포율은 53%~59%였으며, 0.1% 이상인 용어는 143~169개였고 누적분포율은 80% 내외였다. 따라서 온라인쇼핑에서 거래로 연결된 의류 상품명은 30개~150개 용어에 의해 50%~ 80%가 구성되었음을 알 수 있다. 텍스트마이닝으로 추출된 용어 수가 수천 개임을 고려할 때 용어의 반복 사용을 짐작할 수 있 다. 따라서 다빈도 용어와 용어가 전달하는 정보를 구 체적으로 분석함으로써 구매로 연결된 상품명의 용어 특성을 파악하고자 하였다.

    아이템별로 다빈도 용어의 정보 종류와 그 비중을 분석한 결과, 모든 아이템에서 아이템, 의복구성, 소 재가 5위권에 드는 가장 중요한 정보였고 그 외 핏& 스타일 정보는 스커트와 팬츠에서, 길이 정보는 스커 트와 드레스에서 5위권에 들었다. 따라서 상품명 구 성 시 이들 중요 정보를 모두 포함할 것을 추천한다.

    또한, 현시점에서 소비자가 관심을 가지는 용어를 파악하기 위해 정보별로 사용된 용어를 구체적으로 분석하였다. 의복구성 용어의 경우, 스커트와 팬츠에 서는 밴딩, 하이웨이스트, 허리 등 허리 구성 용어와, 트임, 핀턱, 언발란스 등 디테일 용어, 그리고 밑단, 앞, 옆 등 그 위치에 관한 용어의 순위가 높았다. 셔츠 /블라우스와 드레스는 V넥, 라운드넥 등의 목둘레 형 태와 카라, 타이, 리본 등의 칼라 종류, 그리고 소매, 긴팔, 퍼프, 나시 등 소매 용어의 순위가 높았다. 또한 드레스의 스커트 특징을 나타내는 플리츠와 플레어도 높은 순위였다.

    다음으로 소재 용어는 소재 종류, 문양 종류, 물성 정보로 구분되었으며 소재 종류로는 면(모든 아이템), 레이스(팬츠 제외), 데님(스커트와 셔츠/블라우스), 코 듀로이(스커트와 팬츠), 쉬폰(셔츠/블라우스와 드레 스), 니트(스커트와 드레스)가 상위권이었고, 문양 종 류는 스커트와 팬츠의 체크, 셔츠/블라우스의 스트라 이프, 드레스의 플라워의 빈도가 높아 아이템에 따라 선호 문양이 다름을 알 수 있었다.

    그 외 핏&스타일과 길이 용어의 특징은 다음과 같 다. 핏&스타일 용어로 스커트의 플리츠, 플레어, 머메 이드, 팬츠의 와이드, 조거, 부츠컷 등 종류를 나타내 는 용어, 실루엣 용어(H라인, A라인 등) 및 핏 용어 (핏, 슬림, 세미 등)의 순위가 높았다. 길이 용어는 스 커트와 드레스에서 중요 정보였으며 스커트에서는 롱 의 출현율이 매우 높아 소비자들의 강한 선호가 반영 되었다고 해석할 수 있다.

    이상과 같이 정보 종류별 다빈도 용어분석을 통해 현시점에서 소비자가 수용하는 디자인 특징과 그 정 보를 전달하는 용어를 구체적으로 파악할 수 있었으 며 이에 의의가 있겠다. 그러나 동시에 판매자와 소비 자 연결을 방해하는 용어 사용 문제로 유사어의 혼용, 국어와 한글식 영어표기의 혼용, 비표준어 또는 줄임 말 사용, 다른 품사 사용 문제 등도 파악되었다. 온라 인 상품검색은 단어의 의미와 상관없이 철자에 따라 그 결과가 달라지므로 이런 문제는 모두 지양되어야 할 것이다. 특히, 다빈도 용어일수록 검색 결과에 미 치는 영향이 크므로 다빈도 용어의 문제는 우선적으 로 개선할 필요가 있다.

    먼저, 유사어 혼용 문제는 아이템 용어에서 두드러 져, 스커트-치마, 팬츠-슬랙스-바지, 블라우스-셔츠-남 방, 그리고 원피스-드레스 등 모두 최다빈도 용어 간 혼용이었다. 공출현빈도 분석을 통해 용어의 혼용과 상품명의 노출 증가 간의 연관성을 분석하였으나 대 부분 공출현빈도가 매우 적었다. 따라서 노출을 배가 시키는 긍정적 효과를 위한 혼용보다는 단순 혼용으 로 볼 수 있으며, 이는 검색에서 제외되는 결과를 가 져올 뿐이므로 상위빈도 용어를 사용하여 노출을 증 가시킬 필요가 있겠다.

    다음으로, 한글과 영어의 혼용 문제는 주름과 플리 츠, 일자와 스트레이트, 기본과 베이직, 트임과 슬릿 에서 찾을 수 있으며 역시 모두 다빈도 용어이다. 아 이템 용어와 마찬가지로 동시 노출 의도보다는 판매 자의 주관적 선택에 의한 혼용이라 할 수 있으므로 상 위빈도 용어 사용을 추천한다.

    그 외 다양한 색상과 비전문용어의 사용도 상품 노 출 기회를 감소시킬 수 있다. 파란색은 블루, 청, 네이 비를 포함해 14개 이상의 용어가 사용되었고, 베이지 도 아이보리, 바닐라, 크림을 포함해 12개 이상의 용 어가 사용되었다. 이로 인해 색상에 대한 소비자 관심 이 높음에도(Han, 2021;Kim & Lee, 2018) 색상 용어 들이 다빈도 용어에 포함되지 못했다고 하겠다. 물론 고유한 색상마다 전달하는 정보가 다를 수 있으나, 상 품 노출 확대를 위해서는 대표 색상과 함께 사용할 것 을 권장한다. 더불어 네크라인의 다양한 비전문용어 도 주목할 필요가 있다. 프릴넥, 카라넥은 다빈도 용 어였고 그 외 러플넥, 셔링넥, 타이넥 등 직관적 표현 의 매우 다양한 용어가 사용되었다. 이는 제품 특징 전달에 용이할 수 있으나 비전문용어로 판매자나 소 비자의 낮은 인지도가 우려되며, 러플넥, 셔링넥, 플 리츠넥과 같이 뚜렷이 구분되지 않는 경우는 오히려 오해의 원인이 될 수 있다. 이러한 용어의 혼용, 다양 한 색상 및 네크라인 용어의 문제점은 남성 스트라이 프 셔츠 어휘에 나타난 현실 언어의 특성, 유사어의 통일, 맞춤법과 외래어 표기의 정제 필요성(Ah & Park, 2018)과 일맥상통하는 결과로, 의류 상품 관련 용어 사용의 현황과 개선의 필요성을 다시 한번 입증 했다고 하겠다.

    본 연구는 온라인 의류 상품 중 구매로 연결된 상 품명을 텍스트마이닝하여 상품명을 구성하는 다빈도 용어와 정보 특징 및 문제점을 파악할 수 있었으므로 이에 의의를 둘 수 있다. 특히, 상품 노출을 방해하는 용어 혼용 및 다양한 용어 사용은 지양되어야 하므로, 판매자의 주관적 용어 사용보다는 상품명 용어 구성 의 기준이 마련되어 판매자의 사용 편의성과 소비자 의 검색 효율성이 향상되기를 희망한다. 동시에 상품 노출과 소비자 관심 유발을 유도하는 상품명 구성을 위한 참고자료로 활용되기를 희망한다. 다만, 데이터 수집 대상과 시간에 따른 한계점이 존재하며, 한국어 와 영어가 혼용된 데이터를 수동정제하고 결과를 해 석하는 과정에서 연구자의 주관적 판단을 모두 배제 하기 어렵다는 한계점이 존재하므로 연구 결과의 해석 에 주의가 필요하다.

    Figure

    Table

    Number of data for analysis by item

    The number and distribution rate of terms extracted by text mining for each item

    Frequent term by item (more than 0.5%)

    Word cloud of frequent terms by item (more than 0.5%)

    Distribution of information categories by item

    Frequent terms related to clothing making

    Frequent terms related to fabric

    Frequent terms related to fit & style

    Frequent terms related to length

    Frequent terms related to color

    Frequency of synonyms and co-occurrence

    Comparison of frequency and co-occurrence of terms in English and Korean notation

    Representative examples of mixed use of terms

    Reference

    1. An, H. , & Park, M. (2018). A study on the evaluation of fashion design based on big data text analysis -Focus on semantic network analysis of design elements and emotional terms. Journal of the Korean Society of Clothing and Textiles, 42(3), 428-437.
    2. Han, K. H. (2021). A convergence analysis study on online review of short-sleeved t-shirt. The Korean Society of Science & Art, 39(4), 541-555.
    3. Hong, M. J. , & Song, H. J. (2015). 식품 상품명의 언 어적 특징과 사회문화적 의미 [Linguistic characteristics and socio-cultural meaning of food product names]. The Linguistic Science Society, 72, 417-438.
    4. Internet Trend. (2022, December 17). 검색엔진 [Search engine]. Retrieved December 17, 2022, from http://www.internettrend.co.kr/trendForward.tsp
    5. Jang, N. , & Kim, M.-J. (2020). Material as a key element of fashion trend in 2010~2019 –Text mining analysis-. Fashion & Textile Research Journal, 22(5), 551-560.
    6. Jeong, J.-W. , & Lee, J.-S. (2016). An analysis on the product name for the domestic cosmetics brands. Journal of the Korea Fashion & Costume Design Association, 18(1), 91-103.
    7. Kim, C. J. , & Na, Y. J. (2022). 온라인 패션 시장에 서 소비자 빅데이터 분석 [Consumer big data analysis in the online fashion market]. Proceeding of 2022 Spring Annual Conference of Korean Society for Emotion & Sensibility, 71.
    8. Kim, J.-H. (2005). A study of the goods’ name: Centering around the food name. The Society of Korean Language and Literature, 24, 33-67.
    9. Kim, J.-H. , & Lee, J.-M. (2018). Comparison and analysis of domestic and foreign sports brands using test mining and opinion mining analysis. Journal of the Korean Contents Association, 18(6), 217-234.
    10. Kim, J.-S. (2005). 독일 광고에 나타난 상품명의 분석 과 네이밍 전략 [Analysis of product names and naming strategy in German advertisements]. Koreanishe Gesellschaft Für Didaktik der deutshen Sprache und Literatur, 32, 89-110.
    11. Kim, K. O. (1985). Linguistic analysis of commodity name. Unpublished master’s thesis, Yonsei University, Seoul, Korea.
    12. Kim, S. R. (2020). A convergence study on the perception of anorak fashion using big data analysis. The Korean Society of Science & Art, 38(4), 43- 55.
    13. Kuk, S. Y. (2010). A study on the classification of confectionary brand names. Unpublished master’s thesis, Korea National University of Education, Seoul, Korea.
    14. Lee, A. , & Lee, J. H. (2018). A study of perception of golfwear using big data analysis. Fashion & Textile Research Journal, 20(5), 533-547.
    15. Lee, J.-H. , Lee, J.-M. , Kim, W.-K. , & Kim, H.-G. (2017). A study on perception of swimsuit using big data text-mining analysis. Korean Journal of Sport Science, 28(1), 104-116.
    16. Lee, M. , Chung, K. , & Park, J. (2021). Big data analysis of global sportswear brands. Journal of the Korean Society of Costume, 71(5), 96-112.
    17. Sim, J.-Y. , & Kim, S. Y. (2008). A study for fashion product name of BEST 100 in cyber shopping mall. The Research Journal of the Costume Culture, 16(5), 955-962.
    18. Statistic Korea. (2022, February 3). December and annual online shopping trends. Retrieved October 20, 2022, from https://kostat.go.kr/portal/korea/kor_nw/1/1/index.board?bmode=read&aSeq=416587
    19. Suh, J.-H. (2002). The grammar of the naming of brands in Korean: The case of cosmetics. The Sociolinguistic Journal of Korea, 10(2), 265-282.

    Appendix