뉴스레터 구독자 여러분 안녕하세요! 데이터Hub팀 김진원입니다. 위드코로나가 시행된 지 어느덧 1달이 지나갑니다. 오미크론 변이가 다시 긴장감을 주고 있어 걱정이 많이 되네요😢 내년에는 무탈하게 사람들로 가득찬 캠퍼스가 되기를 바랍니다.
오늘은 “2021년에는 어떤 연구들이 많이 진행되었을까?”라는 주제로 이야기를 해볼까 합니다. 2020년에 이어서 2021년에도 COVID-19와 관련된 연구가 많이 진행되었을 것으로 예상할 수 있을 것입니다. COVID-19와 관련된 SARS-CoV 관련 연구들도 재조명되었을 것 같네요. 이 밖에도 2021년에는 어떤 연구들이 많이 진행되고 있는지 실제 데이터와 함께 알아보도록 하겠습니다.
– 활용 데이터: 2021년 5월 ~ 8월 사이에 출판된 연구논문(CrossRef API를 통해 from-pub-date / until-pub-date의 조건을 걸어 수집)
– 연구논문 수집 과정:
[1] Scopus 및 WOS 등재 저널을 통해 저널의 ISSN(International Standard Serial Number) 번호 수집[2] CrossRef API와 ISSN 번호를 통해 특정 기간에 출판된 논문의 리스트와 DOI (Digital Object Identifier) 번호 수집[3] 수집된 DOI 번호 및 Scopus API & WOS API를 통해 논문의 상세 정보 수집위의 과정을 통해 약 20만 개의 논문데이터가 수집되었습니다. 중복 수집되거나 논문 키워드 및 논문 연구 분야가 제대로 수집되지 않은 논문 데이터를 전처리한 후 총 146,379개의 논문 데이터를 분석에 활용하였습니다. 아래 그림 1은 활용된 논문 데이터의 일부에 해당합니다.
그림 1. 활용된 논문 데이터 예시
그림 2는 키워드의 빈도수를 이용하여 시각화한 모습에 해당합니다. 예상한 대로 ‘COVID-19’, ‘SARS-CoV-2’이라는 키워드가 눈에 띄는 것 같습니다. 이 밖에도 ‘Machine learning’, ‘Deep learning’이 눈에 띕니다. Computer Science 연구 영역 뿐만 아니라 다양한 영역에서 AI 기술이 활용하다보니 관련 키워드들이 도드라지게 된 것 같습니다.
그림 2. 논문 키워드 Wordcloud
그렇다면 어떤 연구 분야의 논문들이 많이 출판되었을까요? 연구 분야는 ASJC(All Science Journal Classification)를 활용하였습니다. 수집된 논문들의 연구 분야 중에서 상위 20개의 연구 분야는 그림 3과 같습니다.
그림 3. 상위 20개의 논문 연구분야
“Materials Science”, “Electrical and Electronic Engineering”, “Biochemistry”, “Chemistry”, “Condensed Matter Physics”의 연구 분야가 Top 5에 선정되었습니다. 예상 외로 Public Health의 연구 분야도 상위 연구 분야에 선정되었는데요, 아마도 COVID-19에 대한 관심 증가에 따른 결과이지 않을까 싶습니다. 이 밖에도 신재생에너지에 대한 연구도 활발하게 진행되고 있음을 알 수 있었습니다.
마지막으로, Computer Science와 Education 연구 분야에 해당하는 논문의 키워드를 살펴보도록 하겠습니다.
먼저, Computer Science 관련 연구에서는 “Deep learning”, “COVID-19”, “Machine learning” 이외에도 “Blockchain”, “Cloud Computing”, “5G”, ‘IoT”가 눈에 띄는 것 같습니다. 한편, 유례없는 규모로 장기화되고 있는 코로나 팬데믹 위기는 교육 패러다임에도 큰 영향을 미치고 있습니다. 대면 수업 방식이 원칙이었던 대학 수업이 전면 비대면 온라인 수업으로 전환됨에 따라 디지털 교육의 중요성이 더욱더 강조되고 있는데요, Education 관련 연구에서도 “COVID-19”, “Online learning”, “E-learning”, “Technology”가 최근의 연구 트렌트를 반영하는 키워드인 것으로 보입니다.
전세계적으로 COVID-19와 관련된 연구들이 활발하게 진행되고 있고 AI와 관련된 연구들 또한 최근에 더욱더 관심을 받고 있는 것은 분명해 보입니다. 1년, 5년, 10년 후에는 어떤 키워드가 새롭게 등장할까요? 지금은 생소하지만 미래에는 핵심 연구 주제가 될 키워드는 어떤 것이 있을까요? 이런 점을 예상하면서 연구를 바라보는 것도 흥미로울 것 같습니다.
지금까지 긴 글을 읽어주셔서 감사드리며, 건강 유의하시길 바랍니다.