메타데이터를 활용한 1960∼2018 <한국언론학보> 논문 분석 : 다이내믹 토픽 모델링(Dynamic Topic Modeling) 방법을 중심으로
초록
이 연구는 <한국언론학보> 창간호부터 2018년까지 논문 전집 메타데이터를 활용하여 두 가지 접근으로 학보의 60년을 분석하였다. 우선 기술통계 분석 결과 <한국언론학보>의 총 논문 수는 2,048편, 학보논문 저자는 1,276명으로 나타났다. 2001년 이후 누적 논문 수는 2000년 이전과 비교할 때 양적으로 약 3배 증가하였으나 최근 4년간 논문 수가 급감해 학보의 역할에 대한 논의가 필요함을 제안하였다. 학보 논문의 주요 토픽이 60년간 어떠한 진화 패턴으로 나타나는지 알아보기 위해 시계열 데이터 연산 알고리즘인 다이내믹 토픽 모델링(DTM : Dynamic Topic Modeling)으로 분석한 결과 첫째, 연구영역에서는 저널리즘과 온라인 저널리즘, 보도관련 저널리즘이 발생확률이 높은 토픽으로 추출된 반면, 문화연구는 발생확률이 낮게 나타났다. 둘째, 방법론에서는 경험주의 연구와 실증연구가 지배적 토픽으로 나타났고 컴퓨테이셔널 방법론도 증가추세로 나타났다. 셋째, 이론에서는 프레임, 이용과 충족, 의제설정이 주요 토픽으로 추출되었으며 넷째, 메시지연구는 효과 관련 토픽이, 다섯째, 수용자 연구에서는 정치참여, 텔레비전 시청, 청소년 관련 토픽이 지배적으로 나타났다. 마지막으로 연구대상에서는 온라인, 소셜미디어, 인터넷 토론 관련 토픽이 지배적으로 나타나 온라인 관련 연구가 활성화되었음을 알 수 있었다. 이 연구는 내용분석 분류 방법과 달리 메타데이터를 활용해 알고리즘과 기계학습으로 토픽을 추출하고 이를 군집화(clustering)하여 학보 논문의 연구경향 분석방법을 새롭게 제안해 논의했다는데 의의가 있다.
Abstract
This study analyzed the 60 years of journals, from the first issue to 2018, of the <Korean Journal of Journalism & Communication> with two approaches using the metadata of the complete edition of academic articles. First, the descriptive statistics indicated that the journal has 1,276 authors and 2,048 articles. From 2001, the number of articles has increased by threefold than before, but has been decreasing for the last four years. Next, we used Dynamic Topic Modeling (DTM) to understand the developing pattern of the topics by creating DTM of the stored articles every five years in six categories. The result of the field of the study showed that journalism, online journalism, and news-related journalism were frequently found while the cultural study was rare. Second, in the methodology, empirical study was the dominant topics over time and the computational methodology was increasingly used. Third, frame, usage and gratification, and agenda setting theory were extracted as the main theoretical topics, and fourth, in the message study, the effect related topics were dominant. Fifth, in the audience study, political participation, television viewing and teenager-related topics were extracted. Lastly, in the research subject, online, social media, and internet discussion were actively discussed topics, which indicates that this journal was enthusiastic to the online-related research. This study is notable as it suggests a new methodology to analyze the study trend of journal articles by clustering the extracted topics from an algorithm using metadata and machine learning.
Keywords:
Korean Journal of Journalism & Communication Studies, Dynamic Topic Modeling, Probabilistic Topic Models, metadata, sequential data키워드:
한국언론학보, 다이내믹 토픽 모델링, 확률적 토픽 모델, 메타데이터, 시계열데이터Acknowledgments
연구에 아낌없는 조언을 주신 최선열, 홍주현 선생님과 익명의 심사위원들께 깊이 감사드립니다. 이 논문은 한국언론학회 창립60주년기념학술대회 발표 내용을 근거로 작성하였고 한국언론학회, 누리미디어의 도움을 받아 데이터를 수집함. 이 연구는 2017년도 한국방송학회 특별연구비지원에 의해 수행되었음.
References
- 곽복산 (1959). 창간사 : 씨앗 뿌리는 정열로, 신문학보를 내면서. <신문학보>, 1권 1호.
- 김규환 (1969). 권두 : 커뮤니케이션 과학연구의 현황과 방향 : 학보 속간에 즈음하여. <신문학보>, 2권 1호. 5-11.
- 양승목 (2009). 언론학 연구 50년 : 성찰과 전망. <한국언론학회 50년사>(1019-1062쪽). 서울: 한국언론학회.
- 오성삼 (2002). <메타분석의 이론과 실제>. 서울: 건국대학교 출판부.
- 이수범·문원기 (2016).정치 광고의 효과에 대한 메타분석. <한국광고홍보학보>, 18권 2호, 182-212.
- 임영호 (2009). 저널리즘 연구 50년의 성찰. <한국언론학회 50년사>(427-454쪽). 서울: 한국언론학회.
- 조동시 (1999). 언론학 총 점검 : 언론관련 학과 현황. <신문과 방송>, 341호. 30-33.
- 정진석 (2009). 한국언론학회 50년: 성장과 변화의 역사(1959∼2009)(33-96쪽). <한국언론학회 50년사>. 서울: 한국언론학회.
- 차배근 (2009).한국언론학회를 일군 사람들: 한국신문학회를 중심으로(97-188쪽). <한국언론학회 50년사>. 서울: 한국언론학회.
- 최선열 (2009). 정치커뮤니케이션 연구 50년. <한국언론학회 50년사>(717-781쪽). 서울: 한국언론학회.
- 최선영·고은지 (2017). 미디어 멀티태스킹과 게이미피케이션을 통해 발현한 실시간 참여 민주주의. <한국방송학보>, 31권 3호, 78-113.
- 탁진영 (2004). 부정적 정치광고가 정치 체제에 미치는 부정적 영향에 관한 연구: 메타분석을 이용한 평가를 중심으로. <광고학연구>, 15권 4호, 73-98.
- 한국언론진흥재단 (2014). <한국언론연감>. 서울:한국언론진흥재단
- 한국언론학회 50년사 편찬위원회(2009). <한국언론학회 50년사>. 서울: 한국언론학회.
- 한국언론학회편집부 (2001). <언론학 교과목 현황 자료집>. 한국언론학회 연구보고서, 1-223.
- 홍주현 (2019). <2000년 이후 한국언론학보 논문을 통해 본 언론학 연구 경향 : 연구주제, 연구방법내용 분석 및 논문키워드 네트워크분석>. 2019년 한국언론학회 창립 60주년 기념 학술대회 대주제세션발표 논문. 광주: 국립아시아문화전당
- Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), 993-1022.
- Blei, D. M., & Lafferty, J. D. (2006). Dynamic topic models. In Proceedings of the 23rd international conference on Machine learning, ACM, 113-120. [https://doi.org/10.1145/1143844.1143859]
- Blei, D. M., Carin, L., & Dunson, D.B. (2010). Probabilistic Topic Models. IEEE Signal Processing Magazine, 27, 55-65. [https://doi.org/10.1109/MSP.2010.938079]
- Blei, D. M. (2012). Probabilistic Topic Models(review article). Communications of the ACM, 55 (4), 77-84. [https://doi.org/10.1145/2133806.2133826]
- Carr, E. H. (1961/2015). What is history?. Penguin UK.
- Chang, J., Boyd-Graber, J., Gerrish, S., Wang, C., & Blei, D. M. (2009). Reading tea leaves: How humans interpret topic models. In Advances in neural information processing systems NIPS. 288-296.
- Glass, G. V. (1976). Primary, secondary, and meta-analysis of research. Educational Researcher, 5, 3-8. [https://doi.org/10.3102/0013189X005010003]
- Jordan, M. I., & Mitchell, T. M. (2015). Machine learning: Trends, perspectives, and prospects. Science, 349(6245), 255-260. [https://doi.org/10.1126/science.aaa8415]
- Newman, D., Lau, J. H., Grieser, K., & Baldwin, T. (2010). Automatic evaluation of topic coherence. In Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics, 100-108.
- O’callaghan, D., Greene, D., Carthy, J., & Cunningham, P. (2015). An analysis of the coherence of descriptors in topic modeling. Expert Systems with Applications, 42(13), 5645-5657. [https://doi.org/10.1016/j.eswa.2015.02.055]
- Swanson, D. L. (1993). Fragmentation, the field, and the future. Journal of Communication, 43(4), 163-72. [https://doi.org/10.1111/j.1460-2466.1993.tb01317.x]
- Wallace, F. M. (1992). Meta-Analysis: Qualitative Methods for Research Synthesis. Beverly Hills, CA: Sage Publication.
- Wang, C., Blei, D., & Heckerman, D. (2012). Continuous time dynamic topic models. arXiv preprint arXiv, 1206. 3298.