The Korean Society for Journalism & Communication (KSJCS)
[ Article ]
Korean Journal of Journalism & Communication Studies - Vol. 66, No. 6, pp.154-194
ISSN: 2586-7369 (Online)
Print publication date 31 Dec 2022
Received 14 Oct 2022 Revised 28 Nov 2022 Accepted 29 Nov 2022
DOI: https://doi.org/10.20879/kjjcs.2022.66.6.005

보수 언론과 진보 언론의 북한 전문가 활용 방식의 차이 탐색 : 인용문에 대한 KPF-BERT 기반 딥러닝 분석을 중심으로

이종혁**
**경희대학교 미디어학과 교수 jonghhhh@khu.ac.kr
Differences in the Use of North Korean Experts by Conservative and Progressive Media : Focusing on KPF-BERT-based Deep-Learning Analysis of Expert Quotes
Jong Hyuk Lee**
**Professor, Department of Media, Kyung Hee University jonghhhh@khu.ac.kr

초록

본 연구는 언론이 정치성향에 따라 북한 전문가 인용 보도에서 편향성을 나타내는 실태를 정파적 지표화(partisan indexing) 현상과 딥러닝 모형의 적용을 통해 살펴보았다. 언론의 지표화 가설(press indexing hypothesis)에 따르면, 언론은 공적 정보원의 영향을 받아 보도 범위를 설정한다. 반면, 보수와 진보 언론이 자신의 정치적 성향에 맞춰 정보원과 인용 내용을 선택적으로 활용하는 현상은 정파적 지표화라고 할 수 있다. 본 연구진은 북한 보도에서 이런 현상을 탐색하고자 북한 관련 메시지를 보수와 진보 성향으로 분류하는 딥러닝 모형을 KPF-BERT를 기반으로 개발했다. 이어서 모형을 활용해 빅카인즈에서 제공하는 북한 전문가 80인의 인용문 42,375건(2011년~2021년)에 대해 정치성향 지수를 측정했다. 분석 결과, 북한 전문가들은 보수 성향에서 진보 성향에 이르기까지 다양하게 분포했으며, 극단적 정치성향에서는 진보 전문가보다 보수 전문가가 많은 것으로 나타났다. 언론사 분포에서는 보수 언론사 3곳(조선일보, 중앙일보, 동아일보)이 분석 대상 52곳 가운데 보수 성향 순서로 2, 4, 5위를 기록했다. 한편, 진보 언론사 한겨레신문과 경향신문은 중도에 가까운 위치를 나타냈고, 내일신문만 뚜렷하게 진보 성향을 보였다. 핵심 분석 결과는 보수와 진보 언론이 자신의 성향과 유사한 전문가를 더 자주 인용하고, 동일 전문가에 대해 자신의 성향과 유사한 내용을 더 많이 선택해 보도했다는 점이다. 북한 보도에서 ‘정파적 지표화(partisan indexing)’ 현상이 유의미하게 검증된 것이다.

Abstract

This study examined whether conservative and progressive Korean media exhibits bias in the news coverage quoting North Korean experts. According to the press indexing hypothesis, the news media are influenced by public sources to set coverage limits. On the other hand, the partisan indexing phenomenon refers to the case in which conservative and progressive media selectively use sources of information and quotes according to their political orientation. To explore this phenomenon in the news coverage of North Korea, this study developed a deep-learning model that classifies news editorials about North Korea into conservative and progressive messages based on the KPF-BERT model. This model was constructed by learning news articles accumulated for 20 years by the Korea Press Foundation’s Big-Kinds archive system, and showed excellent performance in natural language processes compared to other Korean BERT models. The KPF-BERT-based deep-learning model developed by this study finally recorded an accuracy of 93.77%. Next, this model, measured the political orientation index for 42,375 quotes (from 2011 to 2021) of 80 North Korean experts provided by BIG-KINDS. As a result, North Korean experts were widely dispersed from conservative to progressive positions, and some conservative experts were found to be in more extreme positions than progressive ones. This implies that extreme conservative opinions are allowed in the Korean media, but extreme progressive opinions are hardly reflected. In terms of the media distribution, three conservative media (Chosun Ilbo, JoongAng Ilbo, and Dong-A Ilbo) ranked 2nd, 4th, and 5th in the order of conservative political orientation among the 52 media. On the other hand, two progressive media such as Hankyoreh and Kyunghyang Shinmun were placed at a near-central position, and only the Naeil Shinmun clearly showed progressive orientation. This implies that the intensity of political orientation should be considered beyond the distinction between conservative and progressive media in the media analysis. A key point of this analysis is that conservative and progressive media tend to selectively quote experts similar to their political orientation and selectively report content similar to their orientation in the same expert. The phenomenon of partisan indexing was significantly observed in the news on North Korea. It is worrying that the political bias in Korean media is reflected in experts’ quotes beyond the news staff's writings. Methodologically, the application of the KPF-BERT-based deep-learning model is a suitable method to analyze tons of news data accumulated every day. Hopefully, this method can be widely and actively used in future journalism research.

Keywords:

North Korean news, experts, partisan indexing, KPF-BERT, deep-learning

키워드:

북한 보도, 전문가 인용, 정파적 지표화, 딥러닝

Acknowledgments

This work was supported by Press Promotion Fund of the Korea Press Foundation in 2022. 이 연구는 2022년도 한국언론진흥재단 언론진흥기금의 지원으로 이루어진 것임.

References

  • Bang, E., & Kim, S. (2012). A study of SNS sources in Korean major newspapers. Journal of Cybercommunication Academic Society, 29(4), 145-189.
  • Bennett, W. L. (1990). Toward a theory of press-state relations in the United States. Journal of Communication, 40(2), 103-125. [https://doi.org/10.1111/j.1460-2466.1990.tb02265.x]
  • Choi, H. (2010). A study on the diversity of Korean newspapers: Analyzing the tendencies of covering three major issues. Korean Journal of Journalism & Communication Studies, 54(3), 314-348.
  • Choi, J. (2012). Political empowerment of media after democratization in Korea: Focusing on the analysis of the major newspapers' articles during the 13-17th presidential election campaigns. Doctoral dissertation at Hanyang University, Seoul, Korea.
  • Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805, .
  • Ha, S., & Lee, M. (2012). A news frame analysis by the South Korean press on the livelihoods of North Koreans. Korean Journal of Communication & Information, 58, 222-241.
  • Hall, S., Critcher, C., Jefferson, T., Clarke, J., & Roberts, B. (1978). Policing the crisis: Mugging, the state and law and order. London, UK: Macmillan. [https://doi.org/10.1007/978-1-349-15881-2]
  • Han, D., & Lim, J. (2001). A study on the use of news sources in the media and the struggle for hegemony: Focusing on the analysis of news sources in North Korean reports. Paper presented at Korean Society for Journalism & Communication Studies.
  • Kim, K. (2019). Kim Ki-Hyun's natural language processing and deep learning camp (PyTorch edition): From basic to advanced deep learning-based natural language processing. Seoul: Hanbitmedia.
  • Kim, K., & Noh, G. (2011). A comparative study of news reporting about North Korea on newspapers in South Korea. Korean Journal of Journalism & Communication Studies, 55(1), 362-498.
  • Kim, Y. (2007). Source competition and dependency on issue attributes: Issue competition between the government and the activists on the issue of screen quota. Korean Journal of Communication & Information, 39, 140-177.
  • Kiousis, S., Mitrook, M., Wu, X., & Seltzer, T. (2006). First-and second-level agenda-building and agenda-setting effects: Exploring the linkages among candidate news releases, media coverage, and public opinion during the 2002 Florida gubernatorial election. Journal of Public Relations Research, 18(3), 265-285. [https://doi.org/10.1207/s1532754xjprr1803_4]
  • Lee, J. (2003). A political economy study on North Korea-related news coverage: An editorial analysis of the North Korean nuclear issue (1993-2003) by Chosun-Ilbo and Hankyoreh. Paper presented at Korean Society for Journalism & Communication Studies.
  • Lee, K. (2021). Do it! Learning natural language processing with BERT and GPT: Core principles of transformers and how to use the huggingface package. Seoul: Easyspublishing.
  • Lee, R., Park, E., & Lee, J. (2020). Comparison of variant BERT models on Korean. Proceedings of Korean Institute of Commucations and Information Sciences, 901-902.
  • Lee, W., & On, B. (2021, June). Emotion word masking method for emotional classification of BERT model. Proceedings of Korean Institute of Information Technology, 413-416.
  • Lee, W., & Son, Y. (2011). The media’s agenda setting on the nuclear test of North Korea. Korean Journal of Communication & Information, 56, 175-193.
  • Özçift, A., Akarsu, K., Yumuk, F., & Söylemez, C. (2021). Advancing natural language processing (NLP) applications of morphologically rich languages with bidirectional encoder representations from transformers (BERT): An empirical case study for Turkish. Automatika, 62(2), 226-238. [https://doi.org/10.1080/00051144.2021.1922150]
  • Pappagari, R., Zelasko, P., Villalba, J., Carmiel, Y., & Dehak, N. (2019, December). Hierarchical transformers for long document classification. Proceedings of 2019 IEEE Automatic Speech Recognition and Understanding Workshop(ASRU), 838-844. [https://doi.org/10.1109/ASRU46091.2019.9003958]
  • Park, D (2014). Biases by bursts of quoting sources in Journalism. Communication Theories, 10(1), 295-324.
  • Seol, J., & Nam, G. (2007). A study on the relationship between television news and diplomacy : A content analysis of Six Party Talks news. Korean Journal of Broadcasting and Telecommunication Studies, 21(4), 69-100.
  • Shoemaker, P. J., & Reese, S. D. (1996). Mediating the message: Theories of influences on mass medai content. New York, NY: Longman.
  • Sim, J. (2021). A study on automatic classification of orofanity sentences of elementary school students using BERT. Journal of Creative Information Culture, 7(2), 91-98.
  • Song, Y. (2005). A study on the rhetorical devices to enhance the factuality in the news of the society pages in Korean national newspapers. Korean Journal of Journalism & Communication Studies, 49(3), 80-104.
  • Usuga-Cadavid, J. P., Lamouri, S., Grabot, B., & Fortin, A. (2022). Using deep learning to value free-form text data for predictive maintenance. International Journal of Production Research, 60(14), 4548-4575. [https://doi.org/10.1080/00207543.2021.1951868]
  • van Dijk, T. A. (1990). News as discourse. Hillsdale, NJ: Lawrence Erlbaum.
  • Yoo, W., & An, S. (2022). Introduction to natural language processing using deep learning. WikiDocs. Retrieved from https://wikidocs.net/109251, .
  • Yoon, Y. (1997). Changes in inter-korean relations and media: Comparing reporting times of North and South Korean newspapers. In Y. C. Yoon, Y. S. Kim, & Y. S. Choi (Eds.), International Communication and Korean Society (pp. 121-152). Seoul: Nanam.

Appendix

부록

  • 김경희·노기영 (2011). 한국 신문사의 이념과 북한 보도방식에 대한 연구. <한국언론학보>, 55권 1호, 362-498.
  • 김기현 (2019). <김기현의 자연어 처리 딥러닝 캠프(파이토치 편): 딥러닝 기반의 자연어 처리 기초부터 심화까지>. 서울: 한빛미디어
  • 김영욱 (2007). 소스 경쟁과 의제속성 의존: 스크린쿼터를 둘러싼 정부와 시민단체의 영향력 분석. <한국언론정보학보>, 39호, 140-177.
  • 박대민 (2014). 뉴스 정보원 인용에서의 폭발성과 언론의 편향성. <커뮤니케이션이론>, 10권 1호, 295-324.
  • 방은주·김성태 (2012). 국내 주요신문의 소셜미디어 정보원 뉴스보도 분석. <사이버커뮤니케이션학보>, 29권 4호, 145-189.
  • 설진아·남궁강 (2007). < 6 자 회담> 에 관한 텔레비전 외교 뉴스의 정보원 분석. <한국방송학보>, 21권 4호, 69-100.
  • 송용회 (2005). 한국종합 일간지 기사의 사실성 입증 기제에 관한 연구-조선일보와 한겨레신문 사회면을 중심으로. <한국언론학보>, 49권 3호, 80-104.
  • 심재권 (2021). BERT 를 활용한 초등학교 고학년의 욕설문장 자동 분류방안 연구. <창의정보문화연구>, 7권 2호, 91-98.
  • 유원준·안상준 (2022). 딥 러닝을 이용한 자연어 처리 입문. 위키독스. Retrieved from https://wikidocs.net/109251, .
  • 윤영철 (1997). 남북한 관계의 변화와 언론: 남북한 신문의 보도시각 비교를 중심으로. 윤영철·김영석·최양수 (편), <국제커뮤니케이션과 한국사회> (121-152쪽). 서울:나남.
  • 이기창 (2021). <Do it! BERT와 GPT로 배우는 자연어 처리: 트랜스포머 핵심 원리와 허깅페이스 패키지 활용법>. 서울: 이지스퍼블리싱.
  • 이로제·박은환·이재구 (2020). BERT 파생 모델의 한국어에 대한 성능 비교. <한국통신학회 학술대회논문집>, 901-902.
  • 이완수·손영준 (2011). 북한 핵실험 이슈에 대한 언론의 의제구성. <한국언론정보학보>, 56호, 175-193.
  • 이원민·온병원 (2021, 6월). BERT 모델의 감성 분류 정확도 향상을 위한 감성 단어 마스킹 방안. <2021 한국정보기술학회 하계 종합학술대회 논문집>, 413-416.
  • 이진로 (2003). <북한 관련 언론기사에 관한 정치경제학적 연구: 조선일보와 한겨레신문의 북한핵 문제(1993-2003) 사설 분석>. 2003년도 한국언론학회 봄철 정기 학술대회.
  • 최진호 (2012). <민주화 이후 언론의 정치 권력화와 변동 과정: 13~17대 대선 캠페인 기간의 주요 일간지 분석을 중심으로>. 한양대학교 박사학위 논문.
  • 최현주 (2010). 한국 신문 보도의 이념적 다양성에 대한 고찰: 6개 종합일간지의 3개 주요 이슈에 대한 보도 성향 분석을 중심으로. <한국언론학보>, 54권 3호, 314-348.
  • 하승희·이민규 (2012). 북한 주민 생활 실태에 관한 국내 신문 보도 프레임 연구: 조선일보, 동아일보, 한겨레, 경향신문을 중심으로. <한국언론정보학보>, 58호, 222-241.
  • 한동섭·임종수 (2001). <미디어의 뉴스원 활용과 헤게모니 투쟁에 대한 고찰: 북한 보도에서의 뉴스원 분석을 중심으로>. 2001 한국언론학회 가을철 정기학술대회 발표문.