The Korean Society for Journalism & Communication (KSJCS)
[ Article ]
Korean Journal of Journalism & Communication Studies - Vol. 67, No. 6, pp.189-222
ISSN: 2586-7369 (Online)
Print publication date 31 Dec 2023
Received 13 Aug 2023 Accepted 15 Nov 2023 Revised 16 Nov 2023
DOI: https://doi.org/10.20879/kjjcs.2023.67.6.006

편향의 위상학 : 1650만 건 기사의 뉴스 정보원 연결망 분석을 통해 파악한 인용 방식의 보편적 분포로서 두터운 꼬리 분포

박대민**
**선문대학교 미디어커뮤니케이션학부 조교수 dmpark@sunmoon.ac.kr
Topology of Media Bias : Fat-Tailed Distribution as Universal Distribution of Quotation by Analyzing News Source Networks with 16.5 Million Articles
Daemin Park**
**Assistant Professor, School of Media and Communication, Sunmoon University dmpark@sunmoon.ac.kr

초록

많은 정보원 편향 연구는 매체나 취재 범위, 주제, 시기 등을 막론하고 정부나 기업 등 공식 정보원에 대한 의존도가 높다고 지적한다. 편향을 개선하려는 많은 노력에도 불구하고 정보원 편향이 나타난다면, 이는 정보원 편향이 보편성을 가진 현상이기 때문일지도 모른다. 본 연구에서는 정보원 인용 패턴을 뉴스 정보원 연결망으로 구조화하고, 뉴스 정보원 연결망의 위상학적 특징을 파악함으로써 정보원 편향의 보편성을 밝히고자 하였다. 이를 위해 2000년부터 2020년까지, 19개 전국지와 경제지의 정치, 경제, 사회, 문화, 국제 등 5개 지면 기사 16,538,668건을 빅카인즈에서 수집하여 연도별, 지면별, 매체별로 1,700개 데이터세트의 연결정도 지수를 구해 비교했다.

분석 결과 연도나 매체 및 지면을 막론하고 연결정도 중앙성 값이 커질수록 연결정도 지수 값은 1.2에 수렴하는 것을 확인할 수 있었다. 이는 뉴스 정보원 연결망이 충분히 성장한 경우, 뉴스 정보원 연결망이 시기와 매체, 주제를 막론하고 보편적으로 두터운 꼬리 분포를 갖는다는 것을 의미한다. 즉 극소수의 정보원이 매우 중요하게 인용되는 한편, 중요도가 매우 낮은 정보원이 다수를 차지한다. 이는 방법론적, 이론적, 실천적으로 다음과 같은 점을 시사한다.

첫째, 방법론적으로 뉴스 정보원 연결망을 비롯한 뉴스 빅데이터 분석을 타당하게 수행하려면, 정보원 인용을 뉴스 정보원 연결망으로 나타냈을 때 그 분포가 두터운 꼬리 분포를 갖는지 확인할 필요가 있다. 뉴스 정보원 연결망이 두터운 꼬리 분포라는 것은 최소한 상위권 정보원의 순위는 결측이나 오측에 크게 영향을 받지 않을 정도로 강건함을 의미한다. 정보원의 순위를 신뢰할 수 있으려면, 정보원이 여러 기사에서 다양하게 공동 인용되면서 중심 정보원과 거대 구성집단이 출현할 수 있을 정도가 되어야 한다. 수집된 뉴스 빅데이터가 중요한 정보원은 대부분 포함돼 있을 정도로 충분히 성장한 데이터여야 한다.

둘째, 상위권 정보원을 중심으로 하는 뉴스 빅데이터 분석은 매체 간 비교 연구보다는 언론계 수준의 분석에 적합하다. 매체 간 비교 연구에는 두터운 꼬리에 해당하는 정보원에 대한 분석이 요청된다. 문제는 두터운 꼬리 부분에는 동 순위에 수많은 정보원이 있다는 점이다. 이러한 정보원에 대한 분석은 결국 특정 정보원 개인 또는 집단에 주목하여 해당 정보원의 인용문을 읽어보고 검토하는 질적 연구를 통해서만 가능하다.

셋째, 뉴스 정보원 연결망이 두터운 꼬리 분포로 수렴하는 현상은 정보원의 편향이 사회물리학적으로 보편적인 현상임을 의미한다. 즉 정보원의 편향은 인용을 통해 사실성을 확보하는 객관주의 저널리즘 관행 아래 마감 시간이 존재하는 한 불가피하다. 그러나 두터운 꼬리 분포는 중심에 해당하는 공식 정보원 외에 두터운 꼬리에 해당하는 정보원을 적극 발굴함으로써 정보원 편향의 폐해를 줄일 수 있음을 시사한다.

Abstract

Many studies on media bias point to a heavy reliance on official sources, such as governments and corporations, regardless of the media outlets, coverage, topics, or periods. If source bias persists despite numerous efforts to mitigate it, it may be due to its universal nature.

In this study, we shed light on the universality of source bias by structuring source citation patterns into news source networks and identifying topological features of news source networks.

We collected 16,538,668 articles from 19 national newspapers and economic journals in five categories (political, economic, social, cultural, and international) from 2000 to 2020, using BigKinds, the news big data system of Korea Press Foundation. We compared these articles by obtaining the degree exponents from 1,700 datasets, categorized by year, category, and media outlet.

Our findings showed that the degree exponents converged to 1.2. This implies that when the news source network is sufficiently mature, it exhibits a universal fat-tailed distribution across period, media, and topic, meaning that a small number of sources are cited as highly significant, while many sources are cited as relatively unimportant.

This has several methodological, theoretical, and practical implications. First, methodologically, to validly analyze news big data, including news source networks, it is necessary to ensure that the distribution of source citations, when the pattern is represented as news source networks, has a fat-tailed distribution. A fat-tailed distribution means that at least the rankings of the top sources are robust enough that they are not significantly affected by missing or incorrect information. To be reliable, a source's ranking should be such that it is widely co-cited in multiple articles, allowing for the emergence of one centralized hub source and one large main cluster. The collected news big data should be large enough to include most of the important sources.

Second, news big data analysis centered on top sources is better suited for media system-level analysis than cross-media comparative research. Cross-media comparisons require analyzing the content of each source in the fat tail. The problem is that there are a lot of sources in the fat tail. Analyzing these sources is ultimately only possible through qualitative research that focuses on specific individuals or groups of sources, reading and reviewing their quotes.

Third, the convergence of news source networks to a fat-tailed distribution suggests that source bias is a socio-physically universal phenomenon: it is inevitable as long as deadlines exist under objectivist journalistic practices that rely on citations to establish factuality. However, the fat-tailed distribution suggests that the harm of source bias can be reduced by actively seeking out sources in the fat tail in addition to official sources in the center.

Keywords:

Source Bias, News Source Network, Fat-tailed Distribution, Scale Free Network, Degree Exponent

키워드:

정보원 편향, 뉴스 정보원 연결망, 두터운 꼬리 분포, 척도 없는 연결망, 연결정도 지수

Acknowledgments

This work was supported by the Ministry of Education of the Republic of Korea and the National Research Foundation of Korea(이 논문은 2021년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임): NRF-2021S1A5A806921311

References

  • Atwater, T., & Green, N. F. (1988). News sources in network coverage of international terrorism. Journalism Quarterly, 65(4), 967-971. [https://doi.org/10.1177/107769908806500420]
  • Barabási, A. L. (2005). The origin of bursts and heavy tails in human dynamics. Nature, 435(7039), 207-211. [https://doi.org/10.1038/nature03459]
  • Barabási, A. L. (2010). Bursts: the hidden patterns behind everything we do, from your e-mail to bloody crusades. Penguin.
  • Barabási, A. L., & Albert, R. (1999). Emergence of scaling in random networks. Science, 286(5439), 509-512. [https://doi.org/10.1126/science.286.5439.509]
  • Barabási, A. L., Goh, K. I., & Vzquez, A. (2005). Reply to comment on "the origin of bursts and heavy tails in human dynamics". arXiv: physics/0511186, .
  • Bennett, W. L. (1990). Toward a theory of press-state relations in the United States. Journal of Communication, 40(2), 103-125. [https://doi.org/10.1111/j.1460-2466.1990.tb02265.x]
  • Berkowitz, D., & Beach, D. (1993). News sources and news context: The effect of routine news, conflict, and proximity. Journalism Quarterly, 70, 4-12. [https://doi.org/10.1177/107769909307000102]
  • Bernhardt, D., Krasa, S., & Polborn, M. (2008). Political polarization and the electoral effects of media bias. Journal of Public Economics, 92(5-6), 1092-1104. [https://doi.org/10.1016/j.jpubeco.2008.01.006]
  • Broido, A. D., & Clauset, A. (2019). Scale-free networks are rare. Nature Communications, 10(1), 1017. [https://doi.org/10.1038/s41467-019-08746-5]
  • Brown, J. D., Bybee, C. R., Weardem, S. T., & Straughan, D. M. (1987). Invisible power: Newspaper news sources and the limits of diversity. Journalism Quarterly, 64(1), 45-54. [https://doi.org/10.1177/107769908706400106]
  • Callon, M., Courtial, J. P., Turner, W. A., & Bauin, S. (1983). From translations to problematic networks: An introduction to co-word analysis. Social Science Information, 22(2), 191-235. [https://doi.org/10.1177/053901883022002003]
  • Candia, J., Gonzlez, M. C., Wang, P., Schoenharl, T., Madey, G., & Barabási, A. L. (2008). Uncovering individual and collective human dynamics from mobile phone records. Journal of Physics A: Mathematical and Theoretical, 41(22), 224015. [https://doi.org/10.1088/1751-8113/41/22/224015]
  • Chang, H. (2001). Analysis of the sources and paths of Korean newspapers. Proceedings of the Korean Journalism Association Conference. 179-193.
    장호순 (2001). <한국 신문의 취재원과 취재경로 분석>. 한국언론학회 학술대회 발표논문집. 179-193.
  • Chang, K. (1999). Auto trade policy and the press: Auto elite as a source of the media agenda. Journalism and Mass Communication Quarterly, 76, 312-324. [https://doi.org/10.1177/107769909907600209]
  • Cohen, R., & Havlin, S. (2003). Scale-free networks are ultrasmall. Physical Review Letters, 90(5), 058701. [https://doi.org/10.1103/PhysRevLett.90.058701]
  • Culbertson, H. M. (1980). Veiled attribution: An element of style? Journalism Quarterly, 55(3), 456-465. [https://doi.org/10.1177/107769907805500305]
  • Dezsö, Z., Almaas, E., Lukács, A., Rácz, B., Szakadát, I., & Barabási, A. L. (2006). Dynamics of information access on the web. Physical Review E, 73(6), 066132. [https://doi.org/10.1103/PhysRevE.73.066132]
  • Eckmann, J. P., Moses, E., & Sergi, D. (2004). Entropy of dialogues creates coherent structures in e-mail traffic. Proceedings of the National Academy of Sciences of the United States of America, 101(40), 14333-14337. [https://doi.org/10.1073/pnas.0405728101]
  • Entman, R. M. (2003). Cascading activation: Contesting the White House's frame after 9/11. Political Communication, 20(4), 415-432. [https://doi.org/10.1080/10584600390244176]
  • Gans, H. (1979). Deciding what’s news. Austin: University of Texas Press.
  • Gilens, M., & Hertzman, C. (2000). Corporate ownership and news bias: Newspaper coverage of the 1996 Telecommunications Act. Journal of Politics, 62(2), 369-386. [https://doi.org/10.1111/0022-3816.00017]
  • Hamborg, F., Donnay, K., & Gipp, B. (2019). Automated identification of media bias in news articles: An interdisciplinary literature review. International Journal on Digital Libraries, 20(4), 391-415. [https://doi.org/10.1007/s00799-018-0261-y]
  • Han, D., & Lim, J. (2001). An examination of media's utilization of news sources and hegemonic struggle. Proceedings of the Fall Conference of the Korean Journalism Association, 27-56.
    한동섭·임종수 (2001). 미디어의 뉴스원 활용과 헤게모니 투쟁에 대한 고찰. <한국언론학회 가을철 정기학술대회 발표논문집>, 27-56. 서울: 서강대학교.
  • Harp, D., Loke, J., & Bachmann, I. (2010). Voices of dissent in the Iraq war: Moving from deviance to legitimacy?. Journalism & Mass Communication Quarterly, 87(3-4), 467-483. [https://doi.org/10.1177/107769901008700302]
  • Holme, P. (2019). Rare and everywhere: Perspectives on scale-free networks. Nature Communications, 10(1), 1016. [https://doi.org/10.1038/s41467-019-09038-8]
  • Kang, B. N. (2010). Complex network science. Seoul: Jipmundang.
    강병남 (2010). <복잡계 네트워크 과학>. 서울: 집문당.
  • Katsura, S., & Takizawa, M. (1974). Bethe lattice and the Bethe approximation. Progress of Theoretical Physics, 51(1), 82-98. [https://doi.org/10.1143/PTP.51.82]
  • Kim, K., & Noh, G. (2011). A comparative study of news reporting about North Korea on newspapers in South Korea. Korean Journal of Journalism & Communication Studies, 55(1), 361-387.
    김경희·노기영 (2011). 한국 신문사의 이념과 북한 보도방식에 대한 연구. <한국언론학보>, 55권 1호, 361-387.
  • Lee, J. (2022). Differences in the use of North Korean experts by conservative and progressive media : Focusing on KPF-BERT-based deep-learning analysis of expert quotes. Korean Journal of Journalism & Communication Studies, 66(6), 154-194.
    이종혁 (2022). 보수 언론과 진보 언론의 북한 전문가 활용 방식의 차이 탐색: 인용문에 대한 KPF-BERT 기반 딥러닝 분석을 중심으로. <한국언론학보>, 66권 6호, 154-194. [ https://doi.org/10.20879/kjjcs.2022.66.6.005 ]
  • Lippmann, W. (1922). Public opinion. NY: Macmillan.
  • Malmgren, R. D., Stouffer, D. B., Motter, A. E., & Amaral, L. A. (2008). A Poissonian explanation for heavy tails in e-mail communication. Proceedings of the National Academy of Sciences, 105(47), 18153-18158. [https://doi.org/10.1073/pnas.0800332105]
  • Moody, J. (2004). The structure of a social science collaboration network: Disciplinary cohesion from 1963 to 1999. American Sociological Review, 69, 213-238. [https://doi.org/10.1177/000312240406900204]
  • Nam, J. (2008). The cultural particularity of objectivism in Korea : The structural feature of routine reporting activities of police reporters. Journal of Communication Science, 8(3), 233-270.
    남재일 (2008). 한국 객관주의 관행의 문화적 특수성 : 경찰기자 취재관행의 구조적 성격. <언론과학연구>, 8권 3호, 233-270.
  • Newman, M. E. (2001). The structure of scientific collaboration networks. Proceedings of the National Academy of Sciences, 98(2), 404-409. [https://doi.org/10.1073/pnas.98.2.404]
  • Park, D. (2013). News source network analysis as big data analytics of news articles. Korean Journal of Journalism & Communication Studies, 57(6), 234-262.
    박대민 (2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스 정보원 연결망 분석. <한국언론학보>, 57권 6호, 234-262.
  • Park, D. (2014). Biases by bursts of quoting sources in journalism. Communication Theories, 10(1), 295-324.
    박대민 (2014). 뉴스 정보원 인용에서의 폭발성과 언론의 편향성. <커뮤니케이션 이론>, 10권 1호, 295-324.
  • Park, D. (2015). A study of double validity claims in quotations: News source network analysis of news on the Four Major Rivers Project in the Dong-A Ilbo and the Hankyoreh. Korean Journal of Journalism & Communication Studies, 59(5), 121-151.
    박대민 (2015). 사실기사의 직접인용에 대한 이중의 타당성 문제의 검토. <한국언론학보>, 59권 5호, 121-151.
  • Park, D. (2016). Automated time series content analysis with news big data analytics: Analyzing sources and quotes in one million news articles for 26 years. Korean Journal of Journalism & Communication Studies, 60(5), 353-407.
    박대민 (2016). 장기 시계열 내용 분석을 위한 뉴스 빅데이터 분석의 활용 가능성: 100만 건 기사의 정보원과 주제로 본 신문 26년. <한국언론학보>, 60권 5호, 353-407. [ https://doi.org/10.20879/kjjcs.2016.60.5.013 ]
  • Park, D., Cho, Y., & Hong, J. (2001). A qualitative study of news source-reporter relations - On the problems of beat repeorting system. Korean Journal of Journalism & Communication Studies, 45(special issue), 367-396.
    박동숙·조연하·홍주현 (2001). 공적 업무 수행을 위한 사적 친분 고리: 출입처에서의 정보원과 기자의 상호작용에 대한 질적 탐구. <한국언론학보>, 45권 특별호, 367-397.
  • Park, D., Kim, G., & On, B. (2016). Understanding the network fundamentals of the news sources associated with a specific topic. Information Sciences, 327, 32-52. [https://doi.org/10.1016/j.ins.2016.08.015]
  • Park, D., Lee, H., & Jeong, S. (2022). Production and correction of misinformation about fine dust in the Korean news media: A big data analysis of news from 2009 to 2019. American Behavioral Scientist. [https://doi.org/10.1177/00027642221118287]
  • Park, J. (2020). A comparative study on the ’Corona19’ news frame based on ideological orientation of media. Korean Journal of Journalism & Communication Studies, 64(4), 40-85.
    박주현 (2020). 언론의 이념성향에 따른 ‘코로나19’ 보도 프레임 비교 연구. <한국언론학보>, 64권 4호, 40-85. [ https://doi.org/10.20879/kjjcs.2020.64.4.002 ]
  • Reviglio, U. (2019). Serendipity as an emerging design principle of the infosphere: Challenges and opportunities. Ethics and Information Technology, 21(2), 151-166. [https://doi.org/10.1007/s10676-018-9496-y]
  • Schudson, M. (1978). Discovering the news: A social history of American newspapers. NY: Basic Books.
  • Shin, B. (2015). A practical introduction to computer networking and cybersecurity. Montezuma Publishing.
  • Shoemaker, P. J., & Reese, S. D. (1996). Mediating the message: Theories of influences on massmedia content.. NY: Longman.
  • Sigal, L. V. (1973). Reporters and officials: The organization and politics of newsmaking. Lexington, MA: DC Heath.
  • Small, H. (1973). Co‐citation in the scientific literature: A new measure of the relationship between two documents. Journal of the American Society for information Science, 24(4), 265-269. [https://doi.org/10.1002/asi.4630240406]
  • Song, H., Eberl, J. M., & Eisele, O. (2020). Less fragmented than we thought? Toward clarification of a subdisciplinary linkage in communication science, 2010-2019. Journal of Communication, 70(3), 310-334. [https://doi.org/10.1093/joc/jqaa009]
  • Stouffer, D. B., Malmgren, R. D., & Amaral, L. A. (2005). Comment on Barabási. Nature, 435, 207.
  • Swain, B. M., & Robertson, M. J. (1995). The Washington Post and the Woodward problem. Newspaper Research Journal, 16(1), 2-21. [https://doi.org/10.1177/073953299501600102]
  • Tsfati, Y., & Cohen, J. (2005). The influence of presumed media influence on democratic legitimacy: The case of Gaza settlers. Communication Research, 32(6), 794-821. [https://doi.org/10.1177/0093650205281057]
  • Tuchman, G. (1972). Objectivity as strategic ritual: An examination of newsmen's notions of objectivity. American Journal of Sociology, 77(4), 660-679. [https://doi.org/10.1086/225193]
  • van Dijk, T. A. (1988). News as discourse. NJ: Lawrence Erlbaum.
  • Vázquez, A., Oliveira, J. G., Dezsö, Z., Goh, K. I., Kondor, I., & Barabási, A. L. (2006). Modeling bursts and heavy tails in human dynamics. Physical Review E, 73(3), 036127. [https://doi.org/10.1103/PhysRevE.73.036127]
  • Wilson, R. J. (1979). Introduction to graph theory. Pearson Education India.
  • Williams, A. (1975). Unbiased study of television news bias. Journal of Communication, 25(4), 190-199. [https://doi.org/10.1111/j.1460-2466.1975.tb00656.x]
  • Yoo, J., & Lee, M. (1994). Government and the press. Seoul: Nanam.
    유재천·이민웅 (1994). <정부와 언론>. 서울: 나남.