Ⅰ. 서 론
세계보건기구(WHO)에 따르면 20년간 암 진단받은 전체 인구수는 1,000만 명(2000년)에서 1,930만 명(2020년)으로 약 두 배 증가한 것으로 나타났다. WHO는 전 세계적으로 5명 중 1명이 암에 걸릴 것으로 보고 있으며 향후 몇 년 동안 증가할 것으로 예측된다[1,2]. 국내 암 등록 통계 보고에 따 르면 암 발생자(2018년)는 243,837명으로 전년(2017년 암 발생자 수: 235,547명) 대비 3.5% 증가했다. 또한 연령표준 화 발생률은 290.1명으로 전년 대비 3.2명(1.1%)으로 늘었 다[3]. 보건산업진흥원의 글로벌 의료서비스 리포트에 따르 면 2019년 한국의 의료기관을 방문한 외국인 환자 중 암 환 자는 11,226명으로 2018년에 대비하여 45% 증가하였다[4].
암 치료 3대 요법에는 수술, 항암치료, 방사선치료가 있 다. 이중 방사선치료는 수술과 항암치료에 비해 암 치료 비중 이 크지 않았다. 그러나 최근에는 기술 발전과 더불어 방사선 치료 사용이 늘어나고 있으며 암 치료의 비중이 증가하고 있다. 한국산업기술평가관리원(Korea Evaluation Institute of Industrial Technology, KEIT)에서 2017년에 발표한 <방사선 치료기기 기술 동향 및 산업 현황>에 따르면 방사 선치료를 받은 환자 비율은 미국의 경우 암 환자의 약 50% 고, 국내에서는 연평균 6.2%씩 증가하고 있다[5].
국내에 방문한 외국인 암 환자의 주요 관심은 방사선치료 가 가능한 국내 의료기관, 방사선치료 비용, 치료 기술 등이 있다. 보편적인 정보 습득 방법은 의료기관에서 제공하는 영문 웹 페이지(web-page)가 있다. 영문으로 구성된 텍스 트는 다양한 국가의 언어의 가교역할로써 지리학적 장벽 없 이 필요한 정보를 얻을 수 있는 장점이 있다[6]. 대부분 외 국인 암 환자는 국내에서 시행되는 방사선치료 기술에 대해 잘 모르기 때문에 의료기관에서 특별히 제공되는 해당 자국 어로 된 소책자(pamphlet), 책자(book)와 유선을 통해 개 별적으로 문의하거나 공식적으로 온라인(인터넷)에서 제공 되는 영문 웹 페이지에 의존할 수밖에 없다.
Schwartz 등[7]은 미국 환자의 최소 4분의 3은 중요한 건강정보를 인터넷에서 찾는다고 언급했다. Couper 등[8] 은 환자의 의사결정이 상당히 중요한 경우 더 많은 정보를 인터넷을 통해 찾으며, 암 환자들은 인터넷에서 찾은 정보 가 치료를 위한 의사결정에 영향을 미친다는 사실을 말했 다. 인터넷에서 제공되는 의료 정보는 접근이 쉽고 비용이 들지 않으며 환자 스스로 의사결정을 할 수 있도록 도움을 준다. 반면에 읽기 어려운 정보 즉, 가독성(readability)이 낮은 텍스트는 의료 정보를 대하는 환자의 이해도를 떨어뜨 리고, 정보 전달 효과에 도움을 주지 못한다[9].
외국인 암 환자는 우선으로 의료서비스를 받고 자 하는 관련 의료기관의 기본정보(교통, 위치, 서비스 등)와 방사선 종양학과 또는 암 센터 자국어 웹 페이지 또는 영문 웹 페이 지를 통해 치료 기술 정보를 확인한다. 그러나 방사선치료 에 관한 정보는 전문가가 아니면 쉽게 내용을 이해하기 힘 들다. 또한 영어권이 아닌 외국인은 영어 텍스트로 구성된 정보는 더 어려움을 갖는다. 환자는 원활한 치료를 위해 정 확한 정보를 인지하고 이해할 필요가 있다. 즉 외국인 암 환 자를 위한 영문 웹 페이지는 환자가 쉽게 읽고 이해하기 편 하도록 제공하는 것이 중요하다[10].
가독성과 적합성(suitability)은 문자로 된 자료의 적절성 을 평가하기 위해 고안된 문해력(literacy) 도구다. 가독성 은 단어와 문장의 길이를 통해 분석되는 읽기의 어려움 나 타내는 정도이고, 적합성은 자료를 이해하고 수용할 수 있 는 정도를 말한다[11]. 의료서비스의 질 개선과 고객만족도 를 위해 가독성과 관련하여 많은 의료기관에서 관심이 있다 [12]. 본 연구는 한국(KOR)의 의료기관에서 외국인 암 환자 에게 제공하는 방사선치료 정보(영문 텍스트)의 가독성의 수준을 평가하고 자 미국(USA)과 비교 분석하였다.
Ⅱ. 대상 및 방법
1. 연구 대상
연구 대상 기관은 뉴스위크(Newsweek) 선정 <The world’s best hospitals 2021> 중 한국과 미국에서 각각 1위에서 10 위까지 선정된 의료기관 총 20개를 대상으로 하였으며[13], 영문 텍스트는 의료기관에서 제공하는 인터넷 영문 웹 페이 지에서 수집하였다. 분석 자료는 각 기관에서 제공하는 텍 스트 기반의 인터넷 웹 페이지로 방사선종양학과 기본정보 와 치료 과정, 방법, 기술을 포함한 치료 기술이 포함된 소 개(introduction or overview) 영문 텍스트다. 의사와 직원 등의 프로필, 그림 설명, 개인정보보호 설명과 홈페이지 저 작권 등은 정확한 텍스트 분석을 위하여 제외하였다.
2. 연구 도구 및 방법
본 연구는 가독성을 정량적으로 분석하기 위하여 미국 멤 피스 대학교(University of Memphis)에서 개발한 웹 기반 텍스트 분석 프로그램인 Coh-Metrix(ver 3.0)를 사용했다 [14]. Coh-Metrix는 어휘의 다양성, 통사(syntax) 구조의 복잡성과 같은 표층(surface) 수준의 측정치는 텍스트 및 담 화(discourse)의 응집성(cohesion)과 같은 심층(deep) 수준 이 측정치까지 자동 전산화 방식으로 분석하여 제공한다[15].
본 연구는 어휘적 항목(Paragraph count, DESWC; Sentence length, DESSL; Type-token ratio [content word lemmas], LDTTRc; Type-token ratio [all words], LDTTRa; CELEX word frequency [content word], WRDFRQc; CELEX word frequency [all word], WRDFRQa), 통사적 항목 (Words before main verb, SYNLE; Number of modifiers per noun phrase, SYNNP), 응집성 항목 (Noun overlap, CRFNO1; Argument overlap, CRFAO1; Steam overlap, CRFSO1; LSA overlap [adjacent sentences], LASASS1), 가독성 항목 (Flesch Reading Ease, RDFRE; Flesch-Kincaid grade level, RDFKGL)으로 총 네 가지 항 목, 총 열네 가지 지표로 구분하여 분석하였다(Table 1).
1) 어휘적 항목(Lexical aspect)
어휘적 항목은 총 세 가지 범주(기초 산출치, 어휘 다양 성, 단어 빈도수)로 구성되었다. 기초 산출치는 단어 수 (Paragraph count, DESWC)와 문장 길이(Sentence length, DESSL)로 구성되었다. 어휘 다양성은 내용어의 타입-토큰 비율(Type-token ratio [content word lemmas], LDTTRc) 과 모든 단어의 타입-토큰 비율(Type-token ratio [all words], LDTTRa)로 구성되었다. 여기서 타입-토큰 비율 수치가 1이 나온다면 중복되는 단어가 없이 각기 다른 다양 한 어휘가 등장함을 뜻한다. 반면에 수치가 낮으면 단어의 중복 정도는 높아지고 어휘의 관점에서 상대적으로 낮은 난 이도를 나타내게 된다[16]. 단어 빈도수는 내용어의 CELEX 빈도 평균(CELEX word frequency [content word], WRDFRQc)와 모든 단어의 CELEX빈도 평균(CELEX word frequency [all word], WRDFRQa)로 구성되었다. 여기서 CELEX는 네덜란드 어휘정보센터(Dutch Centre for Lexical Information에서 만든 어휘 데이터베이스)에 의해 산출된 기준을 말한다. CELEX 단어 빈도는 0에서 6까지 범위고, 수치가 0에 가까울수록 회귀하고 정교한 단어를 뜻하며, 수 치 6에 가까울수록 일반적인 단어를 의미한다[17].
2) 통사적 항목 (Syntactic aspect)
통사적 항목은 본동사 앞 단어 평균 개수(Words before main verb, SYNLE)와 명사구 밀도 점수(Number of modifiers per noun parse, SYNNP) 지표가 포함된 통사 적 복잡성으로 구성되었다. SYNLE는 명사구 내의 수식어 수를 명사구 전체 수로 나누는 수식을 통해 수치화한 것이 고, SYNNP는 본동사 앞에 있는 단어의 수를 말한다. 여기 서 SYNLE와 SYNNP지표 수치가 높을수록 각각 문장이 모 호하고, 밀도가 높아 문장의 난이도가 높아짐을 의미한다.
3) 응집성 항목 (Cohesion aspect)
응집성 항목은 참조적 응집성(referential cohesion)과 의미적 응집성(semantic cohesion) 범주로 구성되었다. 참조적 응집성은 인접한 문장 사이의 명사 중복 문장 평균 수(Noun overlap, CRFNO1), 인접한 문장 사이의 논항 (argument, 서술어가 요구하는 필수적인 성분) 중복 문장 평균 수(Argument overlap, CRFAO1), 인접한 문장 사이 의 어간 중복 문장 평균 수(Steam overlap, CRFSO1)로 구 성되었다. 여기서 참조적 응집성 측정치는 높을수록 텍스트 에 대한 이해도는 증가함으로써 텍스트의 난이도는 낮아짐 을 의미한다[16]. 의미적 응집성은 인접 문장 사이의 응집성 (LSA overlap [adjacent sentences], LSASS1) 지표가 사 용되었다. 여기서 의미적 응집성 측정치는 0에 가까울수록 데이터 사이의 응집성이 낮으며, 반대로 측정치가 1에 가까 울수록 데이터 사이의 응집성이 높다는 걸 의미한다[16].
4) 가독성 항목 (Readability aspect)
문장의 난도 수준인 가독성은 단어와 문장 길이에 의해 난이도를 계산하는 FRE 공식을 이용하여 제공되는 FRE 지 표(Flesh Reading Ease, RDFRE)와 텍스트의 읽기 난이도 를 미국 학교의 학년 등급으로 나타내는 FKGL 지표 (Flesch-Kincaid grade level, RDFKGL)로 구성되었다. FRE 측정치는 0에서 100사이의 숫자(점수)로 나타내며 측 정값이 클수록 가독성이 높다는 의미다. 난이도 범위는 측 정값이 0-30점에서는 College graduate, 30-50점에서는 College grade, 50-60점에서는 High school grade, 60-70 점에서는 8th and 9th grade, 70-80점에서는 7th grade, 80-90점에서는 6th grade, 90-100점에서는 5th grade을 의미한다. FKGL 측정치는 미국교육의 등급 기준에서 0부 터(kindergarten) 12등급(high school)까지 범위로써 그 이상은 대학(college) 수준을 뜻하며 값이 클수록 독자가 가 독성이 낮다는 걸 의미한다[16].
3. 분석
영문 텍스트 정보는 Coh-Metrix web-site에서 제공하는 Coh-Metrix Web Tool (version: Coh-Metrix 3.0)을 이용 하여 분석하였다[17]. 통계분석은 총 열네 가지 지표에 대해 한국과 미국의 차이를 비교하기 위해 정규성 분포를 포함한 독립 표본 t 검증(independent sample t-test)을 하였으며, 인접한 문항 사이 응집성 지표(CRFA01, LSASS1)는 피어슨 상관관계(Pearson’s correlation)를 수행하였다. 통계 프로 그램은 SPSS 26.0으로 통계적 유의 수준은 5%였다.
Ⅲ. 결 과
1. 어휘적 항목
1) 단어 수(DESWC)
단어 수(DESWC)는 한국에서 평균 239.4±125.4(최솟값 =103; 최댓값=541)고, 미국에서 505.8±249.4(최솟값=159; 최댓값=1009)였다. 한국이 미국에 비해 47.3% 수준으로 유 의하게 적었다(p=0.007, p<.01[Table 2]).
2) 문장 길이(DESSL)
문장 길이(DESSL)는 한국에서 평균 23.0±5.7(최솟값 =15.833; 최댓값=29.571)고, 미국에서 17.0±3.5(최솟값 =12.349; 최댓값=21.64)였다. 한국이 미국에 비해 135% 문 장을 길게 사용하였다(p=0.001, p<.05[Table 2]).
3) 어휘 다양성(LDTTRc, LDTTRa)
문장 내에서 내용어에 대한 어휘 다양성(LDTTRc)은 한 국과 미국에서 평균 0.7±0.1(한국[최솟값=0.559; 최댓값 =0.932]; 미국[최솟값=0.596; 최댓값=0.81])로 동일했다. 모든 단어에 대한 어휘 다양성(LDTTRa)은 한국에서 평균 0.6±0.1(최솟값=0.424; 최댓값=0.761)과 미국에서 0.5±0.1 (최솟값=0.4; 최댓값=0.675)이었다. 두 집단의 평균은 LDTTRc (p=0.341, p>.05)과 LDTTRa (p=0.055, p>.05) 지표에서 모두 유의한 차이가 없었다(Table 2).
4) 단어 빈도수(WRDFRQc, WRDERQa)
문장 내에서 내용어에 대한 CELEX 단어 빈도수(WRDFRQc) 는 한국에서 평균 1.8±0.8(최솟값=1.771; 최댓값=1.971) 과 미국에서 1.9±0.1(최솟값=1.751; 최댓값=1.988)이었 다. 모든 단어에 대한 CELEX 단어 빈도수(WRDFRQa)는 한국과 미국에서 평균 2.7±0.1(한국[최솟값=2.52; 최댓값 =2.956]; 미국[최솟값=2.437; 최댓값=2.816])로 동일했다. 두 집단의 평균은 WRDFRQc (p=0.315, p>.05)과 WRDERQa (p=0.775, p>.05) 지표에서 모두 유의한 차이가 없었다 (Table 2).
2. 통사적 항목
1) 명사구 밀도 점수(SYNNP)
명사구 밀도 점수(SYNNP)는 한국에서 평균 5.0±1.6(최 솟값=3.474; 최댓값=8.75)이고, 미국에서 4.0±1.6(최솟값 =2.073; 최댓값=7.364)이었다. 두 집단의 평균은 유의한 차이가 없었다(p=0.178, p>.05[Table 3]).
2) 본동사 앞 단어 평균 개수(SYNLE)와 명사구 밀도 점수(SYNNP)
본동사 앞 단어 평균 개수(SYNLE)는 한국에서 평균 5.0±1.6(최솟값=3.474; 최댓값=8.75)과 미국에서 4.0±1.6 (최솟값=2.465; 최댓값=7.364)이었다. 두 집단은 유의한 평균 차이가 없었다(p=0.178, p>.05[Table 3]). 명사구 밀 도 점수(SYNNP)는 한국에서 1.2±0.1(최솟값=0.923; 최댓값 =1.433)과, 미국에서 1.3±0.3(최솟값=0.8; 최댓값=1.627) 이었다. 두 집단의 유의한 평균 차이는 없었다(p=0.356, p>.05[Table 3]).
3. 응집성 항목
1) 응집성 지표(CRFNO1, CRFAO1, CRFSO1, LSASS1)
참조적 응집성 범주의 각 지표인 CRFNO1은 한국에서 평균 0.6±0.2(최솟값=0.154; 최댓값=1)고, 미국에서 0.5±0.2 (최솟값=0.172; 최댓값=0.719)였다. CRFAO1은 한국에서 평 균 0.7±0.2(최솟값=0.308; 최댓값=1)고, 미국에서 0.6±0.1 (최솟값=0.414; 최댓값=0.781)이었다. CRFSO1은 한국에 서 평균 0.8±0.2(최솟값=0.455; 최댓값=1)고, 미국에서 0.6±0.2(최솟값=0.172; 최댓값=0.875)였다. 참조적 응집 성에 대해 두 집단의 평균은 CRFNO1 (p=0.088, p>.05), CRFAO1 (p=0.08, p>.05), CRFSO1 (p=0.053, p>.05) 지 표에서 모두 유의한 차이가 없었다(Table 4).
의미적 응집성 범주인 LSASS1 지표는 한국에서 평균 0.4±0.1(최솟값=0.205; 최댓값=0.66)이고, 미국에서 0.3±0.0 (최솟값=0.186; 최댓값=0.353)이었다. 의미적 응집성에 대 해 두 집단의 평균은 유의한 차이가 없었다(p=0.058, p>.05[Table 4]).
2) 인접한 문항 사이 응집성 지표(CRFAO1, LSASS1)의 상관관계
인접 문항 사이 논항 반복 비율의 참조적 응집성 지표와 인접 문장 사이의 의미적 응집성 지표에 대한 상관계수는 KOR에서 r=.713(p<.05)이고, US에서 r=.505(p>.05) 중등 이상 정도의 양적 선형 관계를 보였다.
4. 가독성 항목
1) FRE 지표(RDFRE)
FRE 지표 측정치는 한국에서 평균 8.3±9.7(최솟값=0; 최댓값=30.802)이고, 미국에서 23.2±15.5(최솟값=1.12; 최댓값=50.009)였다. 두 집단의 평균은 유의한 차이를 보 였다(p=0.019, p<.05[Table 5]). 한국이 미국에 비해 가독 성이 낮았다.
2) FKGL 지표(RDFKGL)
FKGL 지표 측정치는 한국에서 평균 18.4±3.0(최솟값 =13.638; 최댓값=22.717)고, 미국에서 14.2±2.7(최솟값 =9.446; 최댓값=18.293)였다. 두 집단의 평균은 유의한 차 이를 보였다(p=0.004, p<.01[Table 5]). 한국이 미국에 비 해 가독성이 낮았다.
Ⅳ. 고 찰
환자에게 정확한 의료 정보를 전달하는 것은 중요하다. 유용한 의료 정보는 환자의 심리적 불안감을 줄이고 더 나 아가 집단의 질병 관리에 도움을 줄 수 있다[18,19]. 암 환 자를 위한 방사선치료는 비전문가가 이해하기는 어려운 분 야다. 다양한 매체를 통해 많은 교육 자료가 환자들의 이해 수준을 높여주고 있지만, 이해도를 높이기 위한 노력은 아 직도 환자의 나이, 교육 수준 또는 국내외 언어적 상황과 같 은 다양한 요인이 고려되지 않고 있다[20,21]. 특히 국내 방사선치료를 받고 자 하는 외국인 암 환자는 내국인과 비 교하면 정보 습득, 이해, 문의 등에 큰 어려움을 겪고 있다.
의료 정보의 난이도와 환자의 이해력 사이의 불일치는 환 자의 다양한 의사결정과 전반적인 의료서비스에 부정적인 영향을 미칠 수 있다[22]. 이런 이유로 미국 의학협회 American Medical Association)는 의료 정보가 초등학교 6학년 읽기 수준 이하여야 한다고 권고하고 있다[23]. 의료 정보에는 텍스트, 음성, 사진, 영상 등 다양한 형태로 환자 에게 제공할 수 있다. 텍스트는 정보 전달 도구로써 의료 정 보의 이해도에 영향을 미치는 텍스트의 가독성에 관한 연구 가 다양하게 진행된 바 있다. Tran 등[22]은 상위 10위 인터 넷 웹 사이트를 선정하여 환자에게 제공되는 유방 절제술 (Mastectomy)와 유방 보존술(Lumpectomy)에 대한 의료 정보를 총 세 가지 지표(가독성, 복잡성, 적합성)를 비교 분 석한 바 있다. 전반적으로 환자에게 전달되는 내용 수준이 중간 이상으로 높게 나왔고, 유방 보존술에 대한 정보가 유 방 절제술에 비해 가독성이 낮은 것으로 나타났다. 여기서 그들은 환자에게 제공되는 적절한 인터넷 의료 정보는 환자 의 이해, 참여, 만족을 높여 궁극적으로 도움을 줄 수 있다 고 말했다. 또한 Rosenberg 등[24]은 미국 내 방사선종양 학과의 3분의 1을 무작위로 선정하여 방사선치료에 대한 일 반적인 정보와 다양한 치료 장비에 관한 정보를 총 여덟 가 지 지표를 이용하여 가독성을 평가했다. 그들의 연구 결과 에서 FKGL 가독성 측정치는 평균 12.7(9.6–16.2)으로써 권 장 등급(6등급)의 읽기 수준보다 높게 나타났다. FKGL 등 급 수준에서 10.0-12.9점은 10-12 등급(고등학교 수준)으 로써 13.0 이상은 대학 이상의 등급을 의미한다[25]. 본 연 구에서도 미국의 경우, FKGL 가독성 측정치는 평균 14.2(9.446–18.293)로써 Rosenberg 등[24]의 연구 결과처 럼 읽기 수준이 높게 나타났다(가독성 낮음).
방사선치료에 대한 일반적인 원리를 설명하는 문장으로 써 FRE와 FKGL 점수가 각각 50.009와 9.446인 미국의 병 원(8번)의 경우 “Radiation therapy is designed to treat tumor-containing tissue. Occasionally, normal tissue receives radiation, too. During radiation treatments, some normal tissues are temporarily irridated.”를 사용 하였고[26], 상대적으로 한국의 병원(3번)의 경우에서는 단 어 “ionization, penetrating, chemical, transformation, nucleic acid, cell membrane, essential substances, cell proliferation” 등으로 설명되어 졌다. 이렇게 전문용어를 사용하게 되면 가독성이 낮아지므로 읽기 수준을 낮출 수 있는 고민이 필요하다.
국내 영문 웹 페이지의 경우 전문용어에 해당하는 “intensity modulated radiation therapy (IMRT), image guided radiation therapy (IGRT), stereotactic radiation therapy (SBRT), stereotactic radiosurgery (SRS), 3-dimensional conformal radiotherapy (3D CRT)”과 같 은 방사선치료기술에 대한 전문용어가 많았다. 한국의 병원 (5번)의 경우 “Intensity-modulated radiation therapy is a ‘customized radiation therapy’ that fractionates and controls the intensity of individual surfaces to be irradiated to minimize the irradiation of normal tissue and to selectively irradiate cancerous tissue.”의 추가 적인 설명을 들어있다[27]. 이와 같은 부연 설명은 읽기 수 준을 낮추기가 어려운 경우에 환자의 이해를 돕는데 좋은 방법의 한 예시라고 볼 수 있으며 여러 방법에 대해 고민해 야 한다.
본 연구는 비영어권인 한국에서 환자에게 제공되는 방 사선치료기술 정보에 대한 가독성을 미국과 비교 분석하였 다. 한국에서 FKGL 가독성 측정치는 평균 18.4(13.638– 22.717)로써 미국에 비해 읽기 수준이 높아 가독성이 낮으 며 (p<.01), FRE 가독성에서도 한국(평균 8.3)이 미국(평균 23.3)보다 낮음으로써 가독성이 낮았다(p<.05). 이러한 결 과는 비영어권이 영어권에 비해 영문 텍스트의 가독성이 고 려되지 않고 있다는 점을 나타내고, 한국에서 방사선치료를 받는 외국인 암 환자에게 이해도가 높은 수준으로써 초등학 교 수준의 영문 텍스트가 필요할 것으로 내다본다.
Ⅴ. 결 론
본 연구는 외국인 암 환자를 위한 국내(한국) 방사선치료 정보를 전달하는 매체인 영문 텍스트의 가독성을 해외(미 국)와 비교 분석하였다. 미국에 비해 한국은 단어 수는 적지 만 문장 길이는 길었으며 가독성 항목 중 FKGL 지표가 높 고, FRE 항목은 낮게 나타났다(가독성이 낮음). 따라서 국 내에서 외국인 암 환자를 위한 방사선치료 영문 텍스트는 환자의 의료 질 서비스 향상을 위해 가독성을 높여야 할 것 으로 사료된다.