본문 바로가기
카테고리 없음

의료 영상 분석 및 진단을 위한 딥러닝

by 안행과 함께 2023. 7. 11.
반응형

의료영상 분석 사진
의료영상 분석 사진

1. 의료 영상 분석 및 진단을 위한 딥러닝의 개요

딥러닝이란 인공지능 기술 중 하나로 인간의 신경망 구조를 모방한 기계학습 방법이다. 이 딥러닝이라는 용어는 2012년 캐나다 토론토 대학교 제프리 힌튼 교수가 처음 제시하였으며, 현재까지도 많은 연구가 진행되고 있고 다양한 분야에서 활용되고 있다. 딥 러닝은 인공 지능 알고리즘을 활용하여 의료 영상 분석 및 진단을 혁신하며, 의료 영상에서 복잡한 패턴과 특징을 자동으로 추출할 수 있어 정확한 해석이 가능하다. 딥 러닝 모델은 종양 감지, 분할, 분류 및 질병 예측과 같은 작업에서 탁월하다. 대규모 데이터 세트를 통해 이러한 모델은 복잡한 관계를 학습하여 진단 정확도를 개선하고 임상의의 의사 결정을 지원하며, 방사선학, 병리학 및 안과를 포함한 다양한 의료 영역에서 이용되고 있으며 의료 전문가에게 환자 치료 개선을 위한 효율적이고 신뢰할 수 있는 도구를 제공한다. 특히 최근 코로나19 사태 이후 AI 기반의 헬스케어 산업이 주목받고 있으며, 실제로 글로벌 시장조사기관 IDC는 2020년 세계 디지털 헬스시장 규모가 약 2,500억 달러(약 297조 원)에 이를 것으로 전망했다. 또한 국내에서도 정부 차원에서 '한국판 뉴딜' 정책 추진과 함께 데이터 댐 구축 등 4차 산업혁명 시대 신성장 동력 확보를 위해 노력하고 있다. 이러한 상황 속에서 환자의 CT영상으로부터 폐암 여부를 판단하기 위한 모델을 개발하려고 할 때, 이를 예로 과정을 알아본다.

 

2. 의료 영상 분석 및 진단을 위한 딥러닝 과정

실제 임상 환경에서 적용 가능한 성능 수준의 흉부 CT 영상 분류 모델 생성 하고, 정확도 향상을 위한 학습데이터 재구축을 한다. 검증용 테스트 데이터셋 제작 후 평가 수행 위 세 가지 단계를 거쳐 최종적으로 정상/비정상폐 구분모델을 만드는 것이다. 우선 첫 번째 단계인 ‘흉부 CT 영상 분류 모델 생성’을 위해서는 크게 두 가지 요소가 필요하다. 첫째로는 입력되는 이미지로부터 특징점을 추출하는 부분이고, 둘째로는 이렇게 추출된 특징점들을 이용하여 새로운 클래스를 정의하는 부분이다. 먼저 각각의 병원에서 촬영된 흉부 CT 영상 자료를 수집하여, 각 기관별로 공통적으로 나타나는 특징점들을 추려내는 작업을 한다. 그러고 나서 해당 특징점들을 가지고 기존에 존재하던 classification 모델과의 비교를 통해 어떤 점들이 부족한지 파악한다. 예를 들어 크기가 작은 병변 같은 경우 주변 배경 노이즈나 다른 장기와의 경계면에 의해 쉽게 가려질 수 있다는 문제점이 있다. 좀 더 나은 성능을 내기 위해 다시 한번 샘플링된 data set을 대상으로 feature extraction 작업을 수행을 하며, 그렇게 해서 얻은 결과를 토대로 하여 새롭게 만든 classification 모델을 이전 버전과 비교함으로써 개선사항을 도출하며, 마지막으로 만들어진 모델을 여러 개의 test dataset에 적용시킨다.

 

3. 실제 임상 환경에서 적용 가능한 성능 수준의 영상 분류 방법

주어진 image 파일 내에서 특정 objective function을 만족시키는 feature만을 뽑아내어 새로운 classifier를 구성하려고 하면, 모든 종류의 medical images마다 고유의 특성을 갖고 있어서 동일한 목적함수를 가진다고 하더라도 서로 다른 형태의 model이 만들어지게 된다는 점이다. 그렇기 때문에 전체 의학이미지 데이터베이스를 모두 고려하면서 동시에 개별 이미지만큼 세부적인 정보를 반영할 수 있는 hybrid approach가 필요하게 된다. 즉, 사전에 미리 정해진 몇 가지 패턴만으로 예측하도록 하는 전통적인 classification 기법과는 달리, 다수의 독립적인 변수를 종합적으로 고려하여 보다 높은 확률로 질병을 찾아낼 수 있도록 하는 알고리즘을 설계하는 것이 관건이다. 따라서 정확도 향상을 위한 학습데이터 재구축을 하여야 하는데, 주의 사항은 최초 100개이상의 training examples을 만들고 난 후, 그것을 base로 하여 5만 개 이상의 validation examples을 만들어 본다. 이때 유의해야 할 점은 train-validation 간의 상관관계가 너무 높거나 낮지 않도록 해야 한다는 것이다. 만약 둘 사이의 상관계수가 너무 높으면 훈련과정에서 오류가 발생했을 때 제대로 교정되지 않을 위험이 크고, 반대로 상관계수가 너무 낮으면 새로 생긴 error를 발견하지 못할 우려가 있다. 그러므로 적당한 선에서 조절될 수 있도록 충분한 수의 반복작업을 거쳐야 한다. 그 후 검증용 테스트 데이터셋 제작 후 평가 수행하는데, 10만장 이상의 흉부 CT 영상자료를 바탕으로 학습을 하여도 충분하지는  않다. 왜냐하면 사람 몸속 조직구조는 매우 복잡하고 입체적이기 때문에 단순한 평면형태의 단층촬영으로는 내부조직의 미세한 차이를 구별해 내기 어렵기 때문이다. 따라서 인체내부공간정보를 정확히 표현할 수 있는 해부학적 지식이 요구된다. 뿐만 아니라 종양세포처럼 비정상적인 세포집단 역시 육안으로 식별하기 어려운 경우가 많으므로 그런 부위를 검출해 낼 수 있는 전문지식도 필요하다. 모쪼록 조기에 빠른 발견을 할 수 있는 시스템이 개발되어 확산되기를 희망한다.