코그넥스(www.cognex.com, 아시아 총괄 대표 문응진)는 오늘, 딥러닝 기반 이미지 분석 솔루션인 ’비전프로 딥러닝(VisionPro Deep Learning)’을 활용하여 엑스레이나 CT 스캔 이미지에서 코로나19 감염 식별 연구를 진행하였으며, 타 분석 장비 대비 월등한 식별 정확도를 얻었다고 발표했다.
코그넥스 비전프로 딥러닝은 공장 자동화를 위해 설계된 딥러닝 기반 이미지 분석 소프트웨어다. 비전프로 딥러닝은 기존의 머신비전으로는 적용하기 어려운 까다롭고 복잡한 애플리케이션을 해결하는 동시에 사람의 육안 검사로는 불가능한 일관성과 속도를 제공한다. 코그넥스는 관련 연구를 발표하며 코그넥스 비전프로 딥러닝이 의학적으로도 활용될 수 있다는 가능성을 확인했다.
최근 의학연구팀이 흉부 엑스레이를 분석하여 코로나19 감염 여부를 식별하는 문제에 코그넥스의 비전프로 딥러닝 소프트웨어를 적용하여 유의미한 결과를 얻었다. 후속 연구에서는 비전프로 딥러닝 소프트웨어를 적용하여 CT 스캔에서 코로나19 감염 징후를 식별하는 효과를 비교하였다. 이 연구는 소프트웨어를 훨씬 더 빠르고 쉽게 프로그래밍하는 방법도 연구하여 상당히 긍정적인 결과를 얻었다.
연구1. 딥러닝을 이용하여 흉부 X-Ray에서 코로나19 감염 이미지 식별: 코그넥스 비전프로 딥러닝 1.0 소프트웨어가 기존 딥러닝 분석 툴보다 높은 식별 정확도 보여
X-ray(엑스레이)와 같은 의료 이미지는 의사와 방사선사에게 코로나19 감염 여부를 확인하는 시각적 증거로 사용된다. 이의 분석을 위해 프로그래밍된 딥러닝 소프트웨어를 이용하여, 수천 개의 의료 이미지를 분석하고 이상 징후를 식별하여 의료진의 업무량을 줄일 수 있다.
그러나 기존에 가장 대중적으로 사용되고 있는 오픈소스 딥러닝 툴은 사용하기 어렵고 상당한 프로그래밍 전문 지식을 요구한다. 오픈소스 딥러닝 툴은 유용하지만 의사, 방사선 전문의를 포함한 의료 종사자가 툴을 다루기에 어려운 부분이 많았다.
이에 코그넥스 인공지능(AI) 전문팀은 기존 오픈소스 딥러닝 툴을 대체할 수 있는 이미지 식별 솔루션 연구와 개발에 나섰다. 코그넥스는 "딥러닝을 이용하여 흉부 엑스레이에서 코로나19 감염 이미지 식별: 코그넥스 비전프로 딥러닝 1.0 소프트웨어와 오픈소스 합성곱 신경망(Convolutional Neural Network: 딥러닝에서 선형 연산을 활용하여 시각 이미지를 분석하는 인공 신경망)과의 비교” 연구를 진행하여, 코그넥스 비전프로 딥러닝 컴퓨터 신경망(이하 CNN)을 VGG19, ResNet, DenseNet, Inception, COVID-NET라는 오픈소스 합성곱 신경망과 비교했다. 특히 COVID-NET은 흉부 엑스레이에서 코로나19 감염 진단을 위해 특별 제작된 딥러닝 컴퓨터 신경망(CNN)이다.
코그넥스의 생명과학 분야 수석 AI 전문가 Vandenhirtz는 "엑스레이에 나타나는 병리학을 소프트웨어로 쉽게 구분할 수 있다는 사실을 알고 놀랐다. 인간이 다른 병리학을 가진 엑스레이 이미지의 미세한 차이를 알아내는 것은 거의 불가능하다”라고 말했다.
코그넥스의 연구는 ‘COVID-Net: A Tailored Deep Convolutional Neural Network Design for Detection of COVID-19 Cases from Chest X-Ray Images’라는 Waterloo 대학의 연구 결과를 기반으로 진행되었다. 이 연구는 COVID-X라고 하는 데이터셋의 약 14,000개에 달하는 흉부 엑스레이 이미지를 활용했다. 공동 저자인 Linda Wang과 Alexander Wong은 인공 지능을 사용하여 엑스레이 이미지들을 분석하고 코로나19의 분명한 징후를 가진 폐를 식별하는 방법을 배운 정교한 신경망인 COVID-Net을 구축하는 데에 성공했다.
코그넥스 연구원 역시 COVID-X 데이터셋의 약 14,000개의 엑스레이 이미지를 활용하여 딥 러닝 도구를 훈련시켰다. 이미지는 ‘정상(Normal)’, ‘코로나19에 감염되지 않은 폐렴(Non-COVID-19)’, ‘코로나19 감염(COVID-19)’ 총 세 가지 범주로 구분되었다. 아래 표에서 알 수 있듯이, COVID-Net은 F-score(테스트 정확도 척도)가 ‘정상’ 92.6%에서 ‘코로나19 감염’ 94.7%에 이르는 우수한 결과를 나타냈다. 코그넥스의 비전프로 딥러닝 1.0 소프트웨어는 F-score(테스트 정확도 척도)가 ‘정상’에서 95.6%, ‘코로나19 감염’에서 97.0%로 COVID-Net보다 우수한 성과를 거두었다.
*F-score라고 하는 rel=‘nooper no referrer’ 측정은 디지털 이미지의 패턴과 이상을 정확하게 예측하려고 시도하는 딥 러닝 시스템의 전체 정확도를 평가하는 방법이다. F-score는 딥 러닝 시스템에서 생성된 올바른 예측의 백분율을 나타낸다.
연구2. 딥러닝을 이용하여 흉부 CT 스캔에서 코로나19 감염 이미지 식별: 코그넥스 비전프로 딥러닝 1.0의 검사 정확도가 99.4 이상으로 월등한 성능 입증
코그넥스 연구팀은 후속 연구로 흉부 CT(컴퓨터 단층 촬영) 스캔의 결과도 조사했다. 많은 연구가 엑스레이 및 CT 스캔 이미지를 딥러닝을 활용하여 코로나19 감염을 식별하는 데에 성공했지만, 대부분의 딥러닝 아키텍처는 시스템을 훈련시키기 위한 그래픽 사용자 인터페이스(GUI)를 제공하지 않기 때문에 광범위한 프로그래밍이 필요하다. 딥러닝이나 프로그래밍에 대한 지식이 부족한 방사선 전문의들은 이러한 프로그램을 훈련하기는커녕 이용하기도 어려울 수 있다.
코그넥스의 생명과학 분야 수석 AI 전문가 Vandenhirtz는 “딥 러닝 소프트웨어를 채택할 때 가장 큰 문제는 텐서플로(Tensor Flow: 머신 러닝을 위한 오픈소스 소프트웨어)와 같은 표준 패키지는 프로그래머가 텍스트 기반 터미널 인터페이스에서 모델을 구축해야 하기 때문에 사용하기가 어렵다는 것이다.”고 말하며 “반면 코그넥스 비전프로 딥러닝은 프로그래밍 경험이 필요 없는 사용자에게 친화적인 GUI를 갖추고 있다. MS 오피스를 사용할 수 있다면 비전프로 딥 러닝도 쉽게 배울 수 있다.”라고 말했다.
실제로 이번 프로젝트의 수석 연구원인 Arjun Sarkar도 코그넥스에 입사하기 전에는 비전프로 딥 러닝을 사용해본 적이 없지만, 두 달 만에 Sarkar는 이 프로그램을 사용하여 연구를 수행하고 결과를 작성했다. 기존의 딥러닝 연구는 네트워크를 구축하고 모델을 개발하고 알고리즘을 훈련하기 위해 수년 이상의 긴 시간이 필요하지만 비전프로 딥러닝은 이런 지연을 대폭 줄여준다.
또한 효과와 사용 용이성을 고려하여 코그넥스의 최근 실험은 비전프로 딥러닝이 ‘정상’, ‘코로나19에 감염되지 않은 폐렴’, ‘코로나19 감염’을 잘 식별하여 검사 정밀도를 높여 높은 F-scores(테스트의 정확도 척도)를 달성하기 위해 필요한 훈련량을 조사했다.
후속 논문인 “Detection of COVID-19 from Chest Computed Tomography (CT) images using Deep Learning: Comparing COGNEX VisionPro Deep Learning 1.0 Software with Open Source Convolutional Neural Networks,”은 Linda Wang 연구팀이 전문적으로 분류한 10만개 이상의 흉부 CT 이미지 데이터셋을 활용했다. 코그넥스 비전프로 딥러닝의 성능 측정을 위한 비교 검증 방식으로 Waterloo 대학의 CNN 아키텍처인 COVID-Net-CT-A와 COVID-Net-CT-B, 구글의 최신 CNN인 Xception을 포함한 최첨단 CNN을 활용했다.
아래 표에서 알 수 있듯이, 코그넥스 비전프로 딥러닝 1.0은 세 가지 유형(‘정상’, ‘코로나19에 감염되지 않은 폐렴’, ‘코로나19 감염’) 모두에서 F-Score가 99.4를 초과하여 다른 모든 CNN보다 월등한 검사 정확도를 보였다. 이 연구는 10만개 이상의 CT 스캔 데이터셋 이미지를 61,782개의 트레이닝셋(training set)과 각각의 CNN에 의해 학습과 분석을 거친 21,191개의 테스트셋(test set)으로 나누어서 이뤄졌다.
기존 CNN이 ‘정상’, ‘코로나19에 감염되지 않은 폐렴’, ‘코로나19 감염’ 상태를 식별하기 위해 얼마나 많은 이미지가 필요한지 확인해보기 위해, 코그넥스는 26,338개의 트레이닝셋(training set)을 활용하여 CNN을 재훈련했다. 그 결과 아래 표와 같이 각 CNN의 F-Score 결과가 도출되었다. 코그넥스 비전프로 딥 러닝은 세가지 이미지 분류 모두 F-Score 99.1% 이상으로 다른 CNN의 결과보다 월등히 높았다. 다른 CNN의 최고 F-Score는, 특히 ‘코로나19에 감염되지 않은 폐렴’과 ‘코로나19 감염’이라는 두 관련 병리학적 유형에서 80대 후반에서 90대 중반에 이르는 수치로 F-Score가 떨어졌음을 확인할 수 있다.
코그넥스가 밝힌 위 연구 결과는 의학 연구자들에 의한 검증을 필요로 하며, 코그넥스 비전프로 딥러닝은 아직 의료용으로 승인되지 않았다. 그러나 코그넥스 비전프로 딥러닝의 의학적 활용 가능성을 충분히 증명했다.
Vandenhirtz는 “모든 역량에서 딥러닝 알고리즘이 인간 의료진의 지혜를 완전히 대체할 수는 없으며 적어도 단기적으로는 인공지능이 의료 진단을 내릴 수 있을 것으로 생각하지 않는다.”고 말했다. “하지만 청진기나 혈압 측정기와 마찬가지로, 딥러닝은 의료 전문가들이 높은 수준에서 그들의 일을 수행할 수 있도록 돕는 유용한 도구가 될 수 있다.”라고 덧붙였다.
**원문: Deep Learning Identifies COVID in CT Scans - Blog | Cognex