畳み込みニューラルネットワークを用いた肺音の分類

Aykanat, M., Kılıç, Ö., Kurt, B. et al. Classification of lung sounds using convolutional neural networks. J Image Video Proc. 2017, 65 (2017). https://doi.org/10.1186/s13640-017-0213-2

In the field of medicine, with the introduction of computer systems that can collect and analyze massive amounts of data, many non-invasive diagnostic methods are being developed for a variety of conditions. In this study, our aim is to develop a non-invasive method of classifying respiratory sounds that are recorded by an electronic stethoscope and the audio recording software that uses various machine learning algorithms.

In order to store respiratory sounds on a computer, we developed a cost-effective and easy-to-use electronic stethoscope that can be used with any device. Using this device, we recorded 17,930 lung sounds from 1630 subjects.

We employed two types of machine learning algorithms; mel frequency cepstral coefficient (MFCC) features in a support vector machine (SVM) and spectrogram images in the convolutional neural network (CNN). Since using MFCC features with a SVM algorithm is a generally accepted classification method for audio, we utilized its results to benchmark the CNN algorithm. We prepared four data sets for each CNN and SVM algorithm to classify respiratory audio: (1) healthy versus pathological classification; (2) rale, rhonchus, and normal sound classification; (3) singular respiratory sound type classification; and (4) audio type classification with all sound types. Accuracy results of the experiments were; (1) CNN 86%, SVM 86%, (2) CNN 76%, SVM 75%, (3) CNN 80%, SVM 80%, and (4) CNN 62%, SVM 62%, respectively.

As a result, we found out that spectrogram image classification with CNN algorithm works as well as the SVM algorithm, and given the large amount of data, CNN and SVM machine learning algorithms can accurately classify and pre-diagnose respiratory audio.

医療分野では、膨大なデータを収集・解析できるコンピュータシステムの導入により、様々な疾患に対して多くの非侵襲的診断法が開発されています。本研究では、電子聴診器で録音された呼吸音を非侵襲的に分類する手法と、様々な機械学習アルゴリズムを用いた音声録音ソフトウェアの開発を目指します。

呼吸音をコンピュータに保存するために、あらゆるデバイスで使用できる費用対効果が高く使いやすい電子聴診器を開発しました。この装置を用いて、17人の被験者から930,1630の肺音を録音した。

1種類の機械学習アルゴリズムを採用しました。サポートベクターマシン(SVM)のメル周波数ケプストラル係数(MFCC)の特徴と畳み込みニューラルネットワーク(CNN)のスペクトログラム画像。SVM アルゴリズムで MFCC 機能を使用することは、オーディオの一般的に受け入れられている分類方法であるため、その結果を利用して CNN アルゴリズムのベンチマークを行いました。呼吸音声を分類するために、CNNおよびSVMアルゴリズムごとに2つのデータセットを用意しました:(3)健康と病理学的分類;(4)ラール、ロンチュ、および通常の音の分類。(1)特異な呼吸音タイプの分類。(86)すべてのサウンドタイプによるオーディオタイプの分類。実験の精度結果は次のとおりです。(1) CNN 86%, SVM 86%, (2) CNN 76%, SVM 75%, (3) CNN 80%, SVM 80%, (4) CNN 62%, SVM 62%,

その結果、CNNアルゴリズムによるスペクトログラム画像分類がSVMアルゴリズムと同様に機能し、大量のデータを考えると、CNNおよびSVM機械学習アルゴリズムが呼吸音声を正確に分類および事前診断できることを発見しました。


この記事が気に入ったらサポートをしてみませんか?