第1ステップ(もう少しで達成?)の報告です!
大阪大学大学院歯学研究科顎口腔機能治療学教室のクラウドファンディングを行ってから約2年が経過しました.皆さまのご支援のおかげで目標金額を達成することができ,その研究資金のおかげで(順調に,とはなかなかいきませんが…)研究を進められています.大学として研究資金があるということは本当にありがたいことであり,ご支援頂いた皆さまに深く感謝申し上げます.
研究テーマは「口腔がん:がんで失った「ことば」を取り戻す、新規言語治療法の開発」でした.具体的には,ディープラーニングを用いたAIによる音声認識により,「ことば」が通じにくくなった口腔がん術後患者さんの翻訳ツール・アプリを開発する,というものです.第1ステップとして,2023年12月を目途に「AIの口腔がん患者さんの音声認識の精度を最大限に上げるアルゴリズムの開発」を目標としていましたので,その進捗を報告いたします.
コロナ禍と患者さんの病気の再発などがあり,少し予定より遅れていますが約20名の患者さんの音声サンプルを採取することができました.1人の患者さんの音声サンプルを採取するのに要する時間は3~4時間! ただでさえ「ことば」が不自由な患者さんが,3~4時間かけてテキスト文を読んでいただくのはかなりのご負担だったと思いますが…皆さん協力していただけました.(そのなかでも1人の患者さんは,なんと約20時間!!の音声サンプルを録音いただけました)
それらサンプルを用いてさまざまなアルゴリズムを試用してAIに学習させ,音声認識させると…患者さんによっては認識精度が90%近くまで上がるようになりました.アルゴリズムの詳細は論文発表等が控えているため,ここでは公開できませんが…確実に音声認識精度は上がっています!! 理想を言うと全患者さんの認識精度が95%くらいにはなってほしい!ということで,今後もさまざまな方法で研究を行っていく予定にしています.
<結果の一例:未発表データのためモザイクをかけています>
現在は,音声サンプルを効率よく増やすため,
① 決められた文章の読み上げ音声ではなく,日常会話を用いた音声認識システムの構築
② 患者さんの発話を音声合成し(水増し!?),その音声データを用いた音声認識精度アップの方法論構築
などを行っています.
皆さまからご支援頂いた資金は,
・防音室設置(工賃を含む)
・解析用PCおよびソフト
・研究発表旅費
・録音機器および周辺機器
として583万円を使用させていただきました(残金354万円).
もっとも重要かつ高価であった防音室を設置できたことは,今回の研究を遂行するにあたり非常に助かりました.
<左:防音室外観,右:防音室内>
今後,第1ステップである「音声認識精度を上げるアルゴリズムの開発」を継続しつつ,第2ステップである「認識できた音声をスムースに人工音声でアウトプットする方法の確立」にも取り掛かる予定です.第3ステップである「認識した音声をアウトプットできるアプリ・ツールの開発」には,まだ時間と費用がかかりそうですが….確実に研究は進んでいます!アプリ・ツールが実装され,患者さんのQOL向上に役立てるまで…チームで頑張っていきます!
引き続き,ご支援のほどよろしくお願いします!
<定期的に研究ミーティングを行っています!>