医療系の一部上場企業様の案件紹介となります。

電子カルテにおいて、医師の所見は構造化されていないシンプルなテキストとして記載されます。
一方で大量のデータからデータ分析を行う（インサイトを得たい）場合、必要な情報は構造化されている必要があります。
本案件では系列ラベリングを行うAIを開発することで、このギャップを解消いたしました。

これにより数百億以上の眠ったままだったDWH上のデータを分析対象にすることができるようになりました。
インサイトを得られることによって製薬会社などの医療業界における重要なポジションに位置するプレイヤーに対して、より積極的に精度の高い提案を行うことができるようになっております。

課題

既存の辞書マッチングの技術では表記ゆれや否定表現などに対応しきれず、満足に情報の抽出ができない問題がありました。
特に否定表現については致命的で、分析の段階で全く異なった知見が得られてしまう可能性が高まるため容易には手が出せず、限られた範囲のデータしか扱えない状況でした。
本案件では大規模言語モデルであるBERTを活用し、課題を系列ラベリングと定式化して解くことを提案いたしました。
これによってより幅広い表現に対して精度の高い、重要表現の抽出モデルを構築することができるようになり、本来フォーカスしたかったインサイト抽出に向けて大きく舵をきることができるようになりました。

また、AIの実運用を行う必要があるためAWS上にGPUを活用する運用基盤を構築いたしました。
構築されたAIはREST APIとしてラッピングすることでアクセスを容易にし、カスタマイズ性の向上も実現しております。

同社様とは包括的な契約を結んでおり、AI開発に限らず統計分析やインフラ構築など多様なサービスを提供してございます。
現在では医療により特化した言語基盤モデルを構築することで、同社様で使用されるあらゆるプロジェクトにおける医療AIの精度向上施策に取り組んでおります。