الصحةNLPApplied MLDocument AI

صوت المريض لا يعيش داخل السجلّ السريري.

معهد بحوث أورام معروف عالميًّا أراد أن يسمع ما يقوله المرضى حين لا يستمع أحد من الأطبّاء, بنينا pipeline الـ social listening الذي أبرزه.

البيانات السريرية غنيّة لكن محدودة. تلتقط ما وُصِف، ما اختُبر، ما لُوحِظ في العيادة. تلتقط القليل ممّا يعيشه المرضى فعلًا بين المواعيد, نسيج الآثار الجانبية، تسلسل التشخيص، اللغة التي يستخدمونها لوصف ما يحدث لهم. لمعهد بحوث أورام يعمل على رعاية مركّزة على المريض، هذه الفجوة لها عواقب. رحلات العلاج الحقيقية، أنماط الآثار الجانبية، تسلسلات التشخيص, كانت موجودة في كلام المرضى على منصّات عامّة، لكن بشكل لا يستطيع أيّ فريق سريري قراءته بانتظام. السؤال: هل يمكننا تحويل كلام المرضى غير المُهيكَل إلى دليل research-grade؟

  1. 01

    ادصُر الكلام بمسؤولية.

    بنينا طبقة scraping منقّاة على محتوى Twitter عامّ مرتبط بسرطان الثدي والعلاجات وخطوات التشخيص وتجارب المرضى. كان الـ corpus محصورًا في لغة واحدة وجغرافيا واحدة للحفاظ على نظافة إشارة البحث.

  2. 02

    اكشف الكيانات التي تهمّ علم الأورام.

    الـ NLP off-the-shelf غير مُضبَط لمفردات علم الأورام. بنينا كشفًا متخصّصًا للعلاجات والجزيئات والآثار الجانبية وخطوات التشخيص ومؤشّرات مرحلة السرطان, الكيانات التي يجب أن تكون قابلة للاستخراج لكي يعني البحث شيئًا. القرار التحريري: precision قبل recall. corpus أصغر من رحلات مُستخرَجة جيّدًا يفوز على corpus أكبر مليء بالضوضاء.

  3. 03

    أعِد بناء الرحلة، لا نقاط البيانات فحسب.

    الكشف هو input. المخرَج الذي يهمّ هو رحلة المريض, تشخيص ثم علاج ثم آثار جانبية، متسلسلة زمنيًّا لكل فرد. رسمنا العلاجات المُكتشفة على ملفّات آثار جانبية معروفة وجمّعنا الرحلات من الإشارة المتفرّقة التي يتركها مريض واحد عبر منشورات متعدّدة.

حصل فريق البحث على وصول إلى منظورات مرضى في الزمن الحقيقي لا تظهر في السجلّات السريرية, نسيج العلاج المُعاش الذي لا تلتقطه الإحصاءات. أثبت الـ pipeline وسائل التواصل الاجتماعي كمصدر بيانات research-grade لعلم الأورام، مع framework يمتدّ إلى منصّات أخرى ولغات أخرى وأمراض أخرى. أبرز التحليل المُجمَّع على مسارات العلاج وتواتر الآثار الجانبية أنماطًا يستطيع المعهد التحقيق فيها سريريًّا الآن. الإطلاق: قناة بحث مكمّلة للبيانات السريرية، مصمَّمة للتوسّع.

في workflows البحث، الفجوة بين البيانات السريرية وتجربة المريض هي مشكلة data engineering قبل أن تكون مشكلة سريرية. ابنِ الـ pipeline الذي يلتقط الكلام، وتأتي الأسئلة البحثية بعده.

تعمل على مجال بحثي تعيش فيه أثمن البيانات خارج أنظمتك المؤسّسية؟ نساعد فِرَق البحث على تحويل الكلام العامّ غير المُهيكَل إلى دليل مُهيكَل, بمسؤولية وعلى نطاق واسع.

لنتحدّث

ابقَ على تواصل

هل لديك سؤال؟ يسعدنا أن نسمع منك.