Великі дані проти раку

Співробітники компанії Tamr - Енді Палмер (Andy Palmer), Алан Вагнер (Alan Wagner) і Нідхі Аггарвал (Nidhi Aggarwal).


Уряд США планує інвестувати 1 млрд доларів у проект Cancer Moonshot. Це має прискорити проведення досліджень у сфері виявлення, лікування та запобігання раковим захворюванням.


Куратор проекту - віце-президент Джо Байден. Його син, Бо Байден помер від раку мозку в 2015 році у віці 46 років. Назва проекту з'явилася після промови Джо Байдена, в якій він закликав досягти прориву в області боротьби з онкозахворюваннями, до нового національного досягнення, «польоту на Місяць». Це амбітне і важливе завдання - щорічно від раку помирає близько 600 000 американців, захворювання діагностується у 1,6 мільйона жителів США.

Мета Cancer Moonshot - подвоїти нинішні темпи впровадження інновацій у медичній галузі. Це непросте завдання, беручи до уваги те, що боротьбою з раком займається безліч дослідницьких колективів. Гроші на це йдуть чималі, так 5,2 млрд доларів виділені тільки Національному інституту онкології США (National Cancer Institute, NCI - входить до Національного інституту здоров'я (National Institutes of Health, NIH)), а всього в світі на боротьбу з раком йде більш ніж 100 млрд доларів щорічно.

Але план дій, озвучений Байденом, не передбачає великих витрат, будівництва центрів з лікування раку або початку нових наукових розробок. Замість цього пропонується спростити бюрократичні процедури і знайти спосіб об'єднати зусилля контролюючих органів, промисловості, дослідників, груп пацієнтів і благодійних організацій. Передбачається, що спільними зусиллями буде досягнуто результатів, що перевищують можливості окремих учасників процесу. Таким чином, основна частина роботи - збір даних та організація обміну ними.

"З мого особистого досвіду, я знаю, що дослідження і методи терапії на порозі неймовірних відкриттів, - писав Байден у пості на medium.com в січні. - Тільки за останні чотири роки ми побачили дивовижний прогрес. І це переломний момент. Але наукові відкриття, дані та результати досліджень зберігаються в засіках, перешкоджаючи швидкому прогресу і більшій доступності інновацій для пацієнтів ".

Дані і технологічні новинки можуть зіграти важливу роль у «медичній революції», якщо стануть загальнодоступними, вважає Байден. Якщо проекту вдасться відкрити для дослідників ті великі масиви пов'язаних з раком даних, що різні організації збирали і зберігали роками, то успіх «польоту на Місяць» досить ймовірний.

"Майже кожен онкологічний центр тримає базу даних - генетична історія, медичні записи і банки тканин - що може містити ключ до вдосконалення певних способів лікування раку, - пише Байден. - Дати можливість дослідникам і онкологам використовувати цей клас інформації - життєво важливо для прискорення темпів прогресу на шляху до лікування. Якщо ми зробимо ці дані сумісними і доступними для вчених, дослідників і лікарів, то досягнемо прискорення наукових досягнень, покращимо догляд за пацієнтами і посунемося ближче до лікування ".


Про те, які труднощі очікують Cancer Moonshot при роботі з великими даними, говорить Нідхі Аггарвал (Nidhi Aggarwal), директор з просування і стратегічного розвитку компанії Tamr.

«Є тисячі можливих джерел, державних і приватних, які потенційно могли б бути використані для просування досліджень - все, починаючи від даних, отриманих в ході клінічних випробувань, що складаються з кілька тисяч параметрів, до геномних наборів даних, які можуть містити мільйони елементів, - зазначає Аггарвал. - Проблем безліч і вони різноманітні».

Tamr цього тижня оголосила, що надасть всім дослідникам, пов'язаним з Cancer Moonshot, своє програмне забезпечення для роботи з великими даними. У програмах Tamr використовуються алгоритми машинного навчання, призначені для організації, підготовки та інтеграції слабоструктурованих і неструктурованих даних для аналізу. Компанія також залучає до роботи безліч експертів для контролю роботи і поліпшення алгоритмів.

Програмне забезпечення Tamr використовується такими фармацевтичними компаніями, як Novartis, GlaxoSmithKline і Merck.

Крім проблеми обробки великого обсягу даних, є й інші складнощі, в тому числі відсутність єдиних стандартів даних. Аггарвал зазначає, що спроби стандартизації даних були, так FDA випускало вимогу, згідно з якою всі електронні дані по клінічних дослідженнях повинні представлятися у вигляді, що відповідає стандартам обміну даними (CDISC), а Установа національної координації медичних інформаційних технологій (Office of the National Coordinator for Health Information Technology), що планує взаємодіяти ", планує, Але поки ні FDA, ні ONC не змогли досягти заявлених цілей.

Замість того щоб покладатися на зусилля Федеральних агентств зі стандартизації, Аггарвал рекомендує використовувати підхід, використаний у проекті вантажного космічного корабля SpaceX, знайти спосіб партнерської взаємодії державного і приватного секторів. Вона також каже, що стандартизація і уніфікація повинні дотримуватися з самого початку роботи над проектом.

Нарешті, вона зазначає, що масштаб даних і проблеми взаємодії настільки великі, що люди і колективи не повинні намагатися вирішити завдання боротьби з раком поодинці. Машинне навчання і штучний інтелект розвиваються стрімко, і потрібно повною мірою використовувати ці інструменти.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND