Команда «Smile ;) »
Проект в медицине на основе SAP HANA
Илья Ямщиков
ilya.yamschikov@gmail.com
Иван Афанасьев
afanasiev@casyclub.ru
Хаспулатова Юлия
24julia@gmail.com
Ибрагимов Рустам
rustik0612@gmail.com
* Материалы подготовлены специально для case Cup Technical 2013 championship и являются собственностью команды “ Smile ;) “
Executive Summary
Выбор отрасли
Summary
Устройство системы
Wow-effect
Smile team
Проект обработки Big Data с использованием SAP HANA
В какой области?
Какую проблему решает?
Проект в социальной сфере Область внедрения – медицина
Предлагаемая система предоставляет врачам доступ к медицинским данным всех зарегистрированных больных, собранным за прошлые годы. С использованием статистики по этим данным врач может предлагать индивидуальную программу лечения, основанную на опыте миллионов других пациентов со схожими случаями. Врач получит возможность делать прогнозы об эффективности различных методов лечения пациентов с определенными характеристиками и это позволит существенно поднять качество лечения пациентов
Какой эффект будет достигнут?
Какие данные используются?
значительное снижение смертности среди пациентов
В базе данных будут собраны медицинские данные всех зарегистрированных пациентов. Это рекомендации врача, медицинские снимки, результаты прежних и текущих лабораторных обследований.
снижение числа дорогих операций
сокращение числа посещений клиник общее повышение эффективности лечения
сокращение затрат за счет снижения времени на обслуживание
2
Выбор отрасли
Summary
Выбор отрасли
Устройство системы
Wow-effect
Smile team
Внедрение SAP HANA мы рекомендуем провести в области медицины, как в представителе одной из самых перспективных отраслей социальной сферы Самые перспективные отрасли испытывают наибольшую потребность в инновационных решениях
Социальные отрасли являются самыми перспективными для использования SAP HANA
Радиус окружности показывает относительный объем индустрии
Высокий
Индекс перспективности отрасли Финансы и страхование
Коммуникальные услуги
Поставщики медицинских услуг Природные ресурсы
Поставщики медицинских услуг
Индекс легкости захвата данных
Транспорт и складирование Коммуникальные услуги Производство Информация Транспорт и складирование
Природные ресурсы Проффесиональные услуги
Недвижимость и аренда
Управление компаниями
Компьютеры и электронные изделия
Представление услуг проживания и питания
Управление отходами
Недвижимость и аренда Управление компаниями Проффесиональные услуги Оптовая торговля
Оптовая торговля Строительство
Компьютеры и электронные изделия
Розничная торговля
0
5 10 15 20 25 30 35 40 45 50 55 60
Социальные отрасли
Бизнес отрасли
*Индекс перспективности отрасли – произведение индекса потенциала применения технологии BIG DATA и индекса легкости захвата данных, в отн. ед.
Прочие услуги
Низкий
Услуги в области образования
Социальная
Правительство
Медицина
Исскуство и развлечения
Низкий
Высокий
Сравнительный индекс потенциала применения технологии BIG DATA Наименее перспективные отрасли
Перспективные отрасли
Наиболее перспективные отрасли
Источники: аналитика McKinsey, анализ команды Smile ;) , данные кейса
Сфера внедрения
Отрасль 3
Устройство системы Wow-effect Summary Выбор отрасли Smile team Медицина Сервис доступа к статистике по всем историям болезни в режиме реального времени имеет наибольший финансовый потенциал и предъявляет наибольшие требования к быстродействию
Основные источники Big Data в сфере медицины Источник:
Примеры:
Клинические данные
Электронные медицинские карты, данные анализов
Данные R&D
Клинические испытания, HTS – автоматические эксперименты с большим потоком данных
Финансовые данные
Поведение пациентов
Потенциал монетизации сектора:*
Планирование расходов и загруженности мед. учреждений Данные о поведении и предпочтениях пациентов, мониторинг приема лекарств
Направления использования клинических данных Перспективные направления
Объем данных
Необходимость быстрого доступа
Поиск эффективных методов лечения на основе данных о всех пациентах
Системы поддержки принятия решений для клиник Обеспечение прозрачности медицинских данных Удаленный мониторинг пациентов (особенно для хронических больных) Индивидуальные программы лечения пациентов на основе данных о схожих историях болезни
Система хранения электронных медицинских карт с возможностью получения статистических данных по всем хранящимся картам На сегодняшний день самой актуальной концепцией подхода к медицинской практике является концепция доказательной медицины. Ключевым моментом в этой концепции является то, что решение о назначении лечения, какого-то конкретного препарата, проведении профилактики принимается исходя из имеющихся доказательств их эффективности и безопасности. При этом эти данные по эффективности и безопасности должны постоянно проверятся, сравниваться и должны быть доступны всем заинтересованным.
Возникает проблема сбора и анализа данных, полученных в клинических исследованиях и повседневной клинической работе врачей. Самый большой поток данных – ежедневные записи о лечении пациентов и результаты анализов этих пациентов. * по данным McKinsey для сферы здравоохранения США Источники: аналитика компании McKinsey, анализ команды Smile, данные кейса
Обеспечение быстрого доступа к этим данным позволит кардинально изменить процесс принятия решения о назначении лечения. Сейчас врач принимает это решение основываясь на собственном опыте и результаты отдельных исследований. Рассматриваемая нами система даст врачу доступ в реальном времени к данным, собранным тысячами врачами, столкнувшимися со схожими случаями. Он сможет проанализировать методы лечения с учетом их эффективности для пациентов с таким же состоянием, как у пациента сидящего у него в кабинете. Главными проблемами в реализации этой системы являются: • Необходимость хранения больших объемов данных – для примера, в России за год регистрируется около 1 млрд. врачебных посещений. • Необходимость анализа этих данных в реальном времени – врач должен получать статистику по данным в процессе приема пациента, а следовательно время выполнения запроса не должно превышать десятков секунд. 4
Параметры Устройство системы Wow-effect Summary Выбор отрасли Smile team системы В области имеется необходимость обрабатывать более 0,6 ГБ данных в секунду, с этим справится только in-memory data base, которой и является SAP HANA С системой взаимодействует несколько видов клиентов, но самыми критичными по времени являются запросы врачей Врачи клиник
В системе есть острая необходимость в SAP HANA
Фармацевтические компании и клиники
Объем базы • около 10 миллиардов записей каждый год • каждый день в систему поступают данные об около 50 тысячах пациентах
Имеют доступ к статистическим данным по эффективности разных типов лечения и электронным медицинским картам пациентов. Также они заносят данные по результатам проведенного ими лечения
Имеют доступ к статистическим данным по эффективности лечения какими-либо медикаментами для планирования развития и сотрудничества
Врачи демонстрируют пациентам прямо в кабинете статистические данные по лечению их заболевания
Источники: данные компании CareCore, анализ команды Smile ;)
• в среднем статистический запрос врача затрагивает около 3 миллиардов записей • время обработки запроса не должно превышать 5 секунд, т.к. ответ на него показывается пациенту в кабинете врача
Следовательно, система должна обрабатывать более 600 миллионов записей в секунду
Облако Пациенты
Скорость обработки
Клиники и страховые компании
Имеют доступ к данным по клиниками для формирования отчетов, планирования развития и сотрудничества.
Big Data
Скорость
Объем базы данных 50 ТБ
Обработка около 0,6 ГБ в секунду 5
Устройство Устройство системы Wow-effect Summary Выбор отрасли Smile team системы Благодаря продуманной и оптимизационно-выверенной архитектуре системы SAP HANA все её пользователи получают быстрый, надежный и простой в использовании сервис Входные данные Информация загружаемая на хранение в базу, как то: истории болезни пациентов, препараты которые применялись и т.п.
Облачная структура База резервного хранилища данных
Уровень приложения, обеспечивающий логику обработки данных
Выходные данные Система (набор инструментов) бизнес аналитики
SAP
SAP BW
SAP BI 1
Репликация, ETL
Visualization
Результаты выполнения запросов клиник, страх. и фарм. компаний. Как правило структурированная опр. образом статистическая информация
Отправка результатов запроса организациям
Модули приложений Графическое и 1 анимированное представления результатов анализа Big Data с целью облегчения их понимания
2 Оценка влияния различных препаратов на состояние здоровья пациента. Выявление закономерностей.
2
HANA
3 Моделирование течения болезни при различных конфигурациях данных с целью выявления причины заболевания
Regression 3
2 Запросы врачей, клиник, страховых и фармацевтических компаний на предоставление необходимой информации
Основной модуль - кластерная аппаратная платформа “Inmemory” СУБД
Simulation
Отправка результатов запроса врачам
4
Predictions Организация базы данных:
•
Узлы построены на IBM X3950 X5, в каждом 1ТБ RAM
•
Необходимо около 50 узлов, для хранения 50ТБ базы данных Стоимость HANA сервера составит $ 5-10 млн.
Результаты выполнения запросов врачей. Как правило история болезни пациентов, моделирование её течения и некоторые предсказательные результаты лечения
Предсказание реакции организма на лечение на основании имеющейся статистической и персональной информации
4
6
Wow – effect
Выбор отрасли
Summary
Устройство системы
Wow-effect
Smile team
Внедрение SAP HANA в области медицины приведет к увеличению эффективности диагностики различных заболеваний и к значительному уменьшению уровня смертности пациентов Результаты внедрения системы SAP HANA
Прогнозируемые изменения на основании опросов
Быстрый и неограниченный доступ к огромной базе данных медицинской информации с возможностью анализа прошлых и real-time данных, моделирования течения болезней и предсказания будущего их развития Резкое увеличение эффективности диагностики и уменьшения уровня смертности пациентов
•
✓ • •
1 . “How Big Data saves money and lives”, S. Galer, 06.03.13 . 2 . “Why doctors should crowdsource your medical diagnoses?” Irfan Khan, 18.10.201 3. A survey of c-suite executives, “Harris interactive on behalf of SAP AG” April 2012
Результаты внедрения системы Big Data на примере клиники Kaiser Permanente USA (внедрялась единая информационная медицинская система (EHR) ) Снижение смертности от инфаркта1
Число посещений , по выборке клиник2
-88%
Кол-во врачебных ошибок, по выборке клиник, -57%
-26%
До
После
До
После
Q1/2007
Q2/2007
87% федеральных и 75% окружных IT officials уверены, что решения на базе real-time Big Data значительно уменьшат смертность среди пациентов клиник 1 3 из 4 врачей пользующихся сервисами Big Data в медицине улучшили лечение пациентов благодаря им2 50% снижение затрат на IT обслуживание 3
На примере исследования Мичиганского Государственного Университета (MSU) 1 Исследовалось внедрение EHR системы в небольшую частную медицинскую клинику с количеством персонала в 4 врача
• Ежегодно предотвращает ся 135 смертей и 260 дорогих операций
• Число посещений клиник сокращено на 6.3 млн. в год
1. По данным Collaborative Cardiac Care Service with Health IT (KP Case Study, 27 марта 2009 г.); 2. Благодаря применению защищенных систем обмена сообщениями (KP Core Value Metrics Quarterly Trending Report Q4 2010) Источник: Kaiser Permanente News Center
$
• •
Сокращение времени на обслуживание в 1.4 раза (в рабочих часах) Сокращение затрат на 54 000$ в год
1. “The big deal about Health care IT”, Irfan Khan 03.12.12
7
Smile team
Summary
Выбор отрасли
Устройство системы
Wow-effect
Smile team
Команда Smile ;) - это качество и позитив
Афанасьев Иван 1 курс магистратуры МФТИ afanasiev@casyclub.ru
2 место Changellenge Cup Technical 2012 3 место Changellenge Cup Moscow 2012
8 (916) 270 51 60
Полуфиналист многих кейс-чемпионатов Changellenge
Хаспулатова Юлия 1 курс магистратуры МФТИ 24julia@gmail.com
2 место Changellenge Cup Technical 2012 Полуфиналистка MedxChallenge 2013
8 (963) 924 24 08
Полуфиналистка Microsoft Case Competition 2012
Ямщиков Илья 1 курс магистратуры МФТИ ilya.yamschikov@gmail.com
Финалист Changellenge Cup Russia 2012
Полуфиналист MedxChallenge 2013
8 (917) 569 23 51
Полуфиналист Microsoft Case Competition 2012
Ибрагимов Рустам 1 курс магистратуры МФТИ rustik0612@gmail.com 8 (926) 313 12 54
Полуфиналист Changellenge Cup Technical 2012 Полуфиналист MedxChallenge 2013 Microsoft Case Competition 2012 HQ 15 8
Приложение
Результаты опросов руководителей крупных компаний по перспективам использования Big Data* С чем столкнется ваша компания в результате стремительного роста объема данных?
Пострадает ли ваш бизнес от большого количества данных?
30%
70% 25% Какие данные действительно необходимы
13%
11%
10%
9%
9%
Затраты на Недостаток Выяснение какие Недостаток ITНедостаток техническую бизнес технологии skills в анализе способностей в инфраструктуру лучше BD анализе данных поддержки
Как обернуть Big Data c свою пользу?
53%
54%
Компаний отметили существующую ‘пропасть’ между доступностью Big Data и способами их анализа
Компаний предвидят необходимость внедрения высокоэффектив ной платформы для анализа
Слышали ли вы когда-нибудь о Big Data analytics ?
90%
34%
Да слышали
Да, уже используем
Используют ли в вашей компании BD analytics?
Респондентов ответили нет, большие данные – это возможность
Как Big Data analytics поменяет ваш бизнес?
Менее
30% рабочих используют корпоративные BI решения Цифра эта, как правило, меньше
10%
Респондентов ответили да, большие данные – являются проблемой
54%
59%
Более эффективные Резкое увеличение бизнес операции продаж
50% Бизнес станет более динамичным
46%
48%
Привлечение покупателей
Уменьшение IT затрат
Как скоро BD analytics станет мейнстримом в вашей компании? Функциональность, скорость и надежность приведет более
50% потенциальных пользователей к 2014 году к пользованию BD analytics
*Источники: “Make intelligence decisions with Big Data”, by Lindsey Nelson, February 20, 2013
70% Респондентов уверены в окупаемости стартовых инвестиций в течении 1 года
9