PROMASK распознаёт документ, находит в нём ФИО, даты рождения, контакты и реквизиты и закрывает их. Остаётся только медицинское содержание, которое можно спокойно передавать дальше.
В бланке лаборатории всегда есть ФИО пациента и дата рождения, иногда адрес и телефон. Это персональные данные, поэтому передать такой документ во внешнюю систему расшифровки или сравнения цен нельзя. А зачищать вручную долго и ненадёжно: человек устаёт и пропускает, да и формат у каждой лаборатории свой.
PDF или фото проходит OCR. Возвращается текст и координаты каждого слова на странице.
Собственные правила ловят жёсткие форматы: СНИЛС, полис ОМС, телефоны, даты, ИНН.
Модель, дообученная на медицинских текстах, находит ФИО, организации и реквизиты в любой вёрстке.
Найденное закрывается: в тексте ставятся метки, на изображении и в PDF рисуются чёрные прямоугольники.
| Вручную | Простые регулярки | PROMASK | |
|---|---|---|---|
| ФИО пациента и врача | глаз пропускает | имена не ловятся | правила + ML-модель |
| Разные лаборатории | каждый формат заново | ломаются на новой вёрстке | модель обобщает |
| Скорость на документ | минуты ручной работы | быстро | секунды |
| Формат результата | по-разному | только текст | текст, изображение, PDF |
Чистый текст документа, где ФИО и реквизиты заменены метками вида [PERSON], [DATE]. Готов для передачи в расшифровщик.
Исходное фото или скан с чёрными прямоугольниками поверх персональных данных.
Многостраничный PDF с замаскированными данными на каждой странице. Визуально как оригинал, только без персональных данных.
Демо-режим. Загрузите PDF или изображение результата анализа и выберите формат результата.
Чем больше разных форматов видит модель, тем точнее она работает. Если ваша лаборатория или медицинский центр готовы прислать примеры бланков, это заметно улучшит качество анонимизации и для вашего формата, и для чужих.
Продукт только набирает обороты. Позади первый полноценный эксперимент на реальных документах. Если хотите применять анонимизацию у себя на коммерческой основе, оставьте заявку, и мы обсудим условия и интеграцию.