Компания Amazon
Поскольку базовые OCR обычно выдают беспорядочную информацию при извлечении текста из таблиц и форм, компаниям приходится прибегать к ручному вводу данных, который может быть как дорогостоящим, так и длительным. Textract может обрабатывать миллионы страниц всего за несколько часов, что может снизить затраты на обработку документов. Плюс, клиенты могут использовать его, даже если у них нет опыта машинного обучения.
Amazon утверждает, что Textract может распознавать такую информацию, как имена и номера социального страхования, что позволяет ему переносить данные таблиц из PDF-файлов, например, в легко доступные для поиска электронные таблицы. При обработке больших пачек документов извлекаемая информация может использоваться для создания интеллектуального поиска или загружаться в базы данных.
Данный продукт пока доступен только в некоторых частях США (Огайо, Северная Вирджиния, Орегон) и Ирландии. Тем не менее, в следующем году он будет доступен в большем количестве регионов.