Софт

Amazon представила Textract AI

Amazon представила Textract AI

Компания Amazon выпустила новое приложение Textract для клиентов своих веб-сервисов. Оно не просто извлекает текст из документов, как можно подумать, учитывая его название — Amazon заявляет, что оно на самом деле может идентифицировать различные форматы документов и их содержимое, чтобы правильно обрабатывать их. Продукт был спроектирован так, чтобы он мог распознавать текст из таблиц и квитанции из документов, включая отсканированные квитанции, налоговые документы или списки. Затем он генерирует структурированные данные, которые не требуют участия человека.

Поскольку базовые OCR обычно выдают беспорядочную информацию при извлечении текста из таблиц и форм, компаниям приходится прибегать к ручному вводу данных, который может быть как дорогостоящим, так и длительным. Textract может обрабатывать миллионы страниц всего за несколько часов, что может снизить затраты на обработку документов. Плюс, клиенты могут использовать его, даже если у них нет опыта машинного обучения.

Amazon утверждает, что Textract может распознавать такую ​​информацию, как имена и номера социального страхования, что позволяет ему переносить данные таблиц из PDF-файлов, например, в легко доступные для поиска электронные таблицы. При обработке больших пачек документов извлекаемая информация может использоваться для создания интеллектуального поиска или загружаться в базы данных.

Данный продукт пока доступен только в некоторых частях США (Огайо, Северная Вирджиния, Орегон) и Ирландии. Тем не менее, в следующем году он будет доступен в большем количестве регионов.

Поделиться с миром: