Обозначение объектов, формулировки и показатели

Во-первых, указанные объекты и понятия, такие как страны, компании и лица, исполнительные директора, политические лидеры, должны быть разбиты на категории. Во-вторых, указание числа должно быть точным; поскольку разные форматы и числовые представления очень важны, любая автоматическая система должна уметь обрабатывать различные буквенно-цифровые форматы и переводить их в конкретные значения. В финансовом контексте необходимо искать только те понятия, в которых заинтересован брокер, чтобы избежать переизбытка информации.

Приложение, которое действительно помогает трейдеру, должно, таким образом, предлагать возможность выбирать интересующие понятия и позволять настраивать темы, на которые трейдер хотел бы отреагировать. Настройка, возможность выбора, личный интерес и опыт неотъемлемы.

Здесь различия между формулировками, фразами и показателями являются определяющими. Когда формулировки состоят из словосочетаний, таких как «низкий спрос», «уменьшающиеся продажи», «сокращающиеся прогнозы», описывающих, какие экономические ситуации или события могут возникнуть, финансовые результаты и цифры, скорее всего, будут более осторожными. Показатели всегда сопровождаются цифрами и часто связанными с ними временными отрезками. Читатели легко отличат числа 2015 и 2016; программное обеспечение нужно научить сопровождать выборку чисел информацией о времени или позиции.

Учитывая короткий текст новости, на следующем рисунке часть информации представлена в неструктурированной форме. Красные и темно-серые пометки выделяют компанию, которую необходимо искать в тексте, зеленые и серые пометки выделяют показатели, а светло-зеленые и светло-серые указывают числа, найденные в тексте. Далее следует наиболее важный шаг: все эти показатели, формулировки, временные отрезки, лица или компании связываются и переплетаются в едином контексте. Таким образом, в этом примере мы понимаем, что доход IBM упал до $22,4 млрд в III квартале. Трейдеры могли бы использовать эту конкретную информацию, чтобы продать акции, если их ожидания не были оправданы, или в противном случае купить их.

ATRAP – это программа для обработки новостей по торгам в режиме реального времени. Она способна проводить текстовый анализ и имеет огромные возможности для настройки параметров торгов после анализа неструктурированного текста. К примеру, трейдер настраивает программу таким образом: он будет продавать свои акции IBM, если его ожидания прибыли в размере $25 млрд не сбываются, и он будет покупать акции, если ожидания сбываются. Когда появляется новость, ATRAP проверяет факты, и, если они отвечают (неважно каким образом) указанным условиям, автоматически размещает заказ на рынке. Следующий рисунок демонстрирует снимок экрана ATRAP с успешной сделкой. Скорость проведения анализа позволяет ATRAP размещать заказы раньше других и до того, как торги будут приостановлены.

Формулировки найти проще, если они есть в тексте. Однако очень часто трудно оценить влияние котировок. При большом риске появляются и лучшие возможности получения прибыли. ATRAP продемонстрировала свои возможности и становилась одним из первых покупателей в мире, когда происходило значимое событие.