Информационный портал nnIT

Оригинал документа: http://www.nnit.ru/news/n192696/


     
 

«ЦРТ-инновации» представила новый метод анализа больших данных

28.04.2016 16:13
Компания «ЦРТ-инновации» (группа компаний ЦРТ) при поддержке Министерства образования и науки РФ разработала уникальный метод выделения связных контекстов словоупотребления, ориентированный на работу с живой неподготовленной (спонтанной) речью. Использоваться новый метод будет в таких инструментах речевой аналитики ЦРТ, как «модуль кластеризации» и «модуль автоматического аннотирования».

Метод основан на технологиях работы с большими данными (big data) и современных методах машинного обучения (machine learning)  в сочетании с глубоким лингвистическим и семантическим анализом речи.

Особенно остро проблема «понимания» речи (речевого сообщения и/или большого объема речевых данных) стоит в крупных контакт-центрах, обрабатывающих информацию в постоянном режиме и больших объемах. Именно поэтому основными потенциальными потребителями систем, автоматически выделяющих связные контексты (логические структуры, «ситуации») тех или иных значимых для анализа слов, являются аналитические службы КЦ и служб технической поддержки государственных и коммерческих структур.

Цель выделения контекстов в больших массивах данных - учитывать информацию, непосредственно связанную с целевым словом, и не включать в контекст нерелевантную информацию. Выделение связных контекстов слов в разы упрощает работу аналитиков, позволяя им в автоматическом режиме решать такие задачи, как:

  • анализ употребления ключевых слов (людей, организаций, географических объектов) в тексте и/или речи;
  • выявление контекстов употребления ключевых (значимых) слов в диалогах;
  • составление текстовой аннотации (информативной выжимки) текста и/или речи;
  • автоматическое формирование заголовков тематических кластеров и т.п.

Редактор раздела: Тимофей Белосельцев (info@mskit.ru)

Рубрики: Интеграция, ПО

наверх
 
 
     

А знаете ли Вы что?

     
   
     


Copyright 2004 nnIT. Все права защищены
Перепечатка материалов приветствуется при ссылке на www.nnIT.nnit.ru
Ресурс разработан и поддерживается компанией Peterlink Web