Российская компания Cognitive Technologies (компания, создатель ряда программных продуктов в области оптического распознавания текстов и форм, потокового ввода документов и документооборота, создатель системы оптического распознавания текстов CuneiForm) объявила о том, что Яндекс в феврале текущего года приобрел у нее программный комплекс, включающий возможности синтаксического анализа текста.
В пресс-релизе Cognitive Technologies сообщается:
"Анализатор позволяет определить, какими синтаксическими отношениями связаны слова предложения. Это может звучать неожиданно, но для понимания текста эта информация гораздо важнее, чем значение отдельных слов".
Использование синтаксического анализатора для больших объемов текста позволяет определять и изучать статистические закономерности языка (встречаемость слов и конструкций). Такого рода закономерности могут быть использованы, в частности, при разрешении неоднозначностей (например 'ключ упал на пол' и 'в камнях забил ключ'), возникающих во время синтаксического разбора, а также при построении статистических моделей языка для распознавания слитной речи.
Среди продуктов Cognitive Technologies есть система определения авторства документа, работающая на основе этого программного комплекса. Можно предположить, что его приобретение поможет Яндексу приблизиться к решению ряда проблем качества поиска.
по материалам: http://www.optimization.ru
Последние комментарии