Орфо® и Контекст® -  Лингвистические программы
495  269-06-30
  • English
  • Русский

Поиск смысловых ошибок в ОРФО

Компания «Информатик» анонсирует первую версию технологии по поиску смысловых ошибок в текстах на русском языке!

Очень часто, даже у самых грамотных пользователей, при наборе текстов возникают опечатки разного сорта: пропущенная буква, лишняя буква, перепутанные буквы, вместо нужной, введена буква, которая рядом на клавиатуре и т.д. 

Причины тому могут быть самые разные: моторная афазия, спешка, необходимость делать несколько дел одновременно, смена клавиатуры или сенсорная клавиатура, на которой печать уже не так удобна. Также иностранцы, пытающиеся изучить русский язык, часто как слышат, так и пишут.

Хорошо, когда опечатка ведет к орфографической ошибке. Сейчас даже браузеры неплохо справляются, по крайней мере, с самыми типичными из них. Неплохо, когда образовавшееся в результате опечатки слово меняет свою часть речи, падеж или склонение, в этом случае алгоритмы грамматической и стилистической проверки ОРФО помогали распознать проблему.

Но до сегодняшнего дня ни в одном текстовом процессоре не существовало даже намёка на алгоритм выявления ситуаций, когда опечатка не приводит ни к грамматической, ни к стилистической ошибке. Самый распространённый на сегодняшний день пример: "медведь собирает грибы в лису". Как видите, здесь нет ошибки, т.к. предложение полностью аналогично "медведь собирает грибы в корзину", но имеет место быть ошибка смысловая. И мы делаем первый шаг на пути к искоренению таких ошибок.

На протяжении нескольких последних месяцев мы анализировали тексты русскоязычных пользователей в известных социальных сетях. Мы переработали 80 гигабайт реальной текстовой информации, генерируемой пользователями Рунета и выявили несколько сотен тысяч типичных искажений, не приводящих к потере синтаксической целостности предложения, но искажающих смысл. После длительной ручной обработки мы превратили эти находки в шаблоны грамматической проверки.

 

Технология уже доступна в ОРФО-2014 для Windows и OS X! А также в нашем онлайн сервисе и бесплатном приложении для MS Office 365.

 

По нашим оценкам применение новых шаблонов позволит выловить порядка 30% типичных смысловых ошибок. Это может показаться небольшим числом, однако, стоит помнить, что подобная работа всегда требует ручной доводки, трудозатраты на которую растут по экспоненте. И при приближении к 100%, количество лингвистических человеко-часов будет равно бесконечности.

 

Несколько ярких примеров (как из обычных текстов, так и даже с официальных сайтов некоторых компаний):

Медведь собирает грибы в лису.
Судья будит судить.
Скучать торрент.
Стразовая компания.
Компенсация орального вреда.
Все подобности по телефону.

В штатом режиме.
Литья салата.
Будишь слушаться.
Гражданкой войны.
Заседание верхового суда.
В судебном прядке.

Авторизация/Регистрация

Электронная почта

support@informatic.ru
Пожелания по работе магазина

sales@informatic.ru
Вопросы оплаты и получения программного обеспечения

Ваши пожелания по работе магазина

© OOO "Информатик", 1989-2016