До чего дошел прогресс! Компьютер отличает вымысел от фактов
23.07.2010 10:47

До чего дошел прогресс! Компьютер отличает вымысел от фактов

MIGnews.com.ua

Современные компьютеры умеют отличать новостные сообщения от художественных текстов, а именно рассказов. Все это благодаря алгоритму, разработанному учеными. Статья исследователей пока не принята к публикации в рецензируемый научный журнал, но ее препринт доступен на сайте arXiv.org.

Алгоритм, придуманный авторами этой научной работы, анализирует, сколько раз любое слово из текста встречается вместе с другими словами в рассказах и новостных сообщениях. Полученные данные впоследствии сравнивали.

Оказалось, что для двух данных типов текстов этот показатель заметно отличается. Исследователи проверили созданную ими методику при помощи 400 новостных заметок, случайным образом выбранных с новостного сайта National Public Radio, и 400 случайных рассказов из базы электронной библиотеки проекта "Гутенберг". Чтобы исключить влияние исторических особенностей языка, авторы выбирали для анализа произведения писателей XX века.

Для новостных заметок точность угадывания составила 69,1 процента с погрешностью 1,22 процента, а для рассказов - 73,8 процента с погрешностью 5,15 процента, пишет Лента.ru.

Недавно другой коллектив ученых представил еще одну работу, в которой были продемонстрированы возможности использования компьютера для анализа текстов. Исследователи разработали алгоритм, при помощи которого компьютер смог расшифровать один из мертвых языков семитской группы за несколько часов.

 

Теги материала: наука, компьютер, программа
загрузка...

Оцените материал: 1 2 3 4 5 6 7 8 9 10 [0] всего оценили 0

Статьи по теме

Новости партнеров
Другие новости

Спецтемы

Вопрос дня

Что должно быть приоритетом в бюджете-2020?
  Покупка Продажа
USD 25.9000 26.2500
EUR 29.1000 29.8500
RUR 0.3780 0.4180
BTC 10,426.1729 11,523.6641
Яндекс.Метрика