РЕАЛИЗАЦИЯ ОБУЧАЮЩЕЙ КОМПЬЮТЕРНОЙ ПРОГРАММЫ НА ОСНОВЕ ЛИНГВИСТИЧЕСКОЙ БАЗЫ ДАННЫХ АВТОМАТИЧЕСКОЙ СИСТЕМЫ ОБРАБОТКИ ТЕКСТА
Аннотация
Вследствие постоянного увеличения объема электронной текстовой информации современное общество испытывает острую потребность в автоматизированной обработке естественного языка (ЕЯ). Главное предназначение систем автоматической обработки ЕЯ – анализировать и синтезировать тексты, то есть преобразовывать тексты из их исходного вида в некоторое абстрактное представление, приближенное к представлению смысла, и обратно. Целью предлагаемой работы является разработка лингвистического и информационного обеспечения автоматической системы для обработки англоязычных публицистических текстов и ее последующая реализация в виде обучающей компьютерной программы. В статье рассматриваются примеры различных подходов к технологии создания лингвистической базы данных для систем обработки текста естественного языка. Автор дает подробное описание основных структурных блоков принципиально нового лингвистического процессора: лексико-семантического, синтаксического и семантико-синтаксического. Основным преимуществом данного процессора является использование в алфавитном словаре специальных семантических кодов в соответствии с разработанной лексико-семантической классификацией. Это позволяет автоматической системе точно определять семантические функции ключевых слов, входящих в выделенные в процессе синтаксического анализа группы. Что, в свою очередь, помогает избежать ошибок, характерных для такого рода систем.
Об авторе
М. В. МакаричБеларусь
Макарич Марина Васильевна - доцент кафедры английского языка № 2 БНТУ, кандидат филологических наук
Список литературы
1. Пиотровский, Р. Г. Методы автоматического анализа и синтеза текста / Р. Г. Пиотровский [и др.]. – Минск: Вышэйшая школа, 1985.– 222 с.
2. Воронцов, А. В. Промышленная реализация системы лексико-грамматического анализа текстовых документов / А. В. Воронцов // Вестн. МГЛУ. Сер. 1, Филология. – 2007. – № 1(26). – С. 189–203.
3. Jurafsky, D. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition / D. Jarafsky, J. Martin. – New Jersey: Prentice Hall, 2000. – 934 p.
4. Todhunter, J. Semantic processor for recognition of whole-part relations in natural language documents: US Patent Appl. 20070156393 / J. Todhunter, I. Sovpel, D. Pastanohau and others; Intention Machine Corp. – Serial no. 686660; Series code 11; Filed 15.03.2007. – 2007.
5. Леонтьева, Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы: учеб. Пособие для студентов лингвистических факультетов вузов / Н. Н. Леонтьева. – Москва: Академия, 2006–304 с.
6. Совпель, И. В. Автоматическое распознавание основных типов знаний в текстовых документах / И. В. Совпель // Искусственный интеллект ISSN1561–5359 – НАН Украины «Наука и просвещение» – 2007. – № 3 – С. 328–332.
7. Зубов, А. В. Семантико-синтаксический язык для записи текстов в памяти ЭВМ / А. В. Зубов // Функционирование и развитие языковых систем. Сборник научных трудов.– Минск: Вышэйшая школа, 1990. – С. 110–117.
8. Макарич, М. В. Автоматическая система для создания табличного реферата группы текстов / М. В. Макарич. – Germany: LAP LAMBERT Academic Publishing, 2012.–145с.
Рецензия
Для цитирования:
Макарич М.В. РЕАЛИЗАЦИЯ ОБУЧАЮЩЕЙ КОМПЬЮТЕРНОЙ ПРОГРАММЫ НА ОСНОВЕ ЛИНГВИСТИЧЕСКОЙ БАЗЫ ДАННЫХ АВТОМАТИЧЕСКОЙ СИСТЕМЫ ОБРАБОТКИ ТЕКСТА. Системный анализ и прикладная информатика. 2016;(1):78-83.
For citation:
Makarych M.A. REALIZATION OF TRAINING PROGRAMME ON THE BASIS OF LINGUISTIC DATABASE FOR AUTOMATIC TEXTS PROCESSING SYSTEM. «System analysis and applied information science». 2016;(1):78-83. (In Russ.)