Вопрос/ответ EN
Вопрос/ответВопрос-ответ Вопрос/ответЧасто задаваемые вопросы Обращения граждан Телефонный справочник
+7 (800) 550-41-72 Телефон горячей линии
+7 (812) 326-31-63 Многоканальный телефон
Россия, 193232, Санкт-Петербург,
пр. Большевиков д.22, к.1
rector@sut.ru
НаукаРезультаты научно-технической деятельностиУчастие в федеральных целевых программах«Разработка архитектуры, методов и моделей построения сервера классификации больших слабоструктурированных данных на основе гибридизации семантико-онтологического анализа и машинного обучения»

«Разработка архитектуры, методов и моделей построения сервера классификации больших слабоструктурированных данных на основе гибридизации семантико-онтологического анализа и машинного обучения»

Выполнение проекта по Соглашению о предоставлении субсидии от 02.12.2019 г. № 075-15-2019-1852 (внутренний номер № 05.604.21.0252) с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы»p>

На этапе № 1 в период с 02.12.2019 по 31.12.2019 выполнялись следующие работы:

1.1. Аналитический обзор современной научно-технической, нормативной, методической литературы, затрагивающей научно-техническую проблему, исследуемую в рамках ПНИ.

1.2. Выбор и обоснование направления исследований.

1.3. Разработка вариантов возможных решений поставленных задач, проведение их сравнительной оценки, обоснование выбора оптимального варианта их решения.

1.4. Разработка модели представления знаний в виде нечеткой онтологии в рамках программного сервера классификации.

1.5. Разработка модели слабоструктурированного информационного ресурса в виде фрагмента нечеткой онтологии.

1.6. Разработка методов извлечения семантико-синтагматических структур из текстов на естественном языке с целью выделения их семантической (когнитивной) составляющей с использованием методов лингвистического и статистического анализа на основе методов машинного обучения.

1.7. Разработка подхода к выделению терминологии в процессе формирования описания проблемной области в виде нечеткой онтологии на основе гибридизации лингвистических и статистических методов анализа текстов на естественном языке.

1.8. Проведение патентных исследований.

В ходе выполнения первого этапа проекта получены следующие основные результаты:

  • проведен аналитический обзор современной научно-технической, нормативной, методической литературы, затрагивающей научно-техническую проблему, исследуемую в рамках ПНИ;
  • разработаны варианты возможных решений поставленных задач, проведена их сравнительной оценка, а также проведено обоснование выбора наиболее оптимальных вариантов решения задач;
  • разработана модель представления знаний в виде нечеткой онтологии в рамках программного сервера классификации;
  • разработана модель слабоструктурированного информационного ресурса в виде фрагмента нечеткой онтологии;
  • разработаны методы извлечения семантико-синтагматических структур из текстов на естественном языке с целью выделения их семантической (когнитивной) составляющей с использованием методов лингвистического и статистического анализа на основе методов машинного обучения;
  • разработан подход к выделению терминологии в процессе формирования описания проблемной области в виде нечеткой онтологии на основе гибридизации лингвистических и статистических методов анализа текстов на естественном языке;
  • выполнены патентные исследования.

На этапе № 2 в период с 01.01.2020 по 20.09.2020 выполнялись следующие работы:

1.1. Разработка алгоритма графематического анализа и предобработки текстовых ресурсов.

1.2. Разработка метода классификации семантико-синтагматических структур.

1.3. Разработка архитектурной схемы и алгоритмических моделей программного сервера классификации.

1.4. Разработка программной и эксплуатационной документации на ЭО СК.

1.5. Разработка ЭО СК.

1.6. Проведение дополнительных патентных исследований.

1.7. Разработка рекомендаций по возможности использования результатов проведенных ПНИ в реальном секторе экономики.

1.8. Разработка технико-экономического обоснования разработки продукции с учетом технологических возможностей и особенностей индустриального партнера — организации реального сектора экономики.

1.9. Разработка программы и методики исследовательских испытаний ЭО СК.

1.10. Проведение исследовательских испытаний ЭО СК.

1.11. Разработка ТЗ на проведение «ОКР по теме: «Разработка архитектуры, методов и моделей построения сервера классификации больших слабоструктурированных данных на основе гибридизации семантико-онтологического анализа и машинного обучения».

В ходе выполнения работ по проекту за 2 этап получены следующие результаты:

  • разработан алгоритм графематического анализа и предобработки текстовых ресурсов хранилища данных сервера классификации.
  • разработан метод классификации семантико- синтагматических структур текстовых ресурсов электронного хранилища сервера классификации.
  • разработана архитектурная схема и алгоритмические модели программного сервера классификации.
  • разработана программная и эксплуатационная документация на ЭО СК.
  • разработан ЭО СК.
  • проведены дополнительные патентные исследования.
  • разработаны рекомендации по возможности использования результатов проведенных ПНИ в реальном секторе экономики.
  • разработано технико-экономического обоснование разработки продукции с учетом технологических возможностей и особенностей индустриального партнера — организации реального сектора экономики.
  • разработаны программы и методики исследовательских испытаний ЭО СК.
  • проведены исследовательские испытания ЭО СК.
  • разработано ТЗ на проведение «ОКР по теме: «Разработка архитектуры, методов и моделей построения сервера классификации больших слабоструктурированных данных на основе гибридизации семантико-онтологического анализа и машинного обучения».