Ученые работают над оптимизацией интернет-поиска на казахском языке 25.06.2012 16:34
Ученые работают над оптимизацией интернет-поиска на казахском языке

Центр энергетических исследований в «Назарбаев университете» ведет активную работу сразу по нескольким инновационным проектам.
Центр работает над созданием алгоритмов, способных обрабатывать большие объемы данных, и особого модуля, который сможет осуществлять интернет-поиск с учетом специфики казахского языка.
Разработчик проекта Олжас Махамбетов рассказал, что перед проектом «Проектирование комплекса сбора и обработки интернет-данных» ставится цель разработать новые алгоритмы и методы обработки «больших» данных, таких, например, как документы и тексты в Интернете, архивы видеозаписей и изображений.
Проект уникален тем, что в его рамках не только разрабатываются методы обработки и анализа «объемных» интернет-данных, но и ведется работа по созданию модуля, учитывающего в процессе поиска особенности казахского языка, находя релевантные результаты и значения. При «Назарбаев Университете» появится даже специальная лаборатория, задачей которой будет проведение углубленных исследований.
Научный сотрудник университета отмечает: «В Казахстане работа по созданию алгоритмов обработки больших данных практически не ведется. С бурным ростом интернета, в том числе его казахстанского сегмента, следует уделить внимание этому направлению». Также разработчики уточняют, что изучаемая ими область тесно связана с другими научными направлениями, среди которых машинное обучение, лингвистика, информационный поиск и др.
Проект разделен на 2 фронта: решение инженерных проблем и проведение научных исследований.
Инженерная работа предполагает создание модуля для поисковой системы, оптимизирующего результаты поиска для казахского языка, учитывая, в частности, его специфику: семантическое, синтаксическое и морфологическое значения текста, введенного в поисковую систему.
Научная часть проекта включает разработку новых алгоритмов и методов машинного обучения для обработки и анализа массивных данных. Эти методы должны быть продуктивными и эффективными, и, возможно, они смогут оказать поддержку обучению в режиме реального времени. Отметим, что в рамках проекта ученые уже создали 2 алгоритма, которые были успешно апробированы на экспериментальных данных.
По мнению Олжаса Махамбетова, новый проект станет дополнительным импульсом не только для развития отечественных IT-технологий, но и для популяризации казахстанского интернет-сегмента. «В целом думаю, что проект внесет вклад в развитие в казахстанского сегмента интернета», - заключил ученый.
По материалам pm.kz
Источник: www.iport.kz