«Молодой учёный»
. № 52 (342)
. Декабрь 2020 г.
40
Информационные технологии
Prediction of university rating using the r language
E. S. Rayushkin, V. O. Kolesnikova, S. A. Kulikov, N. N. Kanubrikov
Volgograd State Technical University
The use of the R language for data analysis when analyzing data from the world ranking of universities, is considered. A model for predicting
a place in the ranking of universities has been developed and tested.
Key words: R language, regression analysis, world university ranking.
Н
а сегодняшний день существует множество междуна-
родных рейтингов университетов. Списки рейтингов уни-
верситетов полезны тем, кто выбирает, в какой стране учиться
или планирует получить работу за рубежом (особенно в
области
исследований, преподавания, бизнеса). Одним из них является
рейтинг Times Higher Education (THE), который предоставляет
достоверные данные об университетах для студентов, препо-
давателей, руководителей университетов, правительств и про-
мышленности с 2004 г. [1]. Составители
рейтинга Times Higher
Education исследовали вузы из 79 стран и выбрали лучшие уни-
верситеты мира по качеству преподавания и исследовательской
деятельности, уровню распространения знаний и инноваций.
Также эффективность вузов и качество их материальной базы
оценивается THE на основе финансовых показателей.
Для анализа факторов, на которые необходимо обратить
внимание руководству университета, была создана модель на
языке R, с возможностью
прогноза рейтинга университета, на
основе имеющихся факторов. Данная модель позволяет пред-
сказать возможность попадания университета в рейтинг или
возможность увеличения своей позиции в рейтинге.
Язык R — язык программирования для статистической об-
работки данных и работы с графикой, а также свободная про-
граммная среда вычислений
с открытым исходным кодом
в рамках проекта GNU. R широко используется как статисти-
ческое программное обеспечение для анализа данных и факти-
чески стал стандартом для статистических программ [2].
Входные данные для анализа формируются в виде файла
формата csv, содержащего набор показателей для каждого уни-
верситета, представленного в рейтинге. Данные для анализа
взяты с сайта kaggle.com [3].
Файл с входными данными со-
держит 1603 строки и 10 показателей (рис. 1).
Входными переменными csv файла, содержащего рейтинг
университетов по версии THE, являются:
1 — World_rank (Ранг университета в мире, текст)
2 — University_Name (Название университета, текст)
3 — Country (Страна, в которой находится университет,
текст)
4 — Teaching (Рейтинг преподавания в университете, число)
5 — International (Рейтинг иностранных студентов, число)
6 — Research (Рейтинг исследований университета, число)
7 — Сitations (Рейтинг цитируемости
работ университета,
число)
8 — Income (Рейтинг знаний выпускников, число)
9 — Total_score (Общий балл, используемый для состав-
ления рейтинга, число)
10 — Year (Год анализа рейтинга, число)
Рис.
Достарыңызбен бөлісу: