Ч а с т ь I главный редактор


Прогнозирование рейтинга университетов с помощью языка R



Pdf көрінісі
бет49/90
Дата20.02.2023
өлшемі7.68 Mb.
#469824
1   ...   45   46   47   48   49   50   51   52   ...   90
moluch 342 ch1 9e2Iv3V (1)

Прогнозирование рейтинга университетов с помощью языка R
Раюшкин Эдуард Сергеевич, студент;
Колесникова Вероника Олеговна, студент;
Куликов Станислав Андреевич, аспирант;
Канубриков Николай Николаевич, аспирант
Волгоградский государственный технический университет
Рассмотрено использование языка R для анализа данных, в частности, при анализе данных всемирного рейтинга универси-
тетов. Разработана и протестирована модель прогнозирования места университета в рассматриваемом рейтинге.
Ключевые слова: язык R, регрессионный анализ, всемирный рейтинг университетов.


«Молодой учёный» . № 52 (342)  . Декабрь 2020 г.
40
Информационные технологии
Prediction of university rating using the r language
E. S. Rayushkin, V. O. Kolesnikova, S. A. Kulikov, N. N. Kanubrikov
Volgograd State Technical University
The use of the R language for data analysis when analyzing data from the world ranking of universities, is considered. A model for predicting 
a place in the ranking of universities has been developed and tested.
Key words: R language, regression analysis, world university ranking.
Н
а сегодняшний день существует множество междуна-
родных рейтингов университетов. Списки рейтингов уни-
верситетов полезны тем, кто выбирает, в какой стране учиться 
или планирует получить работу за рубежом (особенно в области 
исследований, преподавания, бизнеса). Одним из них является 
рейтинг Times Higher Education (THE), который предоставляет 
достоверные данные об университетах для студентов, препо-
давателей, руководителей университетов, правительств и про-
мышленности с 2004 г. [1]. Составители рейтинга Times Higher 
Education исследовали вузы из 79 стран и выбрали лучшие уни-
верситеты мира по качеству преподавания и исследовательской 
деятельности, уровню распространения знаний и инноваций. 
Также эффективность вузов и качество их материальной базы 
оценивается THE на основе финансовых показателей.
Для анализа факторов, на которые необходимо обратить 
внимание руководству университета, была создана модель на 
языке R, с возможностью прогноза рейтинга университета, на 
основе имеющихся факторов. Данная модель позволяет пред-
сказать возможность попадания университета в рейтинг или 
возможность увеличения своей позиции в рейтинге.
Язык R — язык программирования для статистической об-
работки данных и работы с графикой, а также свободная про-
граммная среда вычислений с открытым исходным кодом 
в рамках проекта GNU. R широко используется как статисти-
ческое программное обеспечение для анализа данных и факти-
чески стал стандартом для статистических программ [2].
Входные данные для анализа формируются в виде файла 
формата csv, содержащего набор показателей для каждого уни-
верситета, представленного в рейтинге. Данные для анализа 
взяты с сайта kaggle.com [3]. Файл с входными данными со-
держит 1603 строки и 10 показателей (рис. 1).
Входными переменными csv файла, содержащего рейтинг 
университетов по версии THE, являются:
1 — World_rank (Ранг университета в мире, текст)
2 — University_Name (Название университета, текст)
3 — Country (Страна, в которой находится университет, 
текст)
4 — Teaching (Рейтинг преподавания в университете, число)
5 — International (Рейтинг иностранных студентов, число)
6 — Research (Рейтинг исследований университета, число)
7 — Сitations (Рейтинг цитируемости работ университета
число)
8 — Income (Рейтинг знаний выпускников, число)
9 — Total_score (Общий балл, используемый для состав-
ления рейтинга, число)
10 — Year (Год анализа рейтинга, число)
Рис.


Достарыңызбен бөлісу:
1   ...   45   46   47   48   49   50   51   52   ...   90




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет