ВЕБ – БЕТТЕР ҚҦРЫЛЫМЫН ТАЛДАУ НЕГІЗІНДЕ
HTTP – ТРАФИГІН ФИЛЬТРЛЕУ
Боранбаева Г.М.
Оқытушы, магистр, информатика кафедрасы
М.Ӛтемісов атындағы Батыс Қазақстан мемлекеттік университеті
Аннотация. Ақпарат пен ойын-сауық кӛзі ретінде Интернетті кеңінен қолдану, сенімді
фильтрлеу механизмін қажет етеді. Веб-беттердің жіктелуі фильтрлеудің ең кҥрделі
сатыларының бірі болып табылады. Сіз html-қҧрылымын, мазмҧнды және басқа ресурстармен
гиперсілтемелер арқылы байланыс жасауды естен шығармағаныңыз жӛн. Метаақпаратқа
ерекше назар аудару керек, ол негізгі тҥйінді сӛздерді және веб-беттердің қысқаша мазмҧнын
кӛрсетуге тиіс. Метаақпаратқа негізделген веб-беттердің классификациясы веб-қҧжаттардың
қауымдастықтарының арасындағы анық шекаралардың жоқтығынан қиын болып есептеледі.
Бҧл жағдайда нейрондық желілер классификаторларын пайдалану қажет.
The widespread use of the Internet as a source of information and pastime requires a
reliable mechanism for filtering. Classification of Web pages is one of the most difficult stages
of filtering. It should be borne in mind: html-structure, content and communication with other
resources through hyperlinks. Particular attention should be paid to metainformation, that
should reflect the basic keywords and a brief summary of Web pages. Classification of Web
pages based on the metainformation is considered to be difficult because of the absence of
clear boundaries between the communities of web documents. In this situation, it is necessary to use
neural network classifiers.
Широкое использование Интернета в качестве источника информации и
времяпрепровождения требует надежного механизма фильтрации. Классификация веб-
страниц является одним из самых сложных этапов фильтрации. Следует иметь в виду: html-
структуру, контент и общение с другими ресурсами посредством гиперссылок. Особое
внимание следует уделить метаинформации, которая должна отражать основные ключевые
слова и краткое резюме веб-страниц. Классификация веб-страниц на основе метаинформации
считается сложной из-за отсутствия четких границ между сообществами веб-документов.
В этой ситуации необходимо использовать классификаторы нейронных сетей.
Достарыңызбен бөлісу: |