Створення регресійної моделі на основі апроксимаційного та дисперсійного аналізу статистичних даних

dc.contributor.author Єршова, Ніна Михайлівна
dc.contributor.author Ershova, Nina
dc.date.accessioned 2023-12-27T09:31:31Z
dc.date.available 2023-12-27T09:31:31Z
dc.date.issued 2023-10
dc.identifier http://uajcea.pgasa.dp.ua/article/view/294688
dc.identifier DOI: 10.30838/J.BPSACEA.2312.241023.85.996
dc.identifier.citation Єршова Н. М. Створення регресійної моделі на основі апроксимаційного та дисперсійного аналізу статистичних даних / Н. М. Єршова // Український журнал будівництва та архітектури. – 2023. – № 5. – С. 85-95 uk_UA
dc.identifier.uri http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/11639
dc.description.abstract EN: Постановка проблеми. Надскладним питанням при створенні статистичних моделей є вибір математичної форми зв'язку, тобто аналітичної функції, що зв'язує елементи досліджуваної системи. Форма рівняння зв'язку встановлюється на основі теоретичних, технологічних міркувань або інтуїції. Коли заздалегідь складно уявити залежність, тоді за двома ознаками будують кореляційне поле точок, розташування яких на площині визначає напрямок дії та форму зв'язку. Для глибокого і всебічного вивчення статистичних зв'язків використовуються поняття кореляції і регресії. Завдання кореляційного аналізу полягає у встановленні спрямованості дії та форми типу спілкування. Завданням регресійного аналізу є побудова математичної моделі регресії у вигляді результуючої залежності середнього значення характеристики від факторної характеристики. Параметри регресійної моделі слід підбирати таким чином, щоб лінія, побудована моделлю, проходила між точками і розташовувалася максимально близько до всіх точок кореляційного поля, тобто проходила майже через його центр. Метою статті є створення регресійної моделі на основі апроксимаційного, кореляційного та дисперсійного аналізу даних спостережень. Результати. Проведено апроксимацію даних для багатовимірних вибірок активного та пасивного експериментів, на їх основі отримано апроксимуючі функції та регресійні моделі в цілому. На конкретних прикладах встановлено взаємозв'язок факторних ознак, виділено факторну ознаку. Отримано найбільш значущу за тісністю зв'язку з результуючою ознакою та придатну для прогнозування багатовимірну регресійну модель. Проведено багатофакторний дисперсійний аналіз даних активного експерименту на прикладі дослідження впливу на коефіцієнт однорідності бетону марки цементу, типу заповнювача, періоду випробувань та «періоду виробництва: бетону. Аналіз дисперсії показує, що найбільш значущими факторами є марка цементу, період випробування, «період виготовлення» бетону та їх незначна взаємодія та тип заповнювача. Запропонована методика істотно спрощує процес створення регресійної моделі. Висновки.Проведені розрахунки доводять, що: на основі апроксимації та кореляції спостережень пасивного експерименту можна встановити зв’язок між факторними характеристиками, вибрати факторну характеристику, яка є найбільш суттєвою за тіснотою зв’язку з результуючу характеристику, отримати придатну для прогнозування багатовимірну регресійну модель, що дозволяє спростити процедуру створення регресійної моделі шляхом послідовного переходу від простої моделі до складної; дисперсійний аналіз даних активного експерименту дає можливість оцінити вплив окремих факторів і вплив взаємодії між ними. Апроксимація доводить, що регресійні моделі даних активного експерименту є лінійними. Це також підтверджує дисперсійний аналіз, оскільки взаємодія факторів незначна. uk_UA
dc.description.abstract EN: Problem statement. The most difficult issue when creating statistical models is the choice of a mathematical form of connection, that is, an analytical function that connects the elements of the system being studied. The form of the connection equation is established on the basis of theoretical, technological considerations or intuition. When it is difficult to imagine the dependence in advance, then a correlation field of points is built for two signs, the location of which on the plane determines the direction of action and the form of communication. For a deep and comprehensive study of statistical relationships, the concepts of correlation and regression are used. The task of correlation analysis is to establish the direction of action and the form of communication type. The task of regression analysis is to build a mathematical model of regression in the form of the resulting characteristic average value dependence on factor characteristics. The parameters of the regression model should be selected in such a way that the line constructed by the model passes between the points and is located as close as possible to all points of the correlation field, that is, it passes almost through its center. The purpose of the article is to create a regression model based on approximation, correlation and dispersion analysis of observational data. Results. Data approximation for multidimensional samples of active and passive experiments was performed, approximating functions and regression models in general were obtained based on them. On specific examples, the relationship between the factor features was established, the factor feature was selected. The most significant in terms of the connection closeness with the resulting feature, and a multivariate regression model suitable for forecasting was obtained. A multivariate dispersion analysis of the active experiment data was carried out on the research example of the influence on the homogeneity coefficient of concrete cement brand, type of aggregate, test period and “production period: of concrete. Analysis of dispersion shows that the most significant factors are the cement grade, the test period, the “making period” of the concrete and their minor interaction and the type of aggregate. The proposed technique significantly simplifies the process of creating a regression model. Conclusions. The performed calculations prove that: on the basis of the approximation and correlation of the passive experiment observations, it is possible to establish a relationship between the factor characteristics, to choose the factor characteristic that is the most significant in terms of the connection closeness with the resulting characteristic, to obtain a multivariate regression model suitable for forecasting, and this allows simplify the procedure for creating a regression model by successively moving from a simple model to a complex one; dispersion analysis of active experiment data makes it possible to assess the impact of individual factors and the impact of interaction between them. The approximation proves that the regression models of the active experiment data are linear. This is also confirmed by dispersion analysis, because the interaction of factors is insignificant.
dc.language.iso uk uk_UA
dc.publisher Придніпровська державна академія будівництва та архітектури uk_UA
dc.subject активний та пасивний експеримент uk_UA
dc.subject ефективні та факторні характеристики uk_UA
dc.subject кореляція uk_UA
dc.subject дисперсійний аналіз uk_UA
dc.subject апроксимація uk_UA
dc.subject регресійна модель uk_UA
dc.subject dispersion analysis uk_UA
dc.subject effective and factor characteristics uk_UA
dc.subject active and passive experiment uk_UA
dc.subject approximation uk_UA
dc.subject regression model uk_UA
dc.subject correlation uk_UA
dc.title Створення регресійної моделі на основі апроксимаційного та дисперсійного аналізу статистичних даних uk_UA
dc.title.alternative The creation of a regression model based on approximation and dispersion analysis of statistical data uk_UA
dc.type Article uk_UA

