Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/11639
Назва: Створення регресійної моделі на основі апроксимаційного та дисперсійного аналізу статистичних даних
Інші назви: The creation of a regression model based on approximation and dispersion analysis of statistical data
Автори: Єршова, Ніна Михайлівна
Ershova, Nina
Ключові слова: активний та пасивний експеримент
ефективні та факторні характеристики
кореляція
дисперсійний аналіз
апроксимація
регресійна модель
dispersion analysis
effective and factor characteristics
active and passive experiment
approximation
regression model
correlation
Дата публікації: жов-2023
Видавництво: Придніпровська державна академія будівництва та архітектури
Бібліографічний опис: Єршова Н. М. Створення регресійної моделі на основі апроксимаційного та дисперсійного аналізу статистичних даних / Н. М. Єршова // Український журнал будівництва та архітектури. – 2023. – № 5. – С. 85-95
Короткий огляд (реферат): EN: Постановка проблеми. Надскладним питанням при створенні статистичних моделей є вибір математичної форми зв'язку, тобто аналітичної функції, що зв'язує елементи досліджуваної системи. Форма рівняння зв'язку встановлюється на основі теоретичних, технологічних міркувань або інтуїції. Коли заздалегідь складно уявити залежність, тоді за двома ознаками будують кореляційне поле точок, розташування яких на площині визначає напрямок дії та форму зв'язку. Для глибокого і всебічного вивчення статистичних зв'язків використовуються поняття кореляції і регресії. Завдання кореляційного аналізу полягає у встановленні спрямованості дії та форми типу спілкування. Завданням регресійного аналізу є побудова математичної моделі регресії у вигляді результуючої залежності середнього значення характеристики від факторної характеристики. Параметри регресійної моделі слід підбирати таким чином, щоб лінія, побудована моделлю, проходила між точками і розташовувалася максимально близько до всіх точок кореляційного поля, тобто проходила майже через його центр. Метою статті є створення регресійної моделі на основі апроксимаційного, кореляційного та дисперсійного аналізу даних спостережень. Результати. Проведено апроксимацію даних для багатовимірних вибірок активного та пасивного експериментів, на їх основі отримано апроксимуючі функції та регресійні моделі в цілому. На конкретних прикладах встановлено взаємозв'язок факторних ознак, виділено факторну ознаку. Отримано найбільш значущу за тісністю зв'язку з результуючою ознакою та придатну для прогнозування багатовимірну регресійну модель. Проведено багатофакторний дисперсійний аналіз даних активного експерименту на прикладі дослідження впливу на коефіцієнт однорідності бетону марки цементу, типу заповнювача, періоду випробувань та «періоду виробництва: бетону. Аналіз дисперсії показує, що найбільш значущими факторами є марка цементу, період випробування, «період виготовлення» бетону та їх незначна взаємодія та тип заповнювача. Запропонована методика істотно спрощує процес створення регресійної моделі. Висновки.Проведені розрахунки доводять, що: на основі апроксимації та кореляції спостережень пасивного експерименту можна встановити зв’язок між факторними характеристиками, вибрати факторну характеристику, яка є найбільш суттєвою за тіснотою зв’язку з результуючу характеристику, отримати придатну для прогнозування багатовимірну регресійну модель, що дозволяє спростити процедуру створення регресійної моделі шляхом послідовного переходу від простої моделі до складної; дисперсійний аналіз даних активного експерименту дає можливість оцінити вплив окремих факторів і вплив взаємодії між ними. Апроксимація доводить, що регресійні моделі даних активного експерименту є лінійними. Це також підтверджує дисперсійний аналіз, оскільки взаємодія факторів незначна.
EN: Problem statement. The most difficult issue when creating statistical models is the choice of a mathematical form of connection, that is, an analytical function that connects the elements of the system being studied. The form of the connection equation is established on the basis of theoretical, technological considerations or intuition. When it is difficult to imagine the dependence in advance, then a correlation field of points is built for two signs, the location of which on the plane determines the direction of action and the form of communication. For a deep and comprehensive study of statistical relationships, the concepts of correlation and regression are used. The task of correlation analysis is to establish the direction of action and the form of communication type. The task of regression analysis is to build a mathematical model of regression in the form of the resulting characteristic average value dependence on factor characteristics. The parameters of the regression model should be selected in such a way that the line constructed by the model passes between the points and is located as close as possible to all points of the correlation field, that is, it passes almost through its center. The purpose of the article is to create a regression model based on approximation, correlation and dispersion analysis of observational data. Results. Data approximation for multidimensional samples of active and passive experiments was performed, approximating functions and regression models in general were obtained based on them. On specific examples, the relationship between the factor features was established, the factor feature was selected. The most significant in terms of the connection closeness with the resulting feature, and a multivariate regression model suitable for forecasting was obtained. A multivariate dispersion analysis of the active experiment data was carried out on the research example of the influence on the homogeneity coefficient of concrete cement brand, type of aggregate, test period and “production period: of concrete. Analysis of dispersion shows that the most significant factors are the cement grade, the test period, the “making period” of the concrete and their minor interaction and the type of aggregate. The proposed technique significantly simplifies the process of creating a regression model. Conclusions. The performed calculations prove that: on the basis of the approximation and correlation of the passive experiment observations, it is possible to establish a relationship between the factor characteristics, to choose the factor characteristic that is the most significant in terms of the connection closeness with the resulting characteristic, to obtain a multivariate regression model suitable for forecasting, and this allows simplify the procedure for creating a regression model by successively moving from a simple model to a complex one; dispersion analysis of active experiment data makes it possible to assess the impact of individual factors and the impact of interaction between them. The approximation proves that the regression models of the active experiment data are linear. This is also confirmed by dispersion analysis, because the interaction of factors is insignificant.
URI (Уніфікований ідентифікатор ресурсу): http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/11639
Інші ідентифікатори: http://uajcea.pgasa.dp.ua/article/view/294688
DOI: 10.30838/J.BPSACEA.2312.241023.85.996
Розташовується у зібраннях:№ 5

Файли цього матеріалу:
Файл Опис РозмірФормат 
YERSHOVA2.pdf657,25 kBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.