UK: Знайти кількісну оцінку впливу категорійних факторів на пояснювану змінну. Для передбачення значення числової змінної залежно від значень інших числових змінних використовується регресійний аналіз статистичної моделі, побудованої за даними спостережень. Однак у багатьох ситуаціях у модель необхідно включати категорійні змінні. Метод. Категорійні фактори включаються в модель як фіктивні змінні, значення яких 1 або 0 відповідають наявності або відсутності певного категоріального рівня пояснювальної змінної. Однак такий підхід виправданий лише в тому випадку, коли у категорійної змінної тільки два рівні: наявність або відсутність певної якості. Тоді значення фіктивної змінної повинне дорівнювати 1 у першому випадку й 0 – у другому. За наявності декількох категоріальних рівнів пропонується в модель множинної регресії вводити фіктивні змінні, відповідні кожному рівню і які набирають значення 1, якщо категорійна пояснювальна змінна набирає значення відповідного рівня, і дорівнюють 0 для всіх інших її значень (рівнів). Крім того, модель дозволяє врахувати можливу взаємодію категоріальних рівнів різних пояснювальних нечислових змінних і ефект такої взаємодії за кількісної оцінки їх впливу на пояснювану змінну. Результати. Запропоновано модель множинної регресії на категорійні фактори, що дозволяє знайти кількісну оцінку впливу на пояснювану змінну не тільки числових, а й категорійних незалежних змінних. Причому модель враховує той факт, що за відсутності всякого впливу з боку пояснювальних змінних, тобто коли вони всі рівні 0, регресія також повинна дорівнювати 0. При цьому так званий «зсув» прямої регресії відсутній (і тим більше не може бути від'ємним, як для математичної прямої). Наукова новизна. Пропонована модель розширює й узагальнює можливості регресійного аналізу статистичних моделей на випадок категорійних факторів. Практична значимість. Модель множинної регресії на категорійні фактори дозволяє вирішувати питання вибору категоріальних рівнів нечислових параметрів для проектування систем; ухвалення рішення про вибір стратегії у фінансовій діяльності й в управлінні.
EN: To find a quantitative assessment of the influence of categorical factors on the variable being explained. To predict the value of a numerical variable depending on the values of other numerical variables, a regression analysis of a statistical model based on observational data is used. However, in many situations, categorical variables must be included in the model. Method. Categorical factors are included in the model as dummy variables whose values 1 or 0 correspond to the presence or absence of a certain categorical level of the explanatory variable.However, such an approach is justified only if the category variable has only two levels: the presence or absence of a certain quality. Then the value of the dummy variable is due to be equal to 1 in the first case and 0 − in the second one. If there are several categorical levels, it is proposed to introduce dummy variables corresponding to each level and taking the value 1 into the multiple regression model if the categorical explanatory variable takes the value of the corresponding level and is 0 for all its other values (levels). In addition, the model makes it possible to take into account the possible interaction of categorical levels of various explanatory non-numerical variables and the effect of such interaction when quantifying their influence on the explained variable. Results. Proposed model of multiple regression on the categorical factors , which allows to find a quantitative assessment of the impact on the explanatory variable, not only numerical but also categorical independent variables. Moreover, the model takes into account the fact that in the absence of any influence from the explanatory variables, i.e. when they are all 0, the regression should also be 0 . Moreover, the so-called “shift” of direct regression is absent ( and, moreover, cannot be negative, as for the mathematical line ) . Scientific novelty. The proposed model extends and generalizes the capabilities of the regression analysis of statistical models for the case of categorical factors. Practical relevance. The model of multiple regression on categorical factors allows us to solve the following problems: selection of categorical levels of non-numeric parameters when designing systems; deciding on the choice of strategy in financial activities and management.