综合百科

logistic回归方程一般形式

逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计学方法。逻辑回归的目标是预测一个随机变量(因变量)属于某个特定类别的概率。逻辑回归方程的一般形式如下:

logit(p) = b0 + b1*x1 + b2*x2 + ... + bn*xn

其中:

- logit(p) 是对数 odds,表示某类别的概率 p 与 (1 - p) 之间的比值取对数。

- b0 是截距项(intercept)。

- b1, b2, ..., bn 是回归系数(regression coefficients),表示自变量 x1, x2, ..., xn 对因变量概率的影响。

- x1, x2, ..., xn 是自变量(independent variables),表示影响因变量概率的观测值。

逻辑回归方程的目标是找到一组优秀的回归系数 b0, b1, b2, ..., bn,使得观察到的数据与模型预测的类别概率之间的差异最小。这一过程通常通过极大似然估计(Maximum Likelihood Estimation, MLE)来实现。

逻辑回归方程的一般形式可以用于解决二分类问题,即将观测值分为两个类别。对于多分类问题,可以使用 softmax 函数将逻辑回归方程扩展为 softmax 回归方程。

Logistic 回归方程的一般形式为:

$P(y=1) = \frac{exp(z) / (1 + exp(z))}$

其中,$y$ 是目标变量,$z$ 是决策变量,$exp(z)$ 是 z 的自然对数,$1 + exp(z)$ 是 z 的对数。

Logistic回归是一种用于建立分类模型的方法,其一般形式如下:

$$

h_\theta(x) = \sigma(w_0 + w_1x_1 + w_2x_2 + ... + w_{n-1}x_{n-1})

$$

其中,$x$ 是 $n$ 特征向量,$h_\theta(x)$ 是模型的预测结果,$\theta$ 是模型的参数,$\sigma$ 是激活函数,$w_0, w_1, w_2, ..., w_{n-1}$ 是模型的系数。

在这个方程中,$h_\theta(x)$ 是模型预测的概率值,取值范围为 $(0,1)$,表示样本属于正例的概率。当 $h_\theta(x)=1$ 时,表示样本属于正例;当 $h_\theta(x)=0$ 时,表示样本属于负例。

需要注意的是,这个方程只是 logistic 回归模型的一种简化形式,实际应用中可能会使用更复杂的模型来进行预测。

分别是二项logistic回归,无序多分类logistic回归和有序多分类logistic回归。

二项logistic回归

因变量为两种结局的二分类变量,如中奖=1、未中奖=0;

自变量可以为分类变量,也可以为连续变量;

阳性样本量n要求是自变量个数至少10倍;

无序多分类logistic回归

因变量为无序的多分类变量,如获取健康知识途径(传统大众媒介=1,网络=2,社区宣传=3);

自变量可以为分类变量,也可以为连续变量;

也可用于因变量为有序多分类变量,但不满足平行检验条件的数据资料;

原理:用因变量的各个水平(除参照水平外)与参照水平比值的自然对数来建立模型方程;

有序多分类logistic回归

因变量为有序的多分类变量,如病情严重程度(轻度=1,中度=2,重度=3);

自变量可以为分类变量,也可以为连续变量;

原理:将因变量的多个分类依次分割为多个二元的Logistic回归;

须进行平行线检验,即检验自变量系数是否相等,如不满足,则使用无需多分类logistic回归;。