logistic回归方程一般形式

逻辑回归（Logistic Regression）是一种广泛应用于分类问题的统计学方法。逻辑回归的目标是预测一个随机变量（因变量）属于某个特定类别的概率。逻辑回归方程的一般形式如下：

logit(p) = b0 + b1*x1 + b2*x2 + ... + bn*xn

其中：

- logit(p) 是对数 odds，表示某类别的概率 p 与 (1 - p) 之间的比值取对数。

- b0 是截距项（intercept）。

- b1, b2, ..., bn 是回归系数（regression coefficients），表示自变量 x1, x2, ..., xn 对因变量概率的影响。

- x1, x2, ..., xn 是自变量（independent variables），表示影响因变量概率的观测值。

逻辑回归方程的目标是找到一组优秀的回归系数 b0, b1, b2, ..., bn，使得观察到的数据与模型预测的类别概率之间的差异最小。这一过程通常通过极大似然估计（Maximum Likelihood Estimation, MLE）来实现。

逻辑回归方程的一般形式可以用于解决二分类问题，即将观测值分为两个类别。对于多分类问题，可以使用 softmax 函数将逻辑回归方程扩展为 softmax 回归方程。

Logistic 回归方程的一般形式为:

$P(y=1) = \frac{exp(z) / (1 + exp(z))}$

其中,$y$ 是目标变量,$z$ 是决策变量,$exp(z)$ 是 z 的自然对数,$1 + exp(z)$ 是 z 的对数。

Logistic回归是一种用于建立分类模型的方法，其一般形式如下：

h_\theta(x) = \sigma(w_0 + w_1x_1 + w_2x_2 + ... + w_{n-1}x_{n-1})

其中，$x$ 是 $n$ 特征向量，$h_\theta(x)$ 是模型的预测结果，$\theta$ 是模型的参数，$\sigma$ 是激活函数，$w_0, w_1, w_2, ..., w_{n-1}$ 是模型的系数。

在这个方程中，$h_\theta(x)$ 是模型预测的概率值，取值范围为 $(0,1)$，表示样本属于正例的概率。当 $h_\theta(x)=1$ 时，表示样本属于正例；当 $h_\theta(x)=0$ 时，表示样本属于负例。

需要注意的是，这个方程只是 logistic 回归模型的一种简化形式，实际应用中可能会使用更复杂的模型来进行预测。

分别是二项logistic回归，无序多分类logistic回归和有序多分类logistic回归。

二项logistic回归

因变量为两种结局的二分类变量，如中奖=1、未中奖=0；

自变量可以为分类变量，也可以为连续变量；

阳性样本量n要求是自变量个数至少10倍；

无序多分类logistic回归

因变量为无序的多分类变量，如获取健康知识途径（传统大众媒介=1，网络=2，社区宣传=3）；

自变量可以为分类变量，也可以为连续变量；

也可用于因变量为有序多分类变量，但不满足平行检验条件的数据资料；

原理：用因变量的各个水平（除参照水平外）与参照水平比值的自然对数来建立模型方程；

有序多分类logistic回归

因变量为有序的多分类变量，如病情严重程度（轻度=1，中度=2，重度=3）；

自变量可以为分类变量，也可以为连续变量；

原理：将因变量的多个分类依次分割为多个二元的Logistic回归；

须进行平行线检验，即检验自变量系数是否相等，如不满足，则使用无需多分类logistic回归；。