14 posts tagged with "概率论" | Stand Alone Complex

生成模型最关键的就是对于 $p(\boldsymbol{x}_{t-1}\mid \boldsymbol{x}_{t})$ 的建模，而条件生成就是以条件 $\boldsymbol{y}$ 作为条件输入，而这时的条件概率分布就可以写为 $p(\boldsymbol{x}_{t-1}\mid \boldsymbol{x}_{t},\boldsymbol{y})$ 。为了重用已经训练好的无条件生成模型 $p(\boldsymbol{x}_{t-1},\boldsymbol{x}_{t})$ ，我们利用贝叶斯定理：

EM 算法 - 收敛性

December 5, 2023 · 3 min read

PuQing

AI, CVer, Pythoner, Half-stack Developer

Expectation Maximization(EM) 算法，该算法用于解决具有隐变量的混合模型的高斯和分布（例子可以见三硬币模型）。在比较理想的情况中，我们可以直接得出我们求得的参数的解析解，比如： $\mathrm{MLE}:p(X\mid \theta)$ 。我们想要求解的结果就是：

\theta_{MLE} = \arg \max_{\theta}\sum_{i=1}^N \log p(x_{i}\mid \theta)

其中， $\sum_{i=1}^N\log p(x_{i}\mid \theta)$ 也被我们称为对数似然函数。但是一旦引入隐变量，似然函数变为：

多元高斯分布

November 22, 2023 · 13 min read

PuQing

AI, CVer, Pythoner, Half-stack Developer

在高斯分布中我们分别介绍了一维高斯分布情况，以及对于多元高斯分布表达式中的 马氏距离 进行了解释。这一节将主要介绍在多元高斯分布的常用定理进行介绍。

多元高斯的线性性质

tip

已知：

高斯分布

November 20, 2023 · 8 min read

PuQing

AI, CVer, Pythoner, Half-stack Developer

假设有数据：

X=\left(x_{1}, x_{2}, \cdots, x_{N}\right)^{T}=\left(\begin{array}{c} x_{1}^{T} \\ x_{2}^{T} \\ \vdots \\ x_{N}^{T} \end{array}\right)=\left(\begin{array}{cccc} x_{11} & x_{12} & \ldots & x_{1 p} \\ x_{21} & x_{32} & \ldots & x_{2 p} \\ \vdots & \vdots & \ddots & \vdots \\ x_{N 1} & x_{N 2} & \ldots & x_{N p} \end{array}\right)_{N \times P}

其中 $x_{i}\in \mathbb{R}^p$ ， $x_{i} \sim \mathcal{N}(\mu, \Sigma)$ ，参数为 $\theta=(\mu,\Sigma)$

单变量高斯分布

对于单变量的高斯分布 $\mathcal{N}(\mu,\sigma^2)$ ，即 $p=1$ ，其概率密度函数为

概率图

November 19, 2023 · 5 min read

PuQing

AI, CVer, Pythoner, Half-stack Developer

概率图模型（Probabilistic Graphical Model， PGM），简称图模型（Graphical Model，GM），是指一种用图结构来描述多元随机变量之间条件独立性的概率模型，从而给研究高维空间的概率模型带来了很大的便捷性。

为什么讲条件独立性呢？

对于一个 $K$ 维随机向量，其联合概率为高维空间中的分布，一般难以直接建模。假设有

X=\left[ X_{1},X_{2},\cdots,X_{K} \right]^{\mathbf{T}}

为离散随机变量并且有 $m$ 个取值，在不作任何假设的情况下，则需要 $m^K-1$ 个参数才能表示其概率分布。参数是指数级的，我们在多元高斯分布中也反复说明过高维问题，贝叶斯分类器条件假设。

朴素贝叶斯分类器

November 18, 2023 · 6 min read

PuQing

AI, CVer, Pythoner, Half-stack Developer

假设我们有个特定的输入 $x$ ，我们想要 $\text{Inference}$ 它的类别，我们可以通过贝叶斯定理中的后验概率最大的类作为 $x$ 类的输入。

\begin{equation} P\left(Y=c_{k} \mid X=x\right)=\frac{P\left(X=x \mid Y=c_{k}\right) P\left(Y=c_{k}\right)}{\sum_{k} P\left(X=x \mid Y=c_{k}\right) P\left(Y=c_{k}\right)} \label{1} \end{equation}

其中的 $Y$ 即输入的类别。

贝叶斯定理

November 14, 2023 · 7 min read

PuQing

AI, CVer, Pythoner, Half-stack Developer

条件概率

条件概率一般记作 $P(A\mid B)$ ，意思是当 $B$ 事件发生时， $A$ 事件发生的概率，其定义为

P(A\mid B)=\frac{P(A\cap B)}{P(B)}

其中 $P(A\cap B)$ 意思是 $A$ 和 $B$ 共同发生的概率，称为联合概率。也可以写作 $P(A,B)$ 或 $P(AB)$ 。

Mixture Model

November 12, 2023 · 5 min read

PuQing

AI, CVer, Pythoner, Half-stack Developer

info

In statistics, a mixture model is a probabilistic model for representing the presence of subpopulations within an overall population, without requiring that an observed data set should identify the sub-population to which an individual observation belongs

Introduce

三硬币模型

假设有 3 枚硬币，分别记作 $A,B,C$ 。这些硬币正面出现的概率分别是 $\pi,p,q$ 。进行如下掷硬币实验：先掷硬币 $A$ ，根据其结果选出硬币 $B$ ，反面选硬币 $C$ ；然后掷选出的硬币，掷硬币的结果，出现正面记作 1，出现反面记作 0；独立地重复 $n$ 次实验（这里， $n=10$ ）,观测结果如下：

条件输入​

多元高斯的线性性质​

单变量高斯分布​

条件概率​

Introduce​

三硬币模型​

条件输入

多元高斯的线性性质

单变量高斯分布

条件概率

Introduce

三硬币模型