IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 受限玻尔兹曼机RBM -> 正文阅读

[人工智能]受限玻尔兹曼机RBM

基本概念

受限玻尔兹曼机(RBM)是一个两层神经网络,第一层被称为可见层,第二层被称为隐藏层,因为网络只有两层,所以又被称为浅层神经网络。

该模型最早由 Paul Smolensky 于 1986 年提出(他称其为 Harmony 网络),此后 Geoffrey Hinton 在 2006 年提出了对比散度(Contrastive Divergence,CD)方法对 RBM 进行训练。可见层中的每个神经元与隐藏层中的所有神经元都相连接,但是同一层的神经元之间无连接,所有的神经元输出状态只有两种。

RBM 可以用于降维、特征提取和协同过滤,RBM 的训练可以分成三部分:正向传播、反向传播和比较。下面看看 RBM 的表达式。

正向传播:可见层(V)已知,利用权重(W)和偏置(c)采样出隐藏层(h0),根据下式的随机概率(σ 是随机概率),隐藏单元开启或关闭:
在这里插入图片描述
反向传播:反过来,隐藏层h0已知,通过相同的权重 W 采样出可见层,但是偏置 c 不同,以此重建输入。采样概率为:
在这里插入图片描述
这两个传递过程重复 k 步或直到收敛,研究表明,k=1 就已经能给出很好的结果,所以此处设置 k=1。

RBM 模型是一个基于能量的模型,对于一组给定的状态(可见向量 V 和隐藏向量)可构造能量函数:

在这里插入图片描述
与每个可见向量 V 相关联的是自由能量,一个单独配置的能量,要想与其他含有 V 的配置的能量相等,则:
在这里插入图片描述
使用对比发散度目标函数,即 Mean(F(Voriginal))-Mean(F(Vconstructed)),则权重的变化由下式给出:
在这里插入图片描述
其中,η 是学习率,偏置 b 和 c 也存在类似表达式。

代码

import tensorflow as tf
import numpy as np
from tensorflow.examples.tutorials.mnist import input_data
import matplotlib.pyplot as plt

class RBM(object):
    def __init__(self,m,n):
        '''
        :param m:Number of neurons in visible layer
        :param n:Number of neurons in hidden layer
        '''
        self._m = m
        self._n = n
        # Create the Computational graph
        # Weights and biases
        self._W = tf.Variable(tf.random_normal(shape=(self._m,self._n)))
        self._c = tf.Variable(np.zeros(self._n).astype(np.float32))
        # bias for hidden layer
        self._b = tf.Variable(np.zeros(self._m).astype(np.float32))
        # bias for visible layer
        # placeholder for inputs
        self._X = tf.placeholder('float',[None,self._m])
        # forward pass
        _h = tf.nn.sigmoid(tf.matmul(self._X,self._W)+self._c)
        self.h = tf.nn.relu(tf.sign(_h - tf.random_uniform(tf.shape(_h))))
        # backward pass
        _v = tf.nn.sigmoid(tf.matmul(self.h,tf.transpose(self._W))+self._b)
        self.V = tf.nn.relu(tf.sign(_v - tf.random_uniform(tf.shape(_v))))
        # objective function
        objective = tf.reduce_mean(self.free_energy(self._X)) - tf.reduce_mean(self.free_energy(self.V))
        self._train_op = tf.train.GradientDescentOptimizer(1e-3).minimize(objective)
        # cross entropy cost
        reconstructed_input = self.one_pass(self._X)
        self.cost = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=self._X,logits=reconstructed_input))

    def fit(self,X,epochs=1,batch_size=100):
        N,D = X.shape
        num_batches = N // batch_size
        obj = []
        for i in range(epochs):
            # X = shuffle(x)
            for j in range(num_batches):
                batch = X[j*batch_size:(j*batch_size+batch_size)]
                _,ob = self.session.run([self._train_op,self.cost],feed_dict={self._X:batch})
                if j % 10 ==0:
                    print('training epoch {0} cost {1}'.format(j,ob))
                obj.append(ob)
        return obj

    def set_session(self,session):
        self.session = session

    def free_energy(self,V):
        b = tf.reshape(self._b,(self._m,1))
        term_1 = -tf.matmul(V,b)
        term_1 = tf.reshape(term_1,(-1,))
        term_2 = -tf.reduce_sum(tf.nn.softplus(tf.matmul(V,self._W)+self._c))
        return term_1+term_2

    def one_pass(self,X):
        h = tf.nn.sigmoid(tf.matmul(X,self._W)+self._c)
        return tf.matmul(h,tf.transpose(self._W))+self._b

    def reconstruct(self,X):
        x = tf.nn.sigmoid(self.one_pass(X))
        return self.session.run(x,feed_dict={self._X:X})

if __name__ == '__main__':
    mnist = input_data.read_data_sets("Mnist_data/",one_hot=True)
    trX,trY,teX,teY = mnist.train.images,mnist.train.labels,mnist.test.images,mnist.test.labels

    Xtrain  = trX.astype(np.float32)
    Xtest = teX.astype(np.float32)
    _,m = Xtrain.shape
    rbm = RBM(m,100)
    # initialize all variables
    init = tf.global_variables_initializer()
    with tf.Session() as sess:
        sess.run(init)
        rbm.set_session(sess)
        err = rbm.fit(Xtrain)
        out = rbm.reconstruct(Xtest[0:100]) # let us reconstruct test data

参考http://c.biancheng.net/view/1954.html

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-27 11:51:08  更:2021-08-27 11:53:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/1 12:26:27-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码