当前位置:网站首页>GAN网络的重新学习的一些内容记录
GAN网络的重新学习的一些内容记录
2022-07-21 11:40:00 【V丶Chao】
20211130 -
(本篇文章属于自己在学习过程中的一些内容记录,正是因为对这些内容不理解,才有了这篇文章,同时会记录一些自己的思考,对与错请仔细斟酌。)
0. 引言
经过了一年多,上次专门研究GAN是去年的时候,学习了基础的原理,也记录了一些文章;但是当时并没有使用代码跑过,比如简单的GAN或者WGAN这种。各种乱七八糟的文章在吹,什么有了这个,再也不用怕什么什么了。。。无话可说。
今年八月份的时候,我就弄过这种内容,当时也是为了学习对抗自编码器才学习了一些内容。但是那个时候,我去复现一些GAN的内容的时候,就发现了问题。一方面,大家不同的源码,不管是不同的实现方法也好,不同的实现框架也好,甚至不同的框架版本等等。一些是github上高star的仓库,一些是文章中提到的。但是这里的痛点,是说,他们给出的代码,最后可能训练也比较困难,而且,就比如说理想状态下,GAN网络判别器的准确率应该是50(讲道理,虽然在各种论文里面都看到过,但是我目前还没有实现过,使用最原始的损失函数),然后如果使用WGAN,他本身就更替了这种损失函数的评价方式,又没办法去测试。
但是,去搜索很多文章,或者github,他们给出代码之后,并没有给出是否收敛或者稳定的结果,仅仅是给列出来一个图片,说我生成了这些图片,你看这个图片效果还挺不错。之前看的一篇文章,说准确率部分实际上应该是0.7-0.8的状态,但是这个说法就跟很多论文或者文章都不一样,这就很尴尬。
目前也是属于这种比较尴尬的境地,就在这篇手记中记录一些相关的文章把,我也没办法。
(可能,这是最后一次碰这个东西了,估计弄完这部分研究内容,以后再也不会碰)
1. 文章记录
How to Develop a Conditional GAN (cGAN) From Scratch
How to Develop an Auxiliary Classifier GAN (AC-GAN) From Scratch with Keras
2. 痛点记录
2.1 WGAN的收敛
对于GAN的研究中,论文和一些博客文章,甚至一些跟风的营销号,都说GAN非常难以训练,难以收敛,然后使用WGAN能比较好的解决问题。但是实际上,即使是这样,你去测试一些代码,还是会发现,测试多次,结果都不一样。而且由于WGAN采用的度量方式和原始的GAN并不样,这个新出来的结果,也没有找到非常好的说明文档。
总结来说就是,虽然说,大家都在用这个东西,但是即使有WGAN,很多人还是利用定期生成的图片来测试质量,等于用人眼来判别质量。然后等测试这个代码的时候,这些判断指标又一飞冲天,你又什么也搞不明白。说白了,就是大家都在说他好,然后测试的时候,就仅仅利用图片来说明情况,但是对于数值型的指标却什么也不提。目前未知,我看到的文章,基本上没有提过这部分内容,不管是论文,还是网上的博客文章。
(未完待续。。。)
边栏推荐
- C# 使用Timer和ProgressBar控件制作一个倒计时器
- Top understanding notes of LSTM
- When uploading jars on the nexus management page, jars can be pulled to the project normally. Jars published using the deploy of idea lifecycle can only be pulled to POM. 401 problem
- 测试:综合布线
- 6.ES5新增的数组的方法?
- Paper reading: a large scale Chinese short text conversation dataset (cdial GPT)
- 登陆状态如何管理?登录流程?
- 找鞍点
- Reentrant read write lock feature summary of reentrantreadwritelock
- Narcissistic number
猜你喜欢
5.引用类型和值类型作为函数参数?
Shell operators - mathematical operations, relational operations, string operations, file detection operations
论文阅读:A Large-Scale Chinese Short-Text Conversation Dataset(CDial-GPT)
The MathType DLL cannot be found. Please reinstall math problem solved
第三方之百度AI使用总结
Minio file system 8.0.3
EOS account system
vmvare虚拟机的导入与导出(ova格式)
Thesis reading: ctrl: a conditional transformer language model for controllable generation
VAD simple summary
随机推荐
Merge binary tree
Wuxi launched a major investigation of potential food safety hazards in Pizza Hut stores in the city
编译php7 指定remi扩展目录和ini的配置目录
如何在gdb里打印unicode 16(utf-16) C#的字符串
Shell operators - mathematical operations, relational operations, string operations, file detection operations
inoic4学习笔记2
Fake death occurs when Google browser is saved as an image
Use SQL to batch modify the photo time on MacOS photo app (Photos)
Judge whether to balance binary tree
4.基本类型和引用类型?
Reentrant read write lock feature summary of reentrantreadwritelock
web服务器
Basic principles and differences between countdownlatch and cyclicbarrier
[comprehensive pen test] difficulty 3.5/5, multi solution popular binary tree pen test
16.target和currenTarget的区别?
influxdb
Test: Generic Cabling
vmvare虚拟机的导入与导出(ova格式)
Thesis reading: ctrl: a conditional transformer language model for controllable generation
ionic4学习笔记10-某东项目轮播图