news 2026/3/8 1:37:08

神经风格迁移(吴恩达深度学习笔记)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
神经风格迁移(吴恩达深度学习笔记)

目录

1.神经风格迁移

(1)解释

2.深层卷积网络的特征检测

3.成本函数

(1)成本函数

(2)内容代价函数

(3)风格代价函数


1.神经风格迁移
(1)解释
  • 首先要知道三个图像,C来表示内容图像,S表示风格图像,G表示生成图像
  • 如上图,神经风格迁移就是将风格迁移到内容图像上。
2.深层卷积网络的特征检测
  • 卷积网络一般是从浅到深检测到越来越复杂的特征

  • 如上图,一个AlexNet,假设一个隐藏单云有9个图片块最大化激活。

  • 如上图,是Layer1-Layer5得到的图片块。在Layer1中,隐藏单元通常会找一些简单的特征,比如说边缘或者颜色阴影。

  • 第二层似乎检测到更复杂的形状和模式,比如说这个隐藏单元(编号1),找到有很多垂线的垂直图案,隐藏单元(编号2)似乎在左侧有圆形图案(roundish shape)时会被高度激活。

  • 第三层,正中间的隐藏单元似乎对图像左下角的圆形很敏感,所以检测到很多车。右下角的隐藏单元似乎开始检测到人类。总的来看第三层明显检测到更复杂的模式

  • 依次递进,越深层越能检测到复杂的特征

3.成本函数
(1)成本函数
  • 要构建一个神经风格迁移系统,需要为生成的图像定义一个成本函数,通过最小化成本函数,可以生成你想要的任何图像。
  • 内容图像C,风格图片S,生成新图片G。为了实现神经风格迁移,定义一个关于G的成本函数J(G)来评判生成图像的好坏,然后使用梯度下降法最小化J(G)来生成新的图像G。定义成本函数的公式如下:J(G)=αJ(C, G) +βJ(S, G)
  • 这个成本函数分为两部分,第一部分是内容代价函数,第二部分是风格代价函数
(2)内容代价函数
  • 用隐含层l来计算内容代价函数,如果l是个很小的数,这个代价函数就会使生成图片像素上非常接近内容图片。如果用很深的层,那么如果问内容图片里是否有狗,然后它就会确保生成图片里有一个狗。所以在实际中,这个层l通常会选择在网络的中间层。

  • 然后用一个预训练的卷积模型,衡量一个内容图片和一个生成图片他们在内容上的相似度,a[l](C)a[l](G)分别代表这两个图片C和G的l层的激活函数值,如果这两个激活值相似,那么就意味着两个图片的内容相似。

  • 衡量两个激活值不同或相似的程度用如下公式:J(C, G) =1/2 ‖ a[l](C) - a[l](G) ‖²

(3)风格代价函数
  • 和内容代价函数一样,也是选取某一层l,将图片的风格定义为l层中各个通道之间激活项的相关系数
  • 如上图,这个相关系数可以看成不同通道激活值之间的组合,比如两个通道的激活值组合成一对数字,来表示两种特征间的相关性。(因为有多个通道,多种组合,所以有多个数字对)
  • 比如:这个红色的通道对应的第2个神经元,它能找出图片中的某些位置是否含有这些垂直的纹理,而第二个通道(黄色通道),对应第4个神经元,它可以粗略地找出橙色的区域,这两个通道的组合成的相关系数,代表了那么这幅图片中出现垂直纹理又是橙色地方的概率。如果说它们是不相关的,这意味着图片中有垂直纹理的地方很大概率不是橙色的。因此,相关系数提供了一种去测量这些不同的特征的方法。
  • 如上图,对于S,G这两个图像,需要通过各自相关系数计算一个风格矩阵,最后通过两个矩阵计算风格代价函数(这里用的Frobenius范数)。
  • 其中a[l]i,j,k 表示隐藏层l中(i,j,k)位置的激活值,i,j,k分别表示该位置的高度、宽度以及对应的通道数。计算关于l层和风格图像的一个矩阵,即G[l][S],这是一个n_c * n_c的矩阵,高度和宽度都是l层的通道数。矩阵中的k和k'被用来描述k通道和
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/26 20:42:14

AI推理不再依赖GPU:DeepSeek-R1极速CPU适配实战教程

AI推理不再依赖GPU:DeepSeek-R1极速CPU适配实战教程 1. 引言 随着大模型在自然语言处理领域的广泛应用,推理成本和部署门槛成为制约其落地的关键因素。尤其是在缺乏高性能GPU的场景下,如何实现高效、低延迟的AI推理成为一个亟待解决的问题。…

作者头像 李华
网站建设 2026/2/26 20:42:12

Wallpaper Engine终极解包指南:RePKG工具5分钟快速上手

Wallpaper Engine终极解包指南:RePKG工具5分钟快速上手 【免费下载链接】repkg Wallpaper engine PKG extractor/TEX to image converter 项目地址: https://gitcode.com/gh_mirrors/re/repkg 还在为无法查看Wallpaper Engine壁纸包中的精美素材而烦恼吗&…

作者头像 李华
网站建设 2026/2/26 20:42:10

Windows平台Poppler完整配置指南:3步搭建专业PDF处理环境

Windows平台Poppler完整配置指南:3步搭建专业PDF处理环境 【免费下载链接】poppler-windows Download Poppler binaries packaged for Windows with dependencies 项目地址: https://gitcode.com/gh_mirrors/po/poppler-windows 还在为Windows系统上配置PDF文…

作者头像 李华
网站建设 2026/3/5 0:46:53

开箱即用的中文情感分析方案|StructBERT模型镜像全解析

开箱即用的中文情感分析方案|StructBERT模型镜像全解析 1. 背景与需求:为什么需要轻量级中文情感分析? 在当前自然语言处理(NLP)广泛应用的背景下,情感分析已成为企业洞察用户反馈、监控舆情、优化服务体…

作者头像 李华
网站建设 2026/3/4 1:46:26

Windows右键菜单定制开发实战指南

Windows右键菜单定制开发实战指南 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 💻 在Windows系统开发领域,右键菜单管理是一个既基础又…

作者头像 李华
网站建设 2026/3/1 19:41:09

终极资源解包指南:3步掌握Wallpaper Engine素材提取技巧

终极资源解包指南:3步掌握Wallpaper Engine素材提取技巧 【免费下载链接】repkg Wallpaper engine PKG extractor/TEX to image converter 项目地址: https://gitcode.com/gh_mirrors/re/repkg 还在为无法获取Wallpaper Engine壁纸包中的精美素材而烦恼吗&am…

作者头像 李华