5熊猫网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

开启左侧
查看: 138|回复: 0
 蒋兀 发表于: 2019-12-31 08:19:04|显示全部楼层|阅读模式

[2019年] 研究人员分享如何利用 AI 技术解决水下图片模糊和着色问题

 [复制链接]
源自:雷锋网
原文标题:研究人员分享如何利用 AI 技术解决水下图片模糊和着色问题

  你是否注意到,当拍摄水下照片的时候图像会出现比以往拍摄效果更严重的模糊并且失真的情况?这是因为光衰减和反向散射等现象会对可见度产生不利影响。
  为了解决这个问题,中国哈尔滨工程大学的研究人员设计了一种机器学习算法,该算法可以生成逼真的水下图像;另一种算法,则可以对这些图像进行深度训练,以达到恢复自然色彩并减少雾度的效果。他们说,这种方法在质量和数量上都与最新技术相匹配,并且能够在单个显卡上以每秒 125 帧的速度进行处理。
  该团队指出,大多数水下图像增强算法(例如那些调整白平衡的算法)都不是基于物理成像模型实现,这使其不适用于一些任务。相比之下,这种方法利用了生成式对抗网络(GAN)(一种深度学习模型,模型通过框架中两个模块:生成模型和判别模型的互相博弈学习产生相当好的输出),以生成一组特定调查地点的图像并在此基础上引入第二种算法,U-Net。
3657-imkzenq0322326.png
研究小组对 GAN 进行了一系列有标记场景的训练,这些场景包括 3733 幅图像和相应的深度地图,主要包括扇贝、海参、海胆和室内海洋农场内的其他此类生物。他们还获得了包括 NY Depth 在内的公开数据集,其中包含了总共数千张水下照片。
  训练后,研究人员将双模型方法的结果与基线模型方法的结果进行了比较。他们指出,前者技术的优势在于它在颜色恢复上是统一的,这使它能在很好恢复绿色色调图像的同时,不破坏原始输入图像的底层结构。通常情况下,这种方式在保持“适当的”亮度和对比度的同时,还能设法恢复颜色,而在这方面其他解决方案并不特别擅长。
  值得注意的是,这并不是第一个想到利用AI技术从损坏的图片中重建画面的研究团队。剑桥咨询(Cambridge Consultants)公司的 AI 系统 DeepRay 利用了一套训练有素的 GAN 来处理 10万张静止图像的数据集,以消除不透明的玻璃窗格导致的失真。开源 DeOldify 项目使用了包括 GANs 在内的一系列人工智能模型来对旧图像和胶片进行着色和恢复。
  在其他方面,微软亚洲研究院(Microsoft Research Asia)的科学家在 9月份详细介绍了一个用于自主视频着色的端到端系统;NVIDIA 的研究人员去年描述了一个框架,该框架仅基于一个被注释过得彩色视频帧推断颜色分类;今年 6月,谷歌AI团队推出了一种无需人工监督即可对灰度视频进行着色的算法。
  venturebeat
  更多精彩内容敬请关注雷锋网官方网站、雷锋网(公众号:雷锋网)微信公众号及雷锋网相关微信账号。
  雷锋网原创文章,未经授权禁止转载。详情见转载须知。
『 5熊猫网 』提醒,在使用本论坛之前您必须仔细阅读并同意下列条款:
  1. 遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规,并遵守您在会员注册时已同意的《『 5熊猫网 』管理办法》;
  2. 严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容;
  3. 本帖子由 蒋兀 发表,享有版权和著作权(转帖除外),如需转载或引用本帖子中的图片和文字等内容时,必须事前征得 蒋兀 的书面同意;
  4. 本帖子由 蒋兀 发表,仅代表用户本人所为和观点,与『 5熊猫网 』的立场无关,蒋兀 承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
  5. 本帖子由 蒋兀 发表,帖子内容(可能)转载自其它媒体,但并不代表『 5熊猫网 』赞同其观点和对其真实性负责。
  6. 本帖子由 蒋兀 发表,如违规、或侵犯到任何版权问题,请立即举报,本论坛将及时删除并致歉。
  7. 『 5熊猫网 』管理员和版主有权不事先通知发帖者而删除其所发的帖子。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2025, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2025-5-6 20:34, Processed in 0.109200 second(s), 8 queries, Gzip On, MemCache On
快速回复 返回顶部 返回列表