欢迎光临
我们一直在努力
您的位置:首页>科技前沿 >

人工智能如何将1896年古董电影提升到4K

当50秒的无声短片L'Arrivéed'un Train en gare de La Ciotat于1896年首映时,据报道,一些看戏的人为了一架即将到来的火车而安全奔跑,认为真正的火车会在任何时候,都是Looney Tunes风格的。考虑到原始电影的模糊,低分辨率质量,这是一个疯狂的想法。值得庆幸的是,那些惊慌失措的电影发烧友先锋们从未见过Denis Shiryaev发行的AI增强版,或者说他们绝对会倒闭。

Shiryaev利用DAIN和Topaz Labs的Gigapixel AI两个公开可用的增强程序,将原始素材转换为4K 60FPS剪辑。根据Topaz Labs网站,Gigapixel AI使用专有的插值算法,可以“分析图像并识别细节和结构并'完成'图像”。实际上,Topaz教会了AI即使在将图像放大多达600%之后也可以准确地锐化和澄清图像。另一方面,DAIN可以想象并在现有视频剪辑的关键帧之间插入帧。该概念与4K电视上的运动平滑功能相同,只有您的父母才能使用。但是,在这种情况下,它添加了足够的帧以将速率提高到60 FPS。

这两个都是升级技术的例子,自1998年第一台高清电视投放市场以来,升级技术一直是广播娱乐的重要组成部分。老式学校的标清电视以720x480分辨率显示,可以一次显示的内容总数为345,600像素。高清晰度电视以1920×1080或2,073,600总像素显示-是SD分辨率的六倍-而4K电视机(3840x2160分辨率)则需要8,294,400像素。

您需要额外填充600万像素以放大HD图像以适合4K屏幕,因此升频器必须弄清楚要显示哪些像素。这就是内插过程的用处。内插基于周围新像素的显示来估计每个新像素应显示的内容。但是,有很多不同的方法可以用来衡量。

“最近邻居”方法只是用与它们的最近邻居相同的颜色填充空白像素(因此命名)。它简单有效,但会产生锯齿状,明显像素化的图像。双线性插值需要更多的处理能力,但它使电视能够根据每个空白像素的两个最近邻居来分析每个空白像素,并在它们之间产生梯度,从而使图像清晰。另一方面,双三次插值从其16个最近邻居中采样。与原始图像相比,通过结合双线性和双三次插值的结果,电视可以准确着色,但图像仍然模糊,电视可以解决每个过程的缺点,并以最小的光学质量损失(清晰度和偶然的伪像)生成放大的图像。 。

由于插值过程本质上是一个猜谜游戏,为什么不让AI做主呢?使用深度卷积神经网络,诸如DAIN之类的程序可以分析和映射视​​频剪辑,然后在现有帧之间插入生成的填充图像。

效果绝不是完美的。Engadget的视频制作人Chris Schodt在仔细检查后发现了多个视觉伪影,包括火车动荡和行人融合。“简而言之,它看起来像YouTube一样大小,” Schodt告诉Engadget。“但是把它炸到全屏,我感觉前景物体和物体内部都还不错,但是如果你看物体边缘或背景物体,接缝会散开一些。”

即使存在当前的缺点,Shiryaev的技术仍提供了一些诱人的机会。我们可以很快看到无声的电影复兴吗,因为他们的胶片被AI数字化并得到了扩充?

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。