登录社区云,与社区用户共同成长
邀请您加入社区
很明显,ChatGPT的爆火,带动了AIGC(AI-Generated Content)概念的火热。
本文主要介绍MOS开源模型与应用。MOS(Mean Opinion Score)是一种常用的主观质量评价方法,常用于视频、图像等多媒体领域中的质量评价。MOS视觉评价通常是通过让受试者观看视频/图像,对视频的清晰度、锐度、颜色饱和度、运动模糊、噪声等方面进行评价。
本文主要介绍AIGC体验方法,up主们纷纷使用AIGC进行短视频内容创作,能绘画天马行空的场景、栩栩如生的人物。如此精细的ai绘画和去年Stable Diffusion、MidJourney、DALL-E 2的横空出世息息相关,技术革新带来了令人震撼的效果。这些新技术可以提高创意的效率,缩短创意到实现的周期,并且能够在艺术设计、电影、游戏等领域产生巨大的影响。对于普通人来说,这些新技术可以提供更好
本文介绍开源图像上色一键体验,它是指对黑白图像添加色彩,使其变成彩色图像。更具体的说,我们常见的彩色图像通常是三通道图像,而黑白图像只有一个灰度通道,因此,图像上色旨在利用单一灰度通道恢复图像的两个彩色通道。随着摄影技术的演进,彩色照片在现在已经非常普及,但仍然有大量历史黑白照片遗留。图像上色可以对这些宝贵的旧时代遗产进行修复,令老照片重获新生。
本文介绍AI开源能力对抖动的视频进行稳像,达到清晰稳定的效果。在ModelScope魔搭平台上开源了DUT-RAFT视频稳像算法,几行代码即可调用,无需复杂的操作,也无需复杂的输入。鼠标一点即可畅快体验让视频变稳定的AI“魔法”。
文生图加速了渲染行业的进一步迭代——为了拥有颗粒度更加细致、分辨率更高的图片,AIGC产品的参数量会变得越来越大,但客观上这对渲染的算力和内存提出了更多要求。
在我们开始之前,你必须先了解编程语言,然后才能相信 ChatGPT 抛给你的任何东西。我必须明确这一点,因为许多误入歧途的绵羊被告知 ChatGPT 是新的圣杯,开发人员将被淘汰。推荐:用快速搭建3D场景。使用 ChatGPT 或任何 LLM 不会自动让你成为大师,也不会自动让你更有效率。一味的复制粘贴代码对任何人都没有好处;这只是懒惰。它可能会导致意想不到的后果,当你添加不理解的代码时,这可能会
01开源 论文链接:MogFace: Towards a Deeper Appreciation on Face Detection模型&代码:https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary简易应用:https://modelscope.cn/studios/damo/
目前插帧算法在学术界不断取得突破,多篇文章通过transformer的引入能够有效提升PSNR等验证指标。但当前大部分只能实现2倍插帧,无法一次性实现高倍率插帧以及任意指定帧率转换。针对以上问题,达摩院视觉增强团队在Modelscope上线了自研的插帧算法,该算法能够有效提升上述困难场景下的插帧质量,同时该算法支持任意时刻的中间帧生成,输出帧率可由用户任意指定。
本文简要介绍ECCV 2022论文DLME。实际应用和项目中,数据样本往往是高维的,对高维数据进行学习时,需要在低维空间表示高维信息。从高维数据寻求低维嵌入的方式被称为流形学习。该文提出了一个新的流形学习框架,即深度局部平坦性矩阵嵌入(DLME)。为了克服流形学习遇到的问题,用数据增强的方式来构建语义流形,并使用流形“局部平坦”假设的平滑度约束来克服“结构扭曲”的问题。此外,还设计了一个新的损失函