基于深度学习的双模态图像检索算法,综合处理图文,精准搜索

互联网上的信息量每时每刻都在增加,从中检索想要的数据就像大海捞针一样。基于内容的图像检索系统能够根据用户输入的内容,从海量的数据中检索用户所需的图像。这些系统在网络购物、智慧医疗等领域都有重要应用。

一般来说,图像检索系统有两种工作方式——基于文本和基于图像。基于文本,就是为系统数据库中的图像都添加标签或注释,用户输入文字描述,系统通过匹配用户输入的文字和图像标签,给出搜索结果;基于图像的检索就是“XX识图”:用户输入图片,系统自动识别图片内容,并检索出内容相关联的其他图片。

然而在我们人类的思考过程中,图像画面和文字描述经常同时在脑海中浮现。比如我看到朋友的笔记本电脑,非常喜欢,想拥有,但是我希望“如果它是银色的”就更好了。这样用户提交给检索系统的信息,就同时包含了图像(一张笔记本电脑的照片)和一些文字描述(银色的)。能综合处理这样两种输入内容的检索系统,就是“双模态”图像检索系统

双模态图像检索系统示意图 | 参考文献 [2]

近日,韩国光州科学技术院的研究人员开发了DenseBert4Ret,一种使用深度学习技术的双模态图像检索算法。这项研究由Moongu Jeon教授指导,由博士生Zafran Khan于 2022年9月14日发布于期刊《信息科学》(Information Science)中。

文中提出的模型同时接收图像和文字作为输入。为了从输入图像中提取特征,该团队使用了 DenseNet-121深度神经网络模型,使用的密集连接架构减少了层间信息损耗,允许输入层的信息直接流到输出层,在训练期间需要调整参数量非常少。另一方面,利用双向编码器表示法(bidirectional encoder representation from transformer,BERT)架构从文字输入中提取语义和上下文特征。随后两种输入信息的特征相结合,联合用于图像搜索。为了更好地训练联合特征,研究团队还使用了三重损失函数,减少了训练时间和计算要求,形成了拟议的模型DenseBert4Ret。

该团队使用Fashion200k、MIT-states和FashionIQ这三个真实世界的数据集来训练所提出的DenseBert4Ret算法,并与其他算法的效果进行比较,发现DenseBert4Ret的表现优于其他算法。

“我们的模型可以在任何有在线库存和需要检索图像的地方使用。”Jeon教授总结道。希望很快能看到 DenseBert4Ret 系统在我们日常使用的搜索引擎中的应用!

参考文献

[1] https://www.eurekalert.org/news-releases/970574

[2] http://dx.doi.org/10.1016/j.ins.2022.08.119

编译:牛奶

编辑:靳小明

排版:尹宁流

题图来源:《指环王》

论文信息

发布期刊Information Sciences

发布时间 2022年9月14日

论文标题 DenseBert4Ret: Deep bi-modal for image retrieval

(DOI:http://dx.doi.org/10.1016/j.ins.2022.08.119)

标签: 算法

最新资讯

文档百科

狗狗腿肿怎么消肿最迅速

通常引起狗狗腿肿的因素有以下几种:肌肉拉伤或骨折脱臼、外伤感染、感染皮肤病、关节炎等。狗狗的腿出现肿胀时,主人需要先考虑引起腿肿的原因,根据具体病因采取相应的治疗措施,这样才可以从根本上进行治疗,帮助狗狗快速恢复。

秦庄襄王早逝后,当时秦国真正的掌权者是谁?

秦庄襄王早逝,嬴政继位时只有13岁,等于是刚刚上初一的年纪,根本无力主持朝政,那当时秦国内部的真正掌权者是谁呢?所以秦庄襄王死后,按理来说很有可能权利是转移到了华阳夫人手中,她才是真正的掌权者。

开学如何准备入园用品

从家庭到幼儿园,是宝宝迈向社会的第一步。会不会被欺负……怎样才能让孩子开开心心地入园,在进幼儿园之前,作为父母应该作好哪些物质准备?由于孩子年龄小,家长可多为孩子准备两套衣裤放在幼儿园备用,以备孩子尿裤子、呕吐时更换。需要注意的是,千万别大包大揽,要与孩子一同准备并告诉孩子这些用品的名称与作用。

注水和出汤方式对茶汤口感的影响

注水和出汤的方式是对茶的品质影响最大的软性因素,也是泡茶过程中唯一需要人工完全控制的环节,当然也是最容易仁者见仁,智者见智的环节。主要影响到浸泡过程中水温的高低,且顺便影响到水流的急缓,除了跟茶汤滋味的浓淡相关以外,也影响到汤感和香气的协调性。

泡椒肥羊乌冬面的做法大全

P.S.本来还想放一小撮麻椒的,结果做的时候居然忘记了,汗!1,肥羊,乌冬准备好;泡椒,野山椒,姜蒜剁碎;香菜洗净沥干;2,锅里放油,爆香泡椒,野山椒和姜蒜,然后加入少许开水,中小火熬煮几分钟;3,煮泡椒汤底的同时另外用一只锅子烧水煮乌冬面,煮熟后捞起;

让“肿瘤君”1秒现形我国首台高端PET研制成功

传统的PET设备成像速度在1—10分钟,只能够对药物的累积效果进行静态成像,无法捕捉动物的瞬态生化过程。近日,记者从山东召开的“2019年超高灵敏度PET和神经影像国际论坛”上获悉,国内首个可让“肿瘤君”秒级现形的“超高灵敏度PET”研制成功。

CopyRight © 2000~2023 一和一学习网 Inc.All Rights Reserved.
一和一学习网:让父母和孩子一起爱上学习