| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 2022 AAAI 多模态/情感分析/命名实体识别/关系抽取/知识图谱 论文一览表(持续更新中) -> 正文阅读 |
|
[人工智能]2022 AAAI 多模态/情感分析/命名实体识别/关系抽取/知识图谱 论文一览表(持续更新中) |
1.Tailor Versatile Multi-Modal Learning for Multi-Label Emotion Recognition 2.Sentiment and Emotion-Aware Multi-Modal Complaint Identification 3.Are Vision-Language Transformers Learning Multimodal Representations? A Probing Perspective. 近年来,由于基于transformer的视觉语言预训练模型的发展,联合文本-图片的embedding得到明显的改善。作者通过一组文本、图像、多模态探究任务在单模态和多模态层次上比较预训练和微调的表征,并且引入了专门用于多模态探测的新数据集。结果证明了视觉语言预训练在多模态层次上理解了颜色的概念,对位置和大小的理解更依赖文本;在语义对抗的例子上,作者发现多模态预训练模型能够准确地指出细微的多模态差异。同时,作者发现模型在多模态任务(VQA、NLVR)上进行fine-tune不一定能提高其多模态表示能力。 4.Multi-Modal Answer Validation for Knowledge-Based VQA 5.UniMS: A Unified Framework for Multimodal Summarization with Knowledge Distillation 6.MIA-Former: Efficient and Robust Vision Transformers via Multi-grained Input-Adaptation 7.Hierarchical Cross-Modality Semantic Correlation Learning Model for Multimodal Summarization 8.Knowledge Bridging for Empathetic Dialogue Generation 9.Hybrid Curriculum Learning for Emotion Recognition in Conversation 10.CEM: Commonsense-aware Empathetic Response Generation 11.OneRel: Joint Entityand Relation Extraction with One Module in One Step 12.MuMuQA: Multimedia Multi-Hop News Question Answering via Cross-Media Knowledge Extraction and Grounding 论文地址:https://arxiv.org/pdf/2112.10728.pdf 作者提出了跨模态grounding的新的QA评估基准;涉及多跳问题,需要在图片-文本对之间及逆行推理以确定所指的基础视觉对象,然后从新闻正文中预测出一个跨度来回答问题。此外,作者提出基于多模态知识提取和和问题-答案生成的多模态数据增强网络为这项任务提供弱监督。 13.CLIP-Event: Connecting Text and Images with Event Structures 论文地址:https://arxiv.org/pdf/2201.05078.pdf 视觉语言预训练模型通过理解图片-文本之间的对齐,而本文用一个对比学习的框架来增强视觉语言预训练模型对结构性事件信息的理解,并且收集了事件丰富的图文对用于模型的预训练。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 10:20:24- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |