| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> [论文导读]Restoring and attributing ancient texts using deep neural networks深度学习复原古希腊铭文 -> 正文阅读 |
|
[人工智能][论文导读]Restoring and attributing ancient texts using deep neural networks深度学习复原古希腊铭文 |
摘要铭文是研究古代文明思想、语言社会和历史的重要证据,但许多铭文被损坏到难以辨认的程度,被送到远离其原始位置的地方,书写日期也充满不确定性。 Ithaca——恢复受损铭文的缺失文本,识别铭文的初始位置(地理归属),确定其书写年限的深度神经网络 Ithaca的架构侧重于协作、决策支持和可解释性。 ?方法Ithaca的主体结构是若干个堆叠的Transformer块用作信息解码,连接三个前馈小网络(任务头),分别用于预测缺失文本,预测地理归属,预测书写年限 模型输入字符、单词和位置联合嵌入characters embedding、Words embedding、positional embedding,有助于模型同时感知单词和字符( character-aware and context-aware) 模型主体8个堆叠的transformer解码器。使用全局、局部和随机注意力机制:将上下文依赖性从二次降低到线性。每层有4个稀疏注意力头:从输入中提取不同类型信息 每个transformer decoder都使用残差连接和层归一化(layer normalization) 任务头2层前馈小网络+softmax 时间和地点用第一个output embedding预测,缺失的单词用后续对应位置的output预测(只把缺失位置的output送去任务头预测) ?数据集使用古希腊语训练,素材来源横跨古地中海,书写于公元前7世纪至公元前5世纪之间:
该研究处理了原本未经处理的Packard Humanities Institute(PHI)数据集,包括178,551条铭文,有格式混乱、标注模糊等问题,该研究将每个PHI铭文分配了唯一ID,并生成了明确的日期间隔和地理位置。 实现效果预测缺失文本预测铭文的地理归属?预测铭文所属年代显著性图可以输出对结果起关键作用的词 ?在恢复缺失的词“联盟”(συμμαχ?α)的每一步,伊萨卡显然都在关注上下文重要的词“雅典人”(?Aθηνα?ων)和“塞萨利人”(Θετταλων)。 模型评估评估方式?1.与仅专家恢复对比 2.给专家提供Ithaca得到的可能性前20的结果,得到人机协作下的准确度 3.与先前研究Pythia对比 4.使用希腊人名在时间和空间上的已知分布来推断地理和时间标记 评估指标字符错误率(对文本恢复) Top-k准确度(对地理位置恢复) 度量距离(对书写时间恢复) 评估数据在恢复受损文本方面的准确率达到了 62%,在识别其原始位置方面的准确率达到 71%,并且可以将文本的日期确定在其真实日期范围的 30 年内。 与他们合作的历史专家在单独修复古代文本时准确率只有 25%,但当他们与 Ithaca 合作修复时时,准确率提高到了 72%,超过了模型的个人性能,体现出了人机协作在历史解释、建立历史事件的相对年代上的优势。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/8 4:26:19- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |