| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文阅读-FASPell: A Fast Adaptable Simple Powerful Chinese Spell Checker Based -> 正文阅读 |
|
[人工智能]论文阅读-FASPell: A Fast Adaptable Simple Powerful Chinese Spell Checker Based |
来源:爱奇艺?EMNLP2019 Workshop 论文:https://aclanthology.org/D19-5522.pdf 目录 模型结构1. 基于bert掩码语言模型的微调利用训练语料(错误-正确句子对),微调bert
2. 基于汉字相似度的解码器汉字相似度字形相似度(相比使用汉字图片,以下方法考虑到了笔画顺序,汉字结构之类)。考虑到复杂度,这里仅仅使用序列的信息,而不是使用树形结构信息(漢字データベースプロジェクト) 发音相似度: 1减去标准化的拼音编辑距离 在解码阶段,原有的方法是对多个特征设置不同的权重。论文同时利用bert预测的置信度和汉字之间的相似度进行解码。 首先基于训练集绘制原字-候选字相似度和bert置信度的散点图,画出能将检测错误,纠正错误与纠正正确分开的曲线。 横坐标是bert的置信度,纵坐标是汉字的相似度 最后选择的时候根据这个曲线进行选择。 这个曲线是要手工调整的,其实就是在解码的时候,综合考虑字的相似度以及bert预测的输出概率 ?可实现在召回率损失不大的基础上,提高准确率 ?实验结果? ——FT代表去掉微调 ——CSD代表去掉基于汉字相似度的解码器 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/9 15:30:05- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |