IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文写作 13: 实验部分是重头戏 -> 正文阅读

[人工智能]论文写作 13: 实验部分是重头戏

对于很多机器学习论文, 实验部分占据了论文一半的篇幅.

一. 数据集信息

  1. 数据集越多, 覆盖领域越广, 结果就越可信. 从软件测试的角度也是如此.
    在多数情况下, 12 至 20 个公开数据集就足够了. 然而, 对于一些领域和问题而言, 数据集却非常珍贵. 可以使用人造数据集, 或者数据集随机采样成多个, 来缓解该问题.
  2. 数据集大些更好. 如果是结构化数据, 有 1 0 4 10^4 104 个样本和 100 个属性就比较好. 否则, 审稿人就会说你使用了玩具数据集.
  3. 获取自己主要参考文献中的数据, 有利于进行比较. 你甚至不需要把他们的方案实现. 在一些领域如图像和视觉, 会有一些专门的数据集供大家测试.
  4. 要么获得对比算法的源码, 要么实现它们. 由于使用平台不同, 数据采样不同, 有时候你重现别人的实验, 会发现结果不大一致. 如果没有特别的原因, 就使用自己实现的版本.
  5. 同一结果不应该在图和表中同时出现, 这样就重复了. 你只有选择更为合适的方式.
Table 1. Dataset information.
Dataset ∣ U ∣ \vert U \vert U ∣ C ∣ \vert C \vert CArea r t rt rtq
Seeds2108Life0.190.1
Thyroid2156Life0.250.1
Flame2403Synthetic0.10.1
Heart27014Life0.050.1
Spiral3123Synthetic0.30.1
Ionosphere35035Physical0.040.1
R156003Synthetic0.20.1
DLA0.011,54018Society0.10.05
USps2,200257Image0.20.05
Waveform5,00022Physical0.10.1
Credit5,98766Financial0.350.1
Twonorm7,40021Synthetic0.30.1

Table 1 列出了一篇论文的数据信息. 其中:

  1. 使用了人工与真实数据集.
  2. 数据来自于不同领域.
  3. 列出了主要参数设置.

二. 自问自答模式

实验的主要目的是回答一些作者和读者关心的问题. 因此, 我采用自问自答的方式, 在实验之前提出这些问题, 在实验结果列出之后逐个回答它们.
例: 在实验这一节开始的时候
In this section, we report the results of experiments to analyze the effectiveness of the TACS algorithm. Through the experiments, we aim to answer:

  1. Is the TACS algorithm more accurate than popular supervised classification algorithms?
  2. Is the TACS algorithm more accurate than popular active learning algorithms?
  3. Is the TACS algorithm more accurate than single clustering technique based algorithms?
  4. Can the TACS algorithm select appropriate base clustering techniques?

在列完所有图表之后
Now we can answer the questions proposed at the beginning of this section.

  1. TACS is more accurate than popular supervised classification algorithms, including C4.5, NB, RF, etc. This is validated by Table 3. Unfortunately, on some datasets such as Ionosphere, it is significantly worse than some other
    algorithms such as RF. The reason may be that clustering techniques do not perform well on those datasets.
  2. TACS is more accurate than popular active learning algorithms, including QBC, MAED, and KQBC. This is validated by Table 4. It was also defeated by MAED on the Heart dataset. The reason may be that for some datasets, informative instances are more important than representative ones.
  3. TACS is more accurate than single clustering technique based algorithms. This is validated by Table 5. It is the best, or the second best one on all datasets.
  4. In most cases, TACS can find out the appropriate base clustering techniques. This is validated by Table 6.

偶尔有审稿人不喜欢这种风格, 觉得好像给小学生讲题. 万一他要提, 我们改就是了.

三. 内部比较

内部比较的动机包括:

  1. 展示参数变化所导致的性能变化.
    二维图一次只能展示一个参数和一个性能指标. 因此, 如果有很多参数, 就只能讨论最重要的几个, 否则图太多.
  2. 展示主要方案与其变种相比的优势.
    有时候我们有好几种可选方案, 通过比较, 可以获得最佳那个. 只有在国内获得冠军, 才出去参加奥运会.

四. 外部比较

外部比较即与已有算法进行对比.

  1. 需要比较经典方案, 基准方案, 最先进的方案.
  2. 很多时候使用柱状图.
  3. 如果数据太多, 用表格就比图合适.
  4. 如果要把参数影响, 数据集大小影响也表现出来, 就只有用折线图.
  5. 最重要的比较放在最后.
  6. 要有足够的文字进行分析, 不能让读者自己去观察.
  7. 并不需要在所有数据集上击败其它方案.
  8. 在分析自己方案优势之余, 也应该分析它的劣势, 否则审稿人不干. 因为机器学习的基本规律就是 No free lunch, 即一个方案既然有优点, 就肯定有缺点. 既然有擅长的数据/指标, 也就有不擅长的数据/指标.
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-03 13:02:40  更:2021-12-03 13:03:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 2:14:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码