基本概念概览
机器学习的目标是使学得的模型能很好地适用于"新样本",而不是仅仅在训练样本上工作得很好;即便对聚类这样的无监督学习任务,我们也希望学得的簇划分能适用于没在训练集中出现的样本 样本空间的计算:20个属性,10条示例,样本空间为10^20
阅读材料: 第一本机器学习专门性教材:Mitchell, T. (1997). Machine Learning. Mc Graw Hill, New York, NY 出色的入门读物:Duda,R.O.,P.E.Hart,and D.G.Stork.(2001). Pattern Classification,2nd edition. John Wiley & Sons,New York,NY. ; 2)Alpaydin,E.(2004). Introduction to Machine Learning. MITPress, Cambridge,MA.; 3)Flach,P. (2012).Machine Learning: The Art and Science of Alorithms that Make Sense of Data. Cambridge University Press, Cambridge, UK 进阶读物Hastie,T.,R.Tibshirani,and J.Friedman.(2009).The Elements of StatisticalLearning,2nd edition. Springer,New York,NY 贝叶斯学习偏好者:Bishop,C.M. (2006).Pattern Recognition and Machine Learning. Springer, New York,NY. 理论偏好者Shalev-Shwartz,S.and S.Ben-David.(2014).Understanding Machine Learning. Cambridge University Press, Cambridge, UK. 基于WEKA撰写的入门读物,有助于初学者通过WEKA实践快速掌握常用机器学习算法Witten,I.H,E.Frank,and M.A.Hall.(2011).Data Mining:Practical Machine Learing Tools and Techniques,3rdedition.Elsevier,Burlington,MA WEKA是著名的免费机器学习算法程序库,http://www.cs.waikato. ac.nz/ml/weka 《机器学习∶一种人工智能途径》Michalski,R.S.,J.G.Carbonell, and T.M. Mitchell, eds.(1983).Machine Learning: An Artificial Intelligence Approach.Tioga,Palo Alto,CA 《人工智能手册》系列是图灵奖得主E.A.Feigenbaum与不同学者合作编写而成,该书第三卷【CohenandFeigenbaum,1983】对机器学习进行了讨论,是机器学习早期的重要文献 树结构研究:1)Hunt,E.G.and D.I.Hovland.(1963)."Programming a model of human concept formation."In Computers and Thought(E.Feigenbaum and J.Feldman,eds.),310-325,McGraw Hill,New York,NY…2)Winston,P.H.(1970)."Learning structural descriptions from examples."Technical Report AI-TR-231,AI Lab,MT, Cambridge,MA 版本空间: Mitchell,T.M. (1977)."Version spaces:A candidate elimination approach to rule learning."In Proceedings of the 5th International Joint Conference on Artificial Inteligence(IJCAI),305-310, Cambridge 假设空间:Simon,H.A. and G.Lea.(1974). "Problem solving and rule induction:A unified view."In Knouledge and Cognition(L.W.Gregg,ed.),105-127, Erlbaum, New York,NY 迁移学习:Pan,S.J.and Q.Yang.(2010)."A survey of transfer learning."IEEE Thansactions on Knouledge and Data Engineering,22(10):1345-1359
机器学习领域最重要的国际学术会议:国际机器学习会议(ICML)、国际 神经信息处理系统会议((NIPS)和国际学习理论会议(COLT),重要的区域性会 议主要有欧洲机器学习会议(ECML)和亚洲机器学习会议(ACML);最重要的 国际学术期刊是Journal of Machine Learning Research和Machine Learning. 人工智能领域的重要会议如JCAlI、AAAI以及重要期刊如ArtificialIntelgence、Journal of ArtificialInteligence Research,数据挖掘领域的重要会议 如KDD、ICDM以及重要期刊如ACMTransactions on Knouledge Discovery from Data、Data Mining andKnouledge Discovery,计算机视觉与模式识别域的重要会议如CVPR以及重要期刊如IEEE Transactions onPattern Analysis and Machine Intelligence,神经网络领域的重要期刊如Neural Computation、IEEE Transactions on Neural Netuorks and Learning Systems 等 也经常发表机器学习方面的论文.此外,统计学领域的重要期刊如Annals of Statistics等也常有关于统计学习方面的理论文章发表. 国内学术会议:中国机器学习大会(CCML)以及每年举行的"机器学习及其应用"研讨 会(MLA);很多学
|