| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 拥抱5G和AI时代:掌握Python,进军数据科学 - 数据分析和挖掘入门的一些总结和反思 -> 正文阅读 |
|
[人工智能]拥抱5G和AI时代:掌握Python,进军数据科学 - 数据分析和挖掘入门的一些总结和反思 |
本文价值在于梳理Python对于数据科学的作用以及入门分析,也提供了一系列的书目以及网站学习资源,给到我们整个学习流程的轮廓,还是不错的。正文如下: 您正在踏上数据科学之旅,每个人都建议您从学习如何编写代码开始。 原文参考:How to Master Python for Data Science 有添加和删减,酌情参考。 在本文中,我将作为您的向导,带领您探索掌握Python入门所需的基本知识。我将假设您以前没有编码经验,或者您可能来自非技术背景。但是,如果您具有技术或计算机科学背景,并且熟悉以前的编程语言,并且希望过渡到Python,那么您可以将本文作为高级概述来了解Python语言的要点。无论哪种方式,本文的目的都是引导您了解Python语言与数据科学的交叉点,这将帮助您快速入门。 1. 为什么选Python?您可能遇到的第一个(也是著名的)问题是:
在互联网上做了一些研究后,您可能会因为以下原因决定使用 Python:
2. Python 应用案例您可能会遇到的另一个问题是:
为了回答这个问题,让我们考虑如下所示的数据生命周期。本质上有5个主要步骤,包括数据收集、数据清洗、探索性数据分析、模型构建和模型部署。所有这些步骤都可以在 Python 中实现,一旦编码,生成的代码是可重用的,因此可以重新用于其他相关项目。 除了数据分析、数据科学和数据工程之外,Python 的强大多功能性使其可以应用于无限的可能性,包括自动化、机器人技术、网络开发、网络抓取、游戏开发和软件开发。此外,几乎所有我们能想到的领域都在使用 Python,包括但不限于航空航天、银行、商业、咨询、医疗保健、保险、零售和信息技术(请参阅 ActiveState 制作的数据表,关于Python 使用的前 10 名)案例)。 3. 学习 Python 的心态3.1. 你为什么学习 Python?弄清楚你为什么学习 Python 可能会帮助你在生活遇到障碍时保持动力。当然,保持一致性和良好的习惯,可能只能让你走到这一步。(你需要)有一个明确的学习理由,可能有助于激发你的动力并引导你回到正轨。 3.2. 不要害怕失败或犯错学习任何新的技术/技能的一个重要部分,是深入掌握学习方法。不要害怕失败或陷入困境,因为这些都是不可避免的。请记住,如果你没有被卡住,你就没有在学习!我一直喜欢通过犯尽可能多的错误来学习新事物,好处是学到的宝贵经验教训可用于第二次解决它。 3.3. 学习如何学习有大量的学习资源可用于学习 Python。根据与您产生共鸣的方法,选择能够最大限度地发挥您的学习潜力的方法。 3.3.1. 阅读如果您喜欢阅读,那么您可以从几本很棒的书籍和书面教程中学习 Python。 → Python Basics: A Practical Introduction to Python 3 在数据科学和机器学习的上下文中使用 Python 的一些好书如下: 以上链接都是亚马逊的,所以还是根据各人需要看看是否有翻译的中文版本 3.3.2. 视频也许您更像是一个视觉人士,然后有很多很棒的 YouTube 频道可以教授概念和实用教程。其中包括: 仅供参考,国内也有很多课程,不需要翻过去看。 3.3.3. 项目 3.4. 从遵循编码教程转变为实施您自己的项目能够成功地遵循教程和能够从头开始实施自己的项目是两件不同的事情。当然,对于前者,您可以成功地遵循本教程的每个步骤,但是当您必须自己弄清楚使用哪种方法或使用哪些库/函数时,您可能会屈服于挑战并陷入困境。 3.5. 学习解决问题答案很简单。你必须开始做项目。多多益善。随着您从许多项目中积累经验,您将获得与问题解决和问题框架相关的技能。 要开始,请按照以下过程操作:
如果您对该主题充满热情或激起您的兴趣,您可能还会发现该项目更具吸引力。环顾四周,您对哪些主题感兴趣,并想一想您想了解更多。例如,如果您是 YouTube 内容创作者,您可能会发现分析您的内容的表现(例如观看次数、观看时间、观看时间、视频点击率等)很有趣。 3.6. 不要重新发明轮子您应该熟悉使用 Python 函数来执行各种任务。简而言之,在PyPI、conda或GitHub 上提供的数千个 Python 库预先配备了广泛的功能,您可以立即使用。 3.7. 学习新库应该注意的是,如果您熟悉一个库,您也可能会选择其他相关库。例如,如果您已经熟悉 using matplotlib, usingseaborn或plotly应该很容易学习和实现,因为基础已经就位。与深度学习库(例如tensorflow、torch、fastai和mxnet)类似。 3.8. 调试和寻求帮助当您对项目进行编码并且您的代码抛出错误时,因此您必须学习如何调试代码和解决问题。但是,如果错误超出了您的理解范围,那么您知道如何寻求帮助就非常重要。 你应该问的第一个人是你自己。是的,我知道您可能想知道这将如何运作,因为您现在一无所知。通过问自己,我的意思是你首先尝试自己解决问题,然后再向他人寻求帮助。这很重要,因为它可以显示您的性格和毅力。 那么您究竟如何调试代码和解决问题。 仔细阅读输出,因为错误的原因明确写在输出中。有时,即使是最简单的错误也可能让我们忘记安装一些库或忘记在使用之前先定义变量。 如果你仍然一无所知,现在是时候开始谷歌搜索了。因此,您现在必须学习如何掌握提出正确问题的艺术。如果您使用不相关的关键字询问 Google,您可能在搜索结果中找不到任何有用的答案。最简单的方法是包含与问题相关的关键字。 在搜索查询中,我会使用以下作为关键字
是的,基本上就是这样。但是,假设我只想将我的搜索限制在 Stack Overflow,我将site:stackoverflow.com在搜索查询中作为附加语句添加。或者,您可以前往 Stack Overflow 并在那里执行搜索。 3.9 一致性和问责制在任何学习之旅中反复出现的主题是养成学习习惯,这将帮助您在学习之旅中保持一致。始终如一的编码将使您的动力付诸行动,您使用它的次数越多,您就会变得越熟练。俗话说:
由Ken Jee发起的66 天数据计划是培养良好学习习惯、保持一致性和对学习负责的好方法。参与这项计划非常简单:
有点类似于立flag打卡的味道? 4. Python 编码环境4.1. 集成开发环境集成开发环境 (IDE) 可以被认为是存放代码的工作空间,不仅如此,它还提供额外的便利和便利,可以增强您的编码过程。 4.2. Jupyter 笔记本Jupyter笔记本可以在本地安装到您选择的任何操作系统(即无论是在Windows,Linux或Mac OSX),通过pip或conda。 Jupyter 的其他风格是 Jupyterlab,它还为更大和更复杂的项目提供工作区和类似 IDE 的环境。 Jupyter Notebook 的云异常是所有有抱负和实践的数据科学家的福音,因为它使每个人都可以访问强大的计算资源(即CPU 和 GPU 计算)。 这里省略了一些废话 4.3. 有用的插件代码建议和完成插件(例如Kite提供的插件)为加快编码过程提供了巨大的支持,因为它有助于建议完成代码行。这会派上用场,尤其是当您必须长时间坐着进行编码时。在这里和那里保存的几秒钟可能会随着时间的推移急剧累积。这种代码建议也可以兼作教育或强化工具(即有时我们的思想会因长时间的编码而陷入困境),因为它可能会根据我们编写的代码的上下文建议某些代码块。 5. Python 基础在本节中,我们将介绍开始使用 Python 所需了解的最低限度。
6. 用于数据科学的 Python 库数据处理-pandas是处理常见数据格式的首选库,用于处理一维Series(即可以被认为是 a 的单个列DataFrame)或二维DataFrames(即常见的表格数据集)。
7. 编写漂亮的 Python 代码2001 年,Guido van Rossum、Barry Warsaw 和 Nick Coghlan 发布了一份文档,该文档建立了一套编写 Python 代码的指南和最佳实践,称为PEP8。特别是,PEP 是 Python Enhancement Proposal 的代名词,PEP8 只是发布的众多文档之一。PEP 8 的主要目标是提高 Python 代码的可读性和一致性。
因此,编写可读的代码就像提前投资它,因为它要么被你未来的自己阅读,要么被其他人阅读。我经常遇到的一个常见情况是我自己或我的同事编写的代码文档很差,但幸运的是我们多年来有所改进。 9. 练习你新发现的 Python 技能做填字游戏或数独是很好的心理练习,为什么不做同样的事情来测试您的 Python 技能?Leetcode和HackerRank等平台可帮助您学习和练习数据结构和算法,并为技术面试做好准备。数据科学领域的其他类似平台是Interview Query和StrataScratch。 10. 分享你的知识由于程序员经常依赖橡皮鸭作为教学工具,他们会尝试向他们解释他们的问题,并且这样做可以让他们获得观点,并且经常找到解决这些问题的方法。
11. 为开源项目做贡献为开源项目做贡献有很多好处。首先,您将能够向该领域的其他专家学习,并从审查其他人的代码中学习(即通过审查问题和拉取请求)。。
第三,随着您获得社区和同行的认可,您将能够与社区中的其他人建立联系。您还将对自己的编码能力更有信心。谁知道呢,也许您甚至会创建自己的开源项目! 第四,因为开源项目依赖于自愿贡献的开发人员,所以你要付出代价。为更大的利益做出贡献也可能让您感到满意,因为您正在对社区产生影响。 贡献并不意味着您必须为项目创建一个大而复杂的增强。您可以首先纠正您可能遇到的一个小错误,这应该会使势头滚动。 一个额外的好处是,当您修复代码时,您还可以提高您的编码和文档技能(即编写可读和可维护的代码)。此外,由此带来的挑战和责任也可能有助于您继续参与编码。 结论总之,本文探讨了 Python 应用于数据科学的前景。作为一名自学成才的程序员,我知道不仅要学习编码,还要应用它来解决数据问题是多么困难。旅程并不容易,但如果你能坚持下去,你会惊讶于在你的数据科学之旅中使用 Python 可以做多少事情。 我希望本文提供了一些起点,您可以在开始学习之旅时使用这些起点进行调整。请发表评论以提出适合您的任何观点! |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/11 0:38:59- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |