
不要再做凉皮炒奶茶了,在你成为“大厨”之前,比你优秀的人还在偷偷学习。本文将推荐9大在线课程,如果你对数据科学感兴趣,一定不要错过。

未来几年,市场对于“纸上数据科学家”(指代那些没有正式资格、但具有在日常工作分析数据的技能和知识的人)的需求将超过对传统数据科学家的需求。
这意味着,几乎任何人都可以通过学习数据科学基本理论和实践技能来提升自己的就业能力和职业前景。幸运的是,网上有大量资源可以帮助你做到这一点。
下面我将推荐其中一些课程。如果你在完成课程之后获得正式证书或者证明,有些可能是需要付费的。但是,学习资料面向想要提高数据知识和技能的任何人都是免费的。
1. Data Science Crash Course, John Hopkins University (Coursera)
学习地址:https://www.classcentral.com/course/data-science-crash-course-4392
该课程旨在告诉你数据科学是什么、原理是什么、可以用来做什么。课程介绍了数据科学技术,主要目的是让需要管理数据科学家或者数据科学人员的人了解“全局”。
这是一门相对较短的课程,仅包含一个模块,可以在一周之内完成,对于那些想要学习术语并了解如何构建数据科学策略而不必详细说明其中涉及的技术工具的人来说,是一个很好的入门选择。
2. Introduction to Data Science (Revised) - Alison
学习地址:https://alison.com/course/introduction-to-data-science-revised
这个课程是免费的,它将数据科学过程的核心主题和机器学习入门分为三个模块,每个模块大约需要3个小时完成,最后会进行评估。完成所有这些之后,你就可以从其他几个类似的课程中进行选择,这些课程涵盖了数据编程语言、可视化工具以及诸如建立聚类和回归模型之类的技术。
3. Data Science and Machine Learning Essentials – Microsoft (EdX)
学习地址:https://www.classcentral.com/course/edx-data-science-and-mac
该课程针对那些希望结合实践和理论知识来改善职业前景的人。课程介绍了核心概念和术语,诸如回归、聚类和分类之类的统计技术,以及构建和评估模型所需的实际步骤。
这是微软提供的课程,课程模块是基于微软Azure框架的,但是所讲授的概念同样适用于与AWS等微软竞争对手的云框架。如果你对R或Python(数据科学中最常用的两种编程语言)有基本的了解,那么你可以先考虑涵盖以下内容的其中一门课程,可能对你有用。
4. Learn Data Science - Dataquest
学习地址:https://www.dataquest.io/?utm_source=learndatasci
虽然Dataquest是一个提供专有内容的付费平台,但Dataquest为所有注册用户都提供了免费的入门模块,涵盖了如使用数据、可视化数据、挖掘数据、在Python和R中构造算法等基本主题。如果你想获得完整的、无广告的使用体验及认证,那么你可以选择每月订阅的方式,但事实上,免费版本就可以让你获得足够多的信息。
5. Data Science - Harvard
学习地址:http://cs109.github.io/2015/pages/videos.html
哈佛大学的这个数据科学课程所提供的所有课程材料和讲座都是可以在线免费获得的,因此你可以按照自己的进度来学习。你可能没有获得过这所全球最负盛名的大学的学位,但是这个课程足够详细、足够技术,能让你变身专家。该课程是数据科学学位学习内容的一部分,主要面向那些对编程、数学和统计学等核心领域有一定知识储备或者正在学习的学生。但是,这些主题有足够的免费资源,对于学术界以外的人来说,这是一个不错的选择。
6. Introduction to Data Science in Python – University of Michigan (Coursera)
学习地址:https://www.coursera.org/learn/python-data-analysis?ranMID=40328&ranEAID=SAyYsTvLiGQ&ranSiteID=SAyYsTvLiGQ-Bfo4LFjaYn4mTYUpc2eISQ&siteID=SAyYsTvLiGQ-Bfo4LFjaYn4mTYUpc2eISQ&utm_content=10&utm_medium=partners&utm_source=linkshare&utm_campaign=SAyYsTvLiGQ
想学习编程的人都知道,Python是该领域最常用的编程语言之一。这是有原因的,Python的基础知识相对简单,而且可以结合很多免费的开放源代码库使用,执行功能强大的数据科学操作。
该课程就是学习Python语言的第一步,主要介绍了用于准备和操作大型数据集的Python函数,以及从数据中提取见解的成熟技术。该课程预计需要4周时间完成,每周需要3到6个小时。
7. Learn Data Science with R – Ram Reddy (Coursera)
学习地址:https://www.udemy.com/course/datascience_with_r/
该课程是由一位经验丰富的R和数据分析专家主讲的,是有关专业R编程10个篇章中的第一篇,但也是独立一篇,是R语言的入门基础,与数据科学有关。
与Python一样,R是一种完全免费的开源语言和环境,由于其强大的功能和灵活性,R已成为数据科学家公认的标准。
本课程包含10个讲座,涉及8个小时的视频,完全免费的。
8. Introduction to Data Science Using Python - Rakesh Gopalakrishnan (Udemy)
学习地址:https://www.udemy.com/course/introduction-to-data-science-using-python/
这是Udemy关于Python数据科学和编程入门课程中评价最高的课程之一。该课程从基础开始,不需要具备任何先前的知识或者经验。但是,与其他一些入门级课程不同的是,它有一些使用Python的实践指导,其中Sci-Kit Learn框架特别有用,这是一种非常流行的学术级和企业级数据探索和挖掘工具。
9. I Heart Stats: Learning to Love Statistics – University of Notre Dame (EdX)
学习地址:https://www.classcentral.com/course/edx-i-heart-stats-learning-to-love-statistics-3048
与数学和计算机科学一样,统计学是那些从事数据科学和分析项目的人要学习的基本学术学科之一。如果你是个新手,那么该课程将提供非技术的基础知识,涵盖基础知识和一些高级原理和技术,帮助那些想要在数据科学领域站稳脚跟的人。
如果你想真正地理解数据科学,那么你会在某个时候遇到统计和概率问题,这肯定会让新手很困惑,特别是当你已经从大学毕业有一段时间,所学知识也记得不那么清楚了。所以,该课程介绍了如何使用统计方法来利用我们周边的一切信息。
潜心修炼,不断学习。期待疫情过后,每个人都能遇见不一样的自己。
好文章,需要你的鼓励
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。
英国国王学院研究团队开发了潜在精炼解码(LRD)技术,解决了AI文本生成中的速度与准确性平衡难题。该方法通过两阶段设计模仿人类思考过程:先让AI在连续空间中"深思熟虑",保持多种可能性的混合状态,然后"果断行动",逐步确定答案。实验显示,LRD在编程和数学推理任务中准确性提升最高6.3个百分点,生成速度提升最高10.6倍,为AI并行文本生成开辟了新路径。
清华大学团队开发的ViSurf是一种创新的大型视觉语言模型训练方法,巧妙融合了督导式学习和强化学习的优势。该方法通过将标准答案整合到强化学习过程中,让AI既能从正确答案中学习又能保持自主推理能力。实验显示ViSurf在多个视觉任务上显著超越传统方法,特别是在处理模型知识盲区时表现突出,同时有效避免了灾难性遗忘问题,为AI训练提供了更高效稳定的新范式。