【美国名校线上科研】麻省理工学院数据科学与统计学专题项目
2024-11-22 17:42:31项目基本信息
专业类别
理工
参加形式
线上
适合人群
数据科学、数据处理、统计学、机器学习、深度学习等专业的大学生以上人群。
导师介绍
Mark
麻省理工学院终身正教授
Mark导师现任麻省理工学院(MIT)终身正教授,曾获素有“诺贝尔风向标”美誉的美国斯隆研究奖、国际最具声望的博士后奖励Hubble Fellow,并在多个年份获得Web of Science高被引学者称号。 Mark导师的研究兴趣聚焦机器学习、数据科学、人工智能、宇宙物理等,善于利用高性能超级计算机强大的数据处理能力进行数值模拟,训练机器学习和深度学习模型,借助机器学习与数据科学技术分析模拟数据。
项目背景
大数据的本质是海量的、多维度、多形式的数据。所以,在大数据面前,以往的数据处理方式无法快速、高效的达成既定目标,而人工智能技术借助机器学习与深度学习算法,更加灵活,并且可以根据不同的训练数据拥有自优化能力,从而使运算量显著增加。“人工智能”与“大数据”的完美结合将改变我们的日常生活,也即将成为各领域研究发展方向的变革工具。项目旨在介绍常用统计学、机器学习和数据科学理论,以及当下最受欢迎的Python编程语言,引导学生探讨不同的数据分析理论和实际应用,为高阶学习打下坚实基础。
项目大纲
一、麻省理工学院数据科学与统计学专题项目简介
致理计划:数据科学与统计学专题:回归模型与贝叶斯统计及Python数据处理方法综合研究【大学组】
参加后收获:学生将在项目结束时,自选框架和问题,使用Python开发数据分析应用,提交项目报告,进行成果展示。
二、麻省理工学院数据科学与统计学专题适合人群
适合年级 (Grade): 大学生及以上
适合专业 (Major): 数据科学、数据处理、统计学、机器学习、深度学习等专业的学生
学生需要具备线性代数及概率论与数理统计基础,至少会熟练使用一门编程语言并修读算法与数据结构,有过机器学习项目开发经验的申请者优先;建议预修专业基础课程:《Python编程与数据处理》、《机器学习的数学基础:线性代数》、《高等数学微积分与应用》、《概率论与数理统计基础》
建议选修: Python数据处理及其数学原理
三、麻省理工学院数据科学与统计学专题课程大纲
1、数据收集、表示及预处理方法 Dealing with Data: Data Representation; Data Collection and Management;
2、数据降维与聚类方法 Dimensionality Reduction including PCA, LDA, and Manifold Learning.Clustering including K-Means, K-Means++, and Hierarchical Clustering
3、回归模型与贝叶斯估计 Linear Regression and Bayesian Inference, Polynomial Regression
4、机器学习分类方法 Classification in General; K-Nearest Neighbors; Decision Trees; Probabilistic Model: Logistic Regression. Multi-class classification
5、学术研讨1:教授与各组学生探讨并评估个性化研究课题可行性,帮助学生明晰后续科研思路 Final Project Preparation Session I
6、学术研讨2:学生将在本周课前完成程序设计原型(prototype)及伪代码(Pseudocode),教授将根据各组进度进行个性化指导,确保学生优质的终期课题产出 Final Project Preparation Session II
7、项目成果展示 Final Presentation
8、论文辅导 Project Deliverables Tutoring
四、麻省理工学院数据科学与统计学专题时间安排
开始日期:2024-12-14;课时安排:7周在线小组科研学习+5周不限时论文指导学习
课时安排
12周时间安排
报名方式
项目收获
1、优秀学员获主导师Reference Letter
2、获得高质量的结业证书
3、增强数据科学及统计相关的背景竞争力
4、有效助力世界名校申请成功