教材简介
本课程使用的教材是 An Introduction to Statistical Learning with Applications in Python(简称 ISLP)。
- 这是统计学习领域最经典的入门教材之一
- 内容涵盖:线性回归、分类、重采样、正则化、树模型、支持向量机、深度学习、生存分析、无监督学习等
- 教材中有大量可运行的Python代码,是学习的核心资源
课程哲学:Learning by Doing
本课程的核心理念是 “Learning by Doing” ——在实践中学习。
- 教材包含大量可运行的练习代码
- 你可能会被数学公式吓到——不要害怕!
- 我们的重点是应用,不是推导
- 当你亲手运行并测试那些代码时,你会有安全感
理论是骨架,代码是血肉。只看公式,概念是空洞的;当你运行代码看到结果时,一切就会变得具体而清晰。
云平台:为什么使用云环境?
我们将使用云端Python环境,而非在本地安装软件。
核心优势:
- 零配置: 无需在个人电脑上安装Python、Anaconda或各种库
- 标准化: 所有人运行完全相同的环境,老师能运行的代码你也能运行
- 便捷性: 通过浏览器即可编程(Windows、Mac、iPad均可)
- 专注学习: 把时间花在学习统计学习上,而不是调试本地环境问题
主平台:腾讯Cloud Studio
网址: cloudstudio.net
- 定义: 基于浏览器的集成开发环境(IDE),由腾讯云支持
- 界面: 外观和操作方式与 Visual Studio Code (VS Code) 完全一致
- 功能:
- 编写Python脚本(
.py)
- 运行交互式Jupyter Notebook(
.ipynb)
- 管理项目文件和数据集
⚠️ 重要提醒: 云平台需要实名认证,请提前完成。
Cloud Studio的核心特性
为什么选择腾讯Cloud Studio作为本课程的主平台?
- 预配置环境: 选择”Python”模板即可开始编程,无需手动安装
pandas、numpy、scipy 等
- GitHub集成: 可以无缝克隆课程代码仓库并提交作业
- 免费算力: 提供足够的免费云计算资源(CPU/RAM),满足本课程的数据分析需求
备用平台:阿里ModelScope
网址: modelscope.cn
作为数据分析人员,我们始终需要备用方案。
- 定义: 阿里巴巴的模型即服务(MaaS)平台,主要面向AI和开源社区
- 核心功能: 提供免费、强大的 Jupyter Notebook环境
- 使用时机:
- Cloud Studio出现维护时
- 需要运行计算密集型统计模型或机器学习算法时
平台对比
| 界面 |
VS Code(IDE) |
Jupyter Notebook |
| 适用场景 |
完整项目管理、编程 |
快速数据分析、ML |
| 学习门槛 |
中等(VS Code标准) |
低(标准Notebook) |
| 课程定位 |
主平台 |
备用 / 高级计算 |
微助教平台
课程的课堂互动、考勤考纪都通过微助教平台进行。
平台网址: teachermate.com.cn
使用要求:
- 需要微信(WeChat)账号才能使用
- 请在课前扫码加入本课程
课堂互动形式:
- 每章设有 4道测试题(2道单选题 + 2道是非判断题)
- 测试题需在课堂上现场完成
课程评价体系
本课程采用百分制,由平时成绩和期末成绩组合而成。
| 平时成绩 |
50% |
实验报告、课程互动(微助教答题)、考勤考纪 |
| 期末成绩 |
50% |
小组分析报告 |
期末报告要求:
- 2人一组
- 利用课程讲授的方法分析中国上市公司数据
- 需体现对统计学习方法的理解与实际应用
AI使用政策
本课程鼓励使用AI工具。
- 你可以使用 ChatGPT、GitHub Copilot 等AI工具辅助学习和编程
- AI是提升效率的工具,但理解原理仍然是核心
- 期末报告中使用AI辅助是允许的,但需要注明AI使用情况
课前作业
在下次上课前,请完成以下步骤:
- 注册Cloud Studio: 访问 cloudstudio.net 创建账号并完成实名认证
- 创建工作区: 使用 Python 模板创建新工作区
- 测试环境:
- 创建文件
test.ipynb
- 输入:
print('统计学习,准备就绪!')
- 运行该单元格
- 注册备用平台: 访问 modelscope.cn 创建账号
- 加入微助教: 使用微信扫码加入本课程