6 Python:安装和环境配置
!只需安装:Anaconda + VScode。
- 直接使用 Anaconda 中的 Python 环境即可。
- 不要单独安装 Python 3.12 / 3.13。
对于初学者来讲,建议安装 Anaconda 套装。它是一个开源的 Python 发行版,集成了 Python 解释器、包管理器 Conda 和许多常用的科学计算和数据分析库(如 NumPy、Pandas、Matplotlib 等)。
虽然 Anaconda 自带的编辑器 Jupyter Notebook 很好用,但如果你平时经常用 VScode 写东西,建议安装 VScode 作为编辑器。VScode 支持多种编程语言,可以安装各种插件来增强功能。对于编写 Python 代码而言,仅需安装 python
和 jupyter
插件就可以满足基本需求。
网上有不少关于 Anaconda 和 VScode 的安装和配置的教程,如:
根据我的使用经验,基本步骤总结如下:
- 安装 Anaconda。注意勾选
Add Anaconda to my PATH environment variable
和Register Anaconda as my default Python 3.x
选项。 - 安装 VScode。随后安装
Python
,Jupyter
,Pylance
,gitHub Copilot
(或codeium
, 现在更名为windsurf Plugin
),Data Wrangler
插件。 - 新建项目文件夹。打开 VScode,新建一个文件夹,其下新建 data, code, output 等子文件夹,便于分类存放文档。
- 新建 Jupyter Notebook 文件。在主文件夹下新建
xxx.ipynb
文件,就可以开始编写代码了。
下面,我详细说明每个步骤的操作。
6.1 安装 Anaconda
对于多数用户,只需看 Step 1-2 即可。
下载 Anaconda(建议注册一个账号,若不注册,可以点击 Skip)。
安装 Anaconda。安装 Anaconda 最重要的事情:
Select Installation Type 页面,建议选择 Just Me,然后点击 Next。
Choose Install Location 页面,建议使用默认路径
C:\Users\用户名\Anaconda3
作为 Anaconda 的安装路径,这样可以避免一些潜在的权限和路径问题。然而, 如果你的用户名中包含中文字符或空格,建议选择「自定义路径」,并选择一个英文路径,如C:\myProgram\Anaconda3
。Advanced Installation Options 页面,确保同时勾选如下两个选项:
- [√]
Add Anaconda to my PATH environment variable
- [√]
Register Anaconda as my default Python 3.x
- [√]
详情参见:VSCode与Anaconda安装配置
安装完成后,打开 Anaconda Navigator(在开始菜单或应用程序中找到它)。
在 Anaconda Navigator 中,你可以创建和管理虚拟环境、安装包、启动 Jupyter Notebook 等。
安装完成后,打开 Anaconda Prompt(命令行界面),输入以下命令检查安装是否成功:
如果显示版本号,则表示安装成功。
在 Anaconda Prompt 中输入以下命令更新 Conda 到最新版本:
创建一个新的虚拟环境(可选):如果你想在一个独立的环境中工作,比如,你要同时使用 Python 3.8 和 Python 3.12,以便完成不同的项目,你可以创建一个新的虚拟环境。输入以下命令创建一个名为
myenv38
的虚拟环境,并安装 Python 3.8:同理,如果你想使用 Python 3.12,你可以创建一个名为
myenv312
的虚拟环境,并安装 Python 3.12:接下来,你可以激活特定的虚拟环境,比如 myenv38,输入以下命令:
此时,若执行
canda list
命令,你会看到当前环境中安装的所有包和版本信息;而执行canda install Stargazer, v = 2.1.1
,则会在当前环境中安装Stargazer
包的 2.1.1 版本。
6.2 安装 VScode
- 下载 VScode(选择适合你操作系统的版本)。
- 安装 VScode(双击下载的安装包,按照提示完成安装)。
- 安装完成后,打开 VScode。
- 在 VScode 中,你可以 安装各种插件 来增强功能,比如 Python、Jupyter 等。
6.2.1 建议安装的 VScode 插件
如果你不了解 VScode,可以先读一下 VScode编辑器。
有关插件的安装和使用,参见:VScode插件:安装、配置和使用
安装插件很容易:点击图中的
四个小方块
图标,在搜索框中填入插件名称,点击Install
即可。
6.2.1.1 Python 插件
- Python:必装,运行 Python 代码
- Jupyter:必装,运行 Jupyter Notebook 文件
- Pylance:代码补全和智能提示等功能
- Data Wrangler:表格呈现
- 编程助手 (选一个即可,否则可能会有冲突)
- GitHub Copilot (首月免费,后续每月 $10.0,使用 Visa 或 Master 信用卡付款)
- Codeium (Copilot 的替代品,Free,目前已经更名为
Windsurf Plugin
) - Cline / Cline Chinese (Copilot 的替代品,Free)
- 安装编程助手前,请确保能顺畅上网。
- 建议预先申请一个 GitHub 账号,使用 Copilot 时,可以用 GitHub 账号进行关联和登录。
- 我个人使用 Copilot,觉得效果还不错。Codeium 据说不错,甚至在 VScode 中的安装量比 Copilot 还要多。Cline 是最近新出的,大家也可以测试一下。
6.2.1.2 Markdown 插件
6.3 Jupyter Notebook 的使用
6.3.1 简介
- 这里介绍的 Jupyter Notebook 是指在 VScode 中使用的 Jupyter Notebook,而不是 Anaconda 自带的 Jupyter Notebook。VScode 中的 Jupyter Notebook 更加灵活和强大,支持多种编程语言和插件。
- 在 VScode 中安装了
Jupyter
插件后,就已经完成了 Jupyter Notebook 的安装和配置。
顾名思义,Jupyter Notebook 就是一个文本编辑器。如果你使用过 Stata,那么它类似于 Stata 的 Do 文件;如果你使用过 RStudio,那么它类似于 RStudio 的 R Markdown 文件。Jupyter Notebook 的一个重要特点就是它是一个交互式的计算环境,允许你在一个文档中编写和运行代码、可视化数据、撰写文本和公式等。
简言之,你可以把你的分析目的 (文本块),分析过程 (代码块),分析结果 (表格或图形) 都整合到一个文档中,形成一个完整的分析报告。
6.3.2 安装
在 VSCode 中使用 Jupyter Notebook,你需要安装以下软件:
- Python:Jupyter Notebook 是基于 Python 的,因此你需要安装 Python。你可以从 Python 官网 下载并安装最新版本的 Python。
- VSCode:你需要安装 Visual Studio Code。你可以从 VSCode 官网 下载并安装最新版本的 VSCode。
- Jupyter 扩展:在 VSCode 中使用 Jupyter Notebook,你需要安装 Jupyter 扩展。你可以在 VSCode 的扩展市场中搜索 “Jupyter” 并安装它。
- Python 扩展:你还需要安装 Python 扩展。你可以在 VSCode 的扩展市场中搜索 “Python” 并安装它。
6.3.3 新建项目文件结构
- 本地新建一个文件夹,如 D:/FinData/Proj_Maotai
- (推荐) 在该文件夹下新建如下几个子文件夹,用于分类存放文件
- [
./data
]:存放 .csv、.xlsx 等数据文件 - [
./doc
]:存放说明文档、报告等文件 - [
./codes
]:存放代码文件,包括自编函数、模块等 - [
./output
]:存放输出文件,包括图表、结果等 - 此外,建议在该文件夹下新建一个
README.md
文件,对项目进行说明 (如项目背景、目标、数据来源、程序的执行顺序和方法等)。
20250516012952 - [
6.3.3.1 新建 Jupyter Notebook 文件 (.ipynb)
- 打开 VScode,依次点击 文件 -> 打开文件夹,选择 D:/FinData/Proj_Maotai 文件夹。
- 右击该文件夹,选择 New File (亦可直接点击下图中的
New File
图标),新建一个文件,名称为data_clean.ipynb
。注意:一定要以.ipynb
结尾,否则无法用 Jupyter Notebook 打开,也无法添加 Python 代码块。- 你也可以使用命令行方式新建一个
.ipynb
文件:按快捷键Ctrl+Shift+P
>> 输入或选择Create: New Jupyter Notebook
会打开一个名为 Untitled-1.ipynb 的文件,输入内容后另存到目标文件夹即可。
- 你也可以使用命令行方式新建一个
完成上述设定后,VScode 的文件目录结构如下:
6.3.3.2 借助 AI 工具自动创建项目文档 (备选)
如果觉得手动创建文件夹麻烦,可以借助 ChatGPT 等 AI 工具,自动创建项目文档。下面是我编写的一个示例提示词 (你只需要指定目标文件夹路径即可,即使这个文件夹不存在也没有关系):
请帮我在 Windows 系统上为一个数据分析项目生成标准的项目结构。 项目的根目录是 D:/FinData/Proj_Maotai,请在该路径下创建以下结构:
D:/FinData/Proj_Maotai
├── codes # 用于存放脚本代码
├── data # 原始数据或处理后的数据
├── doc # 项目文档与说明资料
├── output # 图表、模型结果、分析报告等输出文件
├── README.md # 项目说明文件,简要介绍项目目的与结构
├── 01_data_clean.ipynb # 数据清洗与预处理
├── 02_EDA.ipynb # 探索性数据分析
└── 03_regression.ipynb # 回归分析与建模
请提供 Python 代码,以便我在写 Jupyter Notebook 中运行。 请确保必要的 .ipynb 文件和 README.md 都被自动生成。如果文件已存在,请保留原文件不覆盖。 你可以默认这些 .ipynb 文件为空白,也可以加一两行注释。
经过测试,ChatGPT 和 豆包生成的代码都可以一次性顺利执行:
6.3.3.3 采用插件创建项目模板
除了上述方法,你也可以在 VScode 中搜索 Project Templates
,安装对应的插件来创建项目模板。安装完成后,点击左侧的 Project Templates
图标,选择 Create New Project
,然后选择你需要的模板即可。
- 该插件提供了多种项目模板,包括数据分析、机器学习、Web 开发等,可以酌情选择。
- 该插件也支持自定义模板,具体操作请参考插件的说明文档。
不过,如果项目不是很复杂,建议还是手动创建项目文件夹,这样更灵活,也更容易管理。
6.3.4 使用 Jupyter Notebook
Step 1:选择解释器。初次打开 data_clean.ipynb
文件时,可能需要按下图方式设定 Python 解释器,以便随后用 python.exe 来运行新增的代码块。
Step 2:添加 Markdown 文本块。点击上图中的 + Markdown
按钮,添加一个 Markdown 文本块。可以用 Markdown 语法撰写文档说明。
- 预览:点击图中的
√
或按快捷键Esc
; - 编辑:在预览
双击鼠标
区可重新计入编辑模式。
Step 3a: 让 AI 自动生成代码(可选):如果你已经在 VScode 中安装了插件 Github Copilot
,可以点击图中的 Generate
按钮,输入提示词 (比如,生成随机数 x~N(0,1),N=100,绘制直方图+密度函数图, 英文标题
),敲回车,或点击下图中的右箭头,Copilot 会自动生成代码。如果代码块右下角显示的不是 python
,可以单击之,选择 python
,将次代码块标记为 Python 语言。
Step 3b: 自行添加代码块。点击上图中的 + Code
按钮,添加一个代码块。可以在代码块中输入 Python 代码。
- 运行代码块:点击上图中的
▶
按钮,或按快捷键Ctrl + Enter
;
Step 4: 修改和调试代码。你可以酌情修改代码。
- 若出现大量警告信息或程序无法运行,可以选中全部代码或被标注了红色波浪线代码,点击下图中的黄色星星按钮,选择
Fix using copilot
,多数情况下都能自动修复。 - 若相对可以正常运行的代码做一些优化,则可以选中代码后,点击黄色星星,选择
Modify using copilot
,然后输入提示词。
6.3.4.1 界面和主要功能
在上文中,为了突出重点,我没有让 VScode 编辑器全屏。事实上,全屏后,你会发现 Jupyter Notebook 提供了一组功能强大的工具栏和菜单栏,帮助你更好地编写和运行代码。下面是 Jupyter Notebook 的主要界面元素:
多数菜单的功能都是比较直观的,下面我简单介绍几个常用的功能:
View data
:查看数据和概要信息。注意:需要安装Data Wrangler
插件才具有此功能。...
:最右侧的三个点,点击后可以选择Export
,将当前 Notebook 导出为 PDF、HTML、Markdown 等格式;还有预览 (Preview) 等功能 (快捷键Esc
)。
6.3.5 在文档间复制 cell
6.3.6 单个 cell 的复制和粘贴
在 Jupyter Notebook 中,你可以通过以下方式在不同的 Notebook 文档之间复制 cell: 1. 打开源 Notebook 文档,选中要复制的 cell。 2. 使用快捷键 Ctrl+C
复制选中的 cell;亦可单击三个点图标,选择 Copy Cell
。 3. 打开目标 Notebook 文档,将光标定位到要粘贴的位置。 4. 使用快捷键 Ctrl+V
粘贴 cell;亦可单击三个点图标,选择 Paste Cell
。
6.3.6.1 多个 cell 的复制和粘贴
- 在 VS Code 的资源管理器(Explorer)中,分别打开需要操作的两个 Notebook 文件(如
A.ipynb
和B.ipynb
)。- 如需分屏显示,可拖动标签,将两个文档左右排列,方便拖拽和对比操作。
- 在源 Notebook(如 A.ipynb)中,按住 Ctrl(Mac 下为 Command)逐个点击左侧 cell 区域,可多选不连续的 cell;或先点击一个 cell,再按住 Shift 点击另一个 cell,选择一段连续的 cell。
- 多选后,cell 区域会高亮显示,表示已被选中。
- 按 Ctrl+C(Command+C)或右键点击选中区域,选择“Copy Cell”。
- 切换到目标 Notebook(如 B.ipynb),点击你希望插入的位置。
- 按 Ctrl+V(Command+V)或右键选择“Paste Cell”,即可将所有选中 cell 批量粘贴到目标位置。
6.4 导出和文档转换
在 VScode 中,你可以将 Jupyter Notebook 导出为多种格式,包括 HTML、PDF 和 Markdown。你可以在菜单栏中选择 文件 -> 导出为,然后选择你想要的格式。当然,还需要安装一些额外的工具来支持这些导出功能,主要包括 Pandoc 和 TeX Live。
6.4.1 安装 Pandoc(用于文档格式转换)
Jupyter 和 Quarto 在导出 Markdown、Word、PDF 时都会调用 Pandoc。
推荐安装方式(适用于 Anaconda 用户):
或者前往官网下载安装包(Windows/macOS/Linux 均支持): https://pandoc.org/install
安装完成后,你可以在终端中输入以下命令测试是否成功:
6.4.2 安装 TeX Live(用于导出 PDF)
Jupyter 和 Quarto 的 PDF 导出依赖 LaTeX 引擎,如 pdflatex
或 xelatex
。推荐安装完整版本的 TeX Live。
Windows 用户请访问官网下载器: https://tug.org/texlive/windows.html
安装过程中可选择 “完整版” 或 “Typical full installation”;
安装完成后,务必重启 VS Code 和终端;
然后在终端中测试:
6.4.3 如何打开终端?
很多初学者不清楚“在终端中输入命令”具体指什么。你可以按以下方式打开终端:
方式一(推荐): 在 VS Code 中按下快捷键
Ctrl + ~
(就是数字 1 左侧的波浪线),即可打开内置终端。方式二: 从系统菜单中打开:
- Windows:点击开始 → 输入
cmd
或Anaconda Prompt
或PowerShell
; - macOS:打开 Launchpad → 搜索「终端(Terminal)」;
- Linux:按下
Ctrl + Alt + T
打开终端窗口。
- Windows:点击开始 → 输入
终端窗口中,你可以输入如 conda install
、pandoc --version
等命令,按下回车运行。
6.4.4 安装完成后即可使用以下方式导出 PDF
在 VS Code 中点击右上角「导出(Export)」按钮;
或在终端中运行:
或使用 Quarto(如果你已安装):
完成上述安装和设定后,即可顺利将 Notebook 文档导出为 PDF、HTML、Word 等多种格式,满足教学、写作和发布的常见需求。
6.4.5 高阶用法:使用 Quarto 导出漂亮 PDF 或制作电子书网站
如果你希望导出的文档更美观、格式更统一,或者希望将多个 Jupyter Notebook 或 Markdown 文档整合成一个电子书(book)或教学网站(website),可以考虑使用 Quarto。
Quarto 是 RStudio 团队开发的下一代科学与技术出版平台,同时支持 .ipynb
、.qmd
、.md
文件的混合编写和发布。常见功能包括:
- 一键导出 排版美观的 PDF 文档(支持标题、目录、脚注、交叉引用、引用文献等);
- 创建结构化的电子书(Quarto Book),适合撰写讲义、教程和学术教材;
- 部署交互式教学网站(Quarto Website),可发布为静态网页托管在 GitHub Pages 上。
6.4.5.1 示例命令:
将 .ipynb
或 .qmd
导出为 PDF:
将多个文档组织为电子书结构(在 _quarto.yml
中设置章节):
6.4.5.2 安装方式:
可从官网下载安装:https://quarto.org/download
安装完成后,在终端中测试:
Quarto 完全兼容你现有的 VS Code 工作流,安装 Quarto 插件后即可直接在 VS Code 中预览、渲染和发布。对于希望构建专业文档的用户,Quarto 是目前最值得推荐的方案。