6  Python:安装和环境配置

Important

只需安装:Anaconda + VScode。

  • 直接使用 Anaconda 中的 Python 环境即可。
  • 不要单独安装 Python 3.12 / 3.13。


对于初学者来讲,建议安装 Anaconda 套装。它是一个开源的 Python 发行版,集成了 Python 解释器、包管理器 Conda 和许多常用的科学计算和数据分析库(如 NumPy、Pandas、Matplotlib 等)。

虽然 Anaconda 自带的编辑器 Jupyter Notebook 很好用,但如果你平时经常用 VScode 写东西,建议安装 VScode 作为编辑器。VScode 支持多种编程语言,可以安装各种插件来增强功能。对于编写 Python 代码而言,仅需安装 pythonjupyter 插件就可以满足基本需求。

网上有不少关于 Anaconda 和 VScode 的安装和配置的教程,如:

根据我的使用经验,基本步骤总结如下:

  1. 安装 Anaconda。注意勾选 Add Anaconda to my PATH environment variableRegister Anaconda as my default Python 3.x 选项。
  2. 安装 VScode。随后安装 Python, Jupyter, Pylance, gitHub Copilot (或 codeium, 现在更名为 windsurf Plugin), Data Wrangler 插件。
  3. 新建项目文件夹。打开 VScode,新建一个文件夹,其下新建 data, code, output 等子文件夹,便于分类存放文档。
  4. 新建 Jupyter Notebook 文件。在主文件夹下新建 xxx.ipynb 文件,就可以开始编写代码了。

下面,我详细说明每个步骤的操作。

6.1 安装 Anaconda

Note

对于多数用户,只需看 Step 1-2 即可。

  1. 下载 Anaconda(建议注册一个账号,若不注册,可以点击 Skip)。

  2. 安装 Anaconda。安装 Anaconda 最重要的事情:

    • Select Installation Type 页面,建议选择 Just Me,然后点击 Next

    • Choose Install Location 页面,建议使用默认路径 C:\Users\用户名\Anaconda3 作为 Anaconda 的安装路径,这样可以避免一些潜在的权限和路径问题。然而, 如果你的用户名中包含中文字符或空格,建议选择「自定义路径」,并选择一个英文路径,如 C:\myProgram\Anaconda3

    • Advanced Installation Options 页面,确保同时勾选如下两个选项:

      • [√] Add Anaconda to my PATH environment variable
      • [√] Register Anaconda as my default Python 3.x

    • 详情参见:VSCode与Anaconda安装配置

  3. 安装完成后,打开 Anaconda Navigator(在开始菜单或应用程序中找到它)。

  4. 在 Anaconda Navigator 中,你可以创建和管理虚拟环境、安装包、启动 Jupyter Notebook 等。

  5. 安装完成后,打开 Anaconda Prompt(命令行界面),输入以下命令检查安装是否成功:

    conda --version

    如果显示版本号,则表示安装成功。

  6. 在 Anaconda Prompt 中输入以下命令更新 Conda 到最新版本:

    conda update conda
  7. 创建一个新的虚拟环境(可选):如果你想在一个独立的环境中工作,比如,你要同时使用 Python 3.8 和 Python 3.12,以便完成不同的项目,你可以创建一个新的虚拟环境。输入以下命令创建一个名为 myenv38 的虚拟环境,并安装 Python 3.8:

    conda create --name myenv38 python=3.8

    同理,如果你想使用 Python 3.12,你可以创建一个名为 myenv312 的虚拟环境,并安装 Python 3.12:

    conda create --name myenv312 python=3.12

    接下来,你可以激活特定的虚拟环境,比如 myenv38,输入以下命令:

    conda activate myenv38

    此时,若执行 canda list 命令,你会看到当前环境中安装的所有包和版本信息;而执行 canda install Stargazer, v = 2.1.1,则会在当前环境中安装 Stargazer 包的 2.1.1 版本。

6.2 安装 VScode

  1. 下载 VScode(选择适合你操作系统的版本)。
  2. 安装 VScode(双击下载的安装包,按照提示完成安装)。
  3. 安装完成后,打开 VScode。
  4. 在 VScode 中,你可以 安装各种插件 来增强功能,比如 Python、Jupyter 等。

6.2.1 建议安装的 VScode 插件

  • 如果你不了解 VScode,可以先读一下 VScode编辑器

  • 有关插件的安装和使用,参见:VScode插件:安装、配置和使用

  • 安装插件很容易:点击图中的 四个小方块 图标,在搜索框中填入插件名称,点击 Install 即可。

6.2.1.1 Python 插件

VScode:实用 Python 插件清单

  • Python:必装,运行 Python 代码
  • Jupyter:必装,运行 Jupyter Notebook 文件
  • Pylance:代码补全和智能提示等功能
  • Data Wrangler:表格呈现
  • 编程助手 (选一个即可,否则可能会有冲突)
    • GitHub Copilot (首月免费,后续每月 $10.0,使用 Visa 或 Master 信用卡付款)
    • Codeium (Copilot 的替代品,Free,目前已经更名为 Windsurf Plugin)
    • Cline / Cline Chinese (Copilot 的替代品,Free)
Note
  1. 安装编程助手前,请确保能顺畅上网。
  2. 建议预先申请一个 GitHub 账号,使用 Copilot 时,可以用 GitHub 账号进行关联和登录。
  3. 我个人使用 Copilot,觉得效果还不错。Codeium 据说不错,甚至在 VScode 中的安装量比 Copilot 还要多。Cline 是最近新出的,大家也可以测试一下。

6.2.1.2 Markdown 插件

VScode:实用 Markdown 插件推荐

6.3 Jupyter Notebook 的使用

6.3.1 简介

Note
  1. 这里介绍的 Jupyter Notebook 是指在 VScode 中使用的 Jupyter Notebook,而不是 Anaconda 自带的 Jupyter Notebook。VScode 中的 Jupyter Notebook 更加灵活和强大,支持多种编程语言和插件。
  2. 在 VScode 中安装了 Jupyter 插件后,就已经完成了 Jupyter Notebook 的安装和配置。

顾名思义,Jupyter Notebook 就是一个文本编辑器。如果你使用过 Stata,那么它类似于 Stata 的 Do 文件;如果你使用过 RStudio,那么它类似于 RStudio 的 R Markdown 文件。Jupyter Notebook 的一个重要特点就是它是一个交互式的计算环境,允许你在一个文档中编写和运行代码、可视化数据、撰写文本和公式等。

简言之,你可以把你的分析目的 (文本块),分析过程 (代码块),分析结果 (表格或图形) 都整合到一个文档中,形成一个完整的分析报告。

6.3.2 安装

在 VSCode 中使用 Jupyter Notebook,你需要安装以下软件:

  • Python:Jupyter Notebook 是基于 Python 的,因此你需要安装 Python。你可以从 Python 官网 下载并安装最新版本的 Python。
  • VSCode:你需要安装 Visual Studio Code。你可以从 VSCode 官网 下载并安装最新版本的 VSCode。
  • Jupyter 扩展:在 VSCode 中使用 Jupyter Notebook,你需要安装 Jupyter 扩展。你可以在 VSCode 的扩展市场中搜索 “Jupyter” 并安装它。
  • Python 扩展:你还需要安装 Python 扩展。你可以在 VSCode 的扩展市场中搜索 “Python” 并安装它。

6.3.3 新建项目文件结构

  • 本地新建一个文件夹,如 D:/FinData/Proj_Maotai
  • (推荐) 在该文件夹下新建如下几个子文件夹,用于分类存放文件
    • [./data]:存放 .csv、.xlsx 等数据文件
    • [./doc]:存放说明文档、报告等文件
    • [./codes]:存放代码文件,包括自编函数、模块等
    • [./output]:存放输出文件,包括图表、结果等
    • 此外,建议在该文件夹下新建一个 README.md 文件,对项目进行说明 (如项目背景、目标、数据来源、程序的执行顺序和方法等)。

    20250516012952

6.3.3.1 新建 Jupyter Notebook 文件 (.ipynb)

  • 打开 VScode,依次点击 文件 -> 打开文件夹,选择 D:/FinData/Proj_Maotai 文件夹。
  • 右击该文件夹,选择 New File (亦可直接点击下图中的 New File 图标),新建一个文件,名称为 data_clean.ipynb。注意:一定要以 .ipynb 结尾,否则无法用 Jupyter Notebook 打开,也无法添加 Python 代码块。
    • 你也可以使用命令行方式新建一个 .ipynb 文件:按快捷键 Ctrl+Shift+P >> 输入或选择 Create: New Jupyter Notebook 会打开一个名为 Untitled-1.ipynb 的文件,输入内容后另存到目标文件夹即可。

完成上述设定后,VScode 的文件目录结构如下:

# 目录结构
D:/FinData/Proj_Maotai
├── codes
├── data
├── doc
├── output
├── README.md
└── data_clean.ipynb

6.3.3.2 借助 AI 工具自动创建项目文档 (备选)

ChatGPT 对话过程

如果觉得手动创建文件夹麻烦,可以借助 ChatGPT 等 AI 工具,自动创建项目文档。下面是我编写的一个示例提示词 (你只需要指定目标文件夹路径即可,即使这个文件夹不存在也没有关系):

请帮我在 Windows 系统上为一个数据分析项目生成标准的项目结构。 项目的根目录是 D:/FinData/Proj_Maotai,请在该路径下创建以下结构:

D:/FinData/Proj_Maotai
├── codes             # 用于存放脚本代码
├── data              # 原始数据或处理后的数据
├── doc               # 项目文档与说明资料
├── output            # 图表、模型结果、分析报告等输出文件
├── README.md         # 项目说明文件,简要介绍项目目的与结构
├── 01_data_clean.ipynb       # 数据清洗与预处理
├── 02_EDA.ipynb              # 探索性数据分析
└── 03_regression.ipynb       # 回归分析与建模

请提供 Python 代码,以便我在写 Jupyter Notebook 中运行。 请确保必要的 .ipynb 文件和 README.md 都被自动生成。如果文件已存在,请保留原文件不覆盖。 你可以默认这些 .ipynb 文件为空白,也可以加一两行注释。

经过测试,ChatGPT 和 豆包生成的代码都可以一次性顺利执行:

6.3.3.3 采用插件创建项目模板

除了上述方法,你也可以在 VScode 中搜索 Project Templates,安装对应的插件来创建项目模板。安装完成后,点击左侧的 Project Templates 图标,选择 Create New Project,然后选择你需要的模板即可。

  • 该插件提供了多种项目模板,包括数据分析、机器学习、Web 开发等,可以酌情选择。
  • 该插件也支持自定义模板,具体操作请参考插件的说明文档。

不过,如果项目不是很复杂,建议还是手动创建项目文件夹,这样更灵活,也更容易管理。

6.3.4 使用 Jupyter Notebook

Step 1选择解释器。初次打开 data_clean.ipynb 文件时,可能需要按下图方式设定 Python 解释器,以便随后用 python.exe 来运行新增的代码块。

Step 2添加 Markdown 文本块。点击上图中的 + Markdown 按钮,添加一个 Markdown 文本块。可以用 Markdown 语法撰写文档说明。

  • 预览:点击图中的 或按快捷键 Esc
  • 编辑:在预览 双击鼠标 区可重新计入编辑模式。

Step 3a: 让 AI 自动生成代码(可选):如果你已经在 VScode 中安装了插件 Github Copilot,可以点击图中的 Generate 按钮,输入提示词 (比如,生成随机数 x~N(0,1),N=100,绘制直方图+密度函数图, 英文标题),敲回车,或点击下图中的右箭头,Copilot 会自动生成代码。如果代码块右下角显示的不是 python,可以单击之,选择 python,将次代码块标记为 Python 语言。

Step 3b: 自行添加代码块。点击上图中的 + Code 按钮,添加一个代码块。可以在代码块中输入 Python 代码。

  • 运行代码块:点击上图中的 按钮,或按快捷键 Ctrl + Enter

Step 4: 修改和调试代码。你可以酌情修改代码。

  • 若出现大量警告信息或程序无法运行,可以选中全部代码或被标注了红色波浪线代码,点击下图中的黄色星星按钮,选择 Fix using copilot,多数情况下都能自动修复。
  • 若相对可以正常运行的代码做一些优化,则可以选中代码后,点击黄色星星,选择 Modify using copilot,然后输入提示词。

20250516021357

6.3.4.1 界面和主要功能

在上文中,为了突出重点,我没有让 VScode 编辑器全屏。事实上,全屏后,你会发现 Jupyter Notebook 提供了一组功能强大的工具栏和菜单栏,帮助你更好地编写和运行代码。下面是 Jupyter Notebook 的主要界面元素:

多数菜单的功能都是比较直观的,下面我简单介绍几个常用的功能:

  • View data:查看数据和概要信息。注意:需要安装 Data Wrangler 插件才具有此功能。
  • ...:最右侧的三个点,点击后可以选择 Export,将当前 Notebook 导出为 PDF、HTML、Markdown 等格式;还有预览 (Preview) 等功能 (快捷键 Esc)。

6.3.5 在文档间复制 cell

6.3.6 单个 cell 的复制和粘贴

在 Jupyter Notebook 中,你可以通过以下方式在不同的 Notebook 文档之间复制 cell: 1. 打开源 Notebook 文档,选中要复制的 cell。 2. 使用快捷键 Ctrl+C 复制选中的 cell;亦可单击三个点图标,选择 Copy Cell。 3. 打开目标 Notebook 文档,将光标定位到要粘贴的位置。 4. 使用快捷键 Ctrl+V 粘贴 cell;亦可单击三个点图标,选择 Paste Cell

6.3.6.1 多个 cell 的复制和粘贴

  • 在 VS Code 的资源管理器(Explorer)中,分别打开需要操作的两个 Notebook 文件(如 A.ipynbB.ipynb)。
    • 如需分屏显示,可拖动标签,将两个文档左右排列,方便拖拽和对比操作。
  • 在源 Notebook(如 A.ipynb)中,按住 Ctrl(Mac 下为 Command)逐个点击左侧 cell 区域,可多选不连续的 cell;或先点击一个 cell,再按住 Shift 点击另一个 cell,选择一段连续的 cell。
    • 多选后,cell 区域会高亮显示,表示已被选中。
  • 按 Ctrl+C(Command+C)或右键点击选中区域,选择“Copy Cell”。
  • 切换到目标 Notebook(如 B.ipynb),点击你希望插入的位置。
  • 按 Ctrl+V(Command+V)或右键选择“Paste Cell”,即可将所有选中 cell 批量粘贴到目标位置。

6.4 导出和文档转换

在 VScode 中,你可以将 Jupyter Notebook 导出为多种格式,包括 HTML、PDF 和 Markdown。你可以在菜单栏中选择 文件 -> 导出为,然后选择你想要的格式。当然,还需要安装一些额外的工具来支持这些导出功能,主要包括 Pandoc 和 TeX Live。

6.4.1 安装 Pandoc(用于文档格式转换)

Jupyter 和 Quarto 在导出 Markdown、Word、PDF 时都会调用 Pandoc。

  • 推荐安装方式(适用于 Anaconda 用户)

    conda install -c conda-forge pandoc
  • 或者前往官网下载安装包(Windows/macOS/Linux 均支持): https://pandoc.org/install

  • 安装完成后,你可以在终端中输入以下命令测试是否成功

    pandoc --version

6.4.2 安装 TeX Live(用于导出 PDF)

Jupyter 和 Quarto 的 PDF 导出依赖 LaTeX 引擎,如 pdflatexxelatex。推荐安装完整版本的 TeX Live。

  • Windows 用户请访问官网下载器: https://tug.org/texlive/windows.html

  • 安装过程中可选择 “完整版” 或 “Typical full installation”;

  • 安装完成后,务必重启 VS Code 和终端

  • 然后在终端中测试:

    pdflatex --version

6.4.3 如何打开终端?

很多初学者不清楚“在终端中输入命令”具体指什么。你可以按以下方式打开终端:

  • 方式一(推荐): 在 VS Code 中按下快捷键 Ctrl + ~(就是数字 1 左侧的波浪线),即可打开内置终端。

  • 方式二: 从系统菜单中打开:

    • Windows:点击开始 → 输入 cmdAnaconda PromptPowerShell
    • macOS:打开 Launchpad → 搜索「终端(Terminal)」;
    • Linux:按下 Ctrl + Alt + T 打开终端窗口。

终端窗口中,你可以输入如 conda installpandoc --version 等命令,按下回车运行。

6.4.4 安装完成后即可使用以下方式导出 PDF

  • 在 VS Code 中点击右上角「导出(Export)」按钮;

  • 或在终端中运行:

    jupyter nbconvert your_notebook.ipynb --to pdf
  • 或使用 Quarto(如果你已安装):

    quarto render your_notebook.ipynb --to pdf

完成上述安装和设定后,即可顺利将 Notebook 文档导出为 PDF、HTML、Word 等多种格式,满足教学、写作和发布的常见需求。

6.4.5 高阶用法:使用 Quarto 导出漂亮 PDF 或制作电子书网站

如果你希望导出的文档更美观、格式更统一,或者希望将多个 Jupyter Notebook 或 Markdown 文档整合成一个电子书(book)或教学网站(website),可以考虑使用 Quarto

Quarto 是 RStudio 团队开发的下一代科学与技术出版平台,同时支持 .ipynb.qmd.md 文件的混合编写和发布。常见功能包括:

  • 一键导出 排版美观的 PDF 文档(支持标题、目录、脚注、交叉引用、引用文献等);
  • 创建结构化的电子书(Quarto Book),适合撰写讲义、教程和学术教材;
  • 部署交互式教学网站(Quarto Website),可发布为静态网页托管在 GitHub Pages 上。

6.4.5.1 示例命令:

.ipynb.qmd 导出为 PDF:

quarto render your_notebook.ipynb --to pdf

将多个文档组织为电子书结构(在 _quarto.yml 中设置章节):

quarto render

6.4.5.2 安装方式:

Quarto 完全兼容你现有的 VS Code 工作流,安装 Quarto 插件后即可直接在 VS Code 中预览、渲染和发布。对于希望构建专业文档的用户,Quarto 是目前最值得推荐的方案。