12 Python 常用扩展包
截至 2024 年 5 月 6 日,Python 社区已发布超过 530,000 个包(来源),涵盖了从科学计算、数据分析到机器学习、Web 开发的几乎所有领域。用户可通过 PyPI 进行查找和安装。
然而,对于经济、金融、管理、社会科学等领域的初学者来说,要在如此庞大的生态中快速识别出高效实用的工具包,并不容易。为此,本文梳理了这些领域中较为常用、应用成熟的 Python 扩展包,按功能分类整理,并附上官网或 GitHub 链接,便于进一步了解与使用。
12.1 数据处理与分析
这些库是处理结构化数据的核心工具,适用于经济建模、金融分析和社会学研究。
12.2 数据可视化
用直观图表展示经济趋势、金融指标或社会现象。
12.3 统计与计量经济学
从基础统计到复杂计量模型,覆盖社会科学研究需求。
12.4 机器学习与 AutoML
从传统算法到经济预测,助力数据驱动决策。
scikit-learn (官网)
入门首选,集成分类、回归、聚类、降维等算法。cuML (文档)
RAPIDS.AI 的 GPU 加速机器学习库,与 scikit-learn API 保持一致。tslearn (GitHub)
专注于时间序列聚类、分类与对齐的机器学习工具。PyCaret (GitHub)
自动化机器学习框架,封装 sklearn 流程,适合快速原型开发。H2O.ai (官网)
Java 编写的分布式 AutoML 平台,支持 Python、R、Java 接口,擅长大数据机器学习。TPOT (GitHub)
基于遗传编程的 AutoML 工具,可自动搜索最优模型管道。auto-sklearn (GitHub)
基于贝叶斯优化的 AutoML 工具,兼容 sklearn 风格。FLAML (GitHub)
微软开源的轻量级 AutoML 工具,支持低资源、高效率搜索。
12.5 金融科技与量化计算
专为金融数据、交易策略和经济建模设计。
12.6 网络爬虫与自动化
高效获取公开经济数据或社会舆情信息。
12.7 宏观与市场数据获取
12.8 自然语言处理(NLP)
适用于社会科学、金融情感分析、文本挖掘与用户舆情分析。
12.9 参考资料与延伸阅读
12.10 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 扩展包 Python金融 selenium 可复现数据科学 , md nocat
安装最新版lianxh
命令:
ssc install lianxh, replace
- 范思妤, 2023, Python:基于selenium爬取科创板审核问询, 连享会 No.1172.
- 连小白, 2025, R语言:Top期刊中使用最多的50个R扩展包, 连享会 No.1550.
- 陈卓然, 2023, Python金融分析系列-1:日期和时间变量的处理和转换, 连享会 No.1294.
- 陈卓然, 2023, Python金融分析系列-2:数据可视化, 连享会 No.1295.
- 陈卓然, 2023, Python金融分析系列-3:金融时间序列, 连享会 No.1298.
- 陈卓然, 2023, Python金融分析系列-4:数学工具-近似、凸优化、积分和符号运算, 连享会 No.1300.
- 陈卓然, 2023, Python:爬虫雅虎财经数据-selenium, 连享会 No.1306.
- 高瑜, 2024, 新书推荐:可复现数据科学及 Python 应用, 连享会 No.1485.