介绍

这是一个介绍Polars DataFrame library的指南。它的目标是通过示例演示以及与其他类似解决方案进行比较，向您介绍Polars。这里介绍了一些设计选择。该指南还将向您介绍Polars的最佳使用。

尽管Polars完全是用Rust写的（没有运行时开销！）使用 Arrow -- 原生 Rust 实现的 arrow2 -- 作为它的底基。本指南中的示例主要使用其更高级的语言绑定。高级绑定只作为核心库中实现的功能的简要的包装。

对于 Pandas 使用者, 我们的Python package 提供最简单的方式来入门Polars.

目标与非目标

Polars的目标是提供一个闪电般的DataFrame库，利用所有机器上的可用核心。不像 dask 这样的工具——它试图并行化现有的单线程库，比如NumPy和Pandas——Polars是从头开始编写的，旨在并行化DataFrame上的查询。

Polars不遗余力地：

Polars是懒惰和半懒惰的。它可以让你急切地完成大部分工作，就像Pandas一样，但是它还提供了强大的表达式语法，可以在查询引擎中对其进行优化和执行。

在 lazy Polars中，我们能够对整个查询进行查询优化，进一步提高性能和内存压力。

Polars以逻辑计划跟踪您的查询。这计划在运行前会经过优化和重新排序。当请求结果时，Polars将可执行的任务分发给不同的使用立即反馈的算法的 API 的执行器并获取结果。因为优化器和执行器知晓整个查询上下文，依赖于独立数据源的计算得以在运行时被动态地并行化。

API

Polars 的速度非常快，事实上是目前性能最好的解决方案之一。参见 h2oai 的 db 基准测试中的结果。下图显示了产生结果的最大数据集。

db-benchmark

下面是Polars能够实现其目标的功能的简明列表：

Polars的开发是由

Xomnia