PyPI Stats
  • Insights
  • PyPI
  • GitHub
  • Search
  • Compare
  • Advisories
  • Ecosystem
  • About
Home

Search Packages

Find Python packages by name, description, GitHub topic, or filter by metrics
asuiu
sparkorm

ORM for Apache Spark and DataFrames schema manager

286K 16 3
ploomber
jupysql

Better SQL in Jupyter. 📊

134K 847 85
lakehq
pysail

Drop-in Apache Spark replacement written in Rust, unifying batch processing, stream processing, and compute-intensive AI workloads.

32K 2K 129
sdebruyn
dbt-fabric-samdebruyn

Maintained and extended fork combining dbt-fabric and dbt-fabricspark

7K 9 2
aroch
protodf

A package which lets you run PySpark SQL on your Protobuf data

2K 8 3
wh1isper
sparglim

Sparglim✨ makes PySpark App Configurable and Deploy Spark Connect Server Easier!

602 42 5
HuemulSolutions
risk-command-center

Risk Command Center, manage your risk easly.

110 11 7
HuemulSolutions
analytics-command-center

Huemul BigDataGovernance, es una framework que trabaja sobre Spark, Hive y HDFS. Permite la implementación de una estrategia corporativa de dato único, basada en buenas prácticas de Gobierno de Datos. Permite implementar tablas con control de Primary Key y Foreing Key al insertar y actualizar datos utilizando la librería, Validación de nulos, largos de textos, máximos/mínimos de números y fechas, valores únicos y valores por default. También permite clasificar los campos en aplicabilidad de derechos ARCO para facilitar la implementación de leyes de protección de datos tipo GDPR, identificar los niveles de seguridad y si se está aplicando algún tipo de encriptación. Adicionalmente permite agregar reglas de validación más complejas sobre la misma tabla.

105 11 7
    • Data from PyPI, GitHub, ClickHouse, and BigQuery