“Lisez le parquet de S3 et converti en dataframe” Réponses codées

Pandas DataFrame au parquet S3

import awswrangler as wr
wr.pandas.to_parquet(
    dataframe=df,
    path="s3://my-bucket/key/my-file.parquet"
)

batman_on_leave

Lisez le parquet de S3 et converti en dataframe

import pyarrow.parquet as pq
import s3fs

dataset = pq.ParquetDataset('s3://<s3_path_to_folder_or_file>', 
filesystem=s3fs.S3FileSystem(), filters=[('colA', '=', 'some_value'), ('colB', '>=', some_number)])
table = dataset.read()
df = table.to_pandas()

Stupid Snake

Réponses similaires à “Lisez le parquet de S3 et converti en dataframe”

Pour sélectionner une colonne dans la table de la base de données, nous devons d'abord rendre notre DataFrame accessible dans nos requêtes SQL. Pour ce faire, nous appelons la méthode DF.CreateorReplacetempView et définissons le nom de vue temporaire sur Insurance_DF.

Questions similaires à “Lisez le parquet de S3 et converti en dataframe”

Comment créer un script qui se lit dans la base de données, puis écrit dans le fichier CSV, puis télécharge le fichier sur Google Drive dans Python

Plus de réponses similaires à “Lisez le parquet de S3 et converti en dataframe” dans Python

Parcourir les réponses de code populaires par langue

Parcourir d'autres langages de code

Shell/Bash

C++

CSS

HTML

Java

JavaScript

Objective-C

PHP

Python

Sql

Swift

Ruby

TypeScript

Kotlin

Assembly

VBA

Scala

Rust

Dart

Elixir

Clojure

Haskell

Matlab

Erlang

Cobol

Fortran

Scheme

Perl

Groovy

Lua

Julia

Delphi

Abap

Lisp

Prolog

Pascal

ActionScript

Basic

Solidity

PowerShell

GDScript

Excel