Crear un dataframe en Python leyendo un fichero Excel

En la siguiente entrada vamos a crear un dataframe en Python leyendo un fichero Excel de una forma muy sencilla gracias a la librería pandas. Pero antes de todo, debes tener instalado Python, un interprete como Jupyter Notebook e instalar openpyxl . ¿Comenzamos?

Especificaciones del entorno

Paso previo

Para poder leer un fichero xlsx desde python primero debes tener instalado el modulo openpyxl. Abre tu símbolo del sistema e instálalo con el siguiente comando:

pip3 install openpyxl
Crear un dataframe en Python leyendo un fichero Excel

Paso a paso

Método 1: Leer un fichero excel usando el método read_excel() de pandas.

# importar librería pandas como pd
import pandas as pd
 
# leer la primera hoja del excel
dataframe1 = pd.read_excel('C:/tmp/Libro1.xlsx')
 
print(dataframe1)Lenguaje del código: PHP (php)

Método 2: Leer un fichero excel especificando la hoja

# importar librería pandas como pd
import pandas as pd
 
# leer la primera hoja del excel
dataframe2 = pd.read_excel('C:/tmp/Libro1.xlsx', sheet_name = 'Hoja1')
 
print(dataframe2)Lenguaje del código: PHP (php)

Método 3: Leer columnas específicas utilizando el parámetro ‘usecols’

# importar librería pandas como pd
import pandas as pd

require_cols = [0, 1, 4]
 
# leer la primera hoja del excel
dataframe3 = pd.read_excel('C:/tmp/Libro1.xlsx' , usecols = require_cols)
 
print(dataframe3)Lenguaje del código: PHP (php)

Método 4: Saltarse filas usando ‘skiprows’

# importar librería pandas como pd
import pandas as pd
 
# saltarse las tres primeras filas
dataframe4 = pd.read_excel('C:/tmp/Libro1.xlsx' , skiprows = 3)
 
print(dataframe4)Lenguaje del código: PHP (php)

Método 5: Establecer la ubicación de la cabecera y leer a partir de ella usando ‘header

# importar librería pandas como pd
import pandas as pd
 
# saltarse las tres primeras filas
dataframe5 = pd.read_excel('C:/tmp/Libro1.xlsx' , header= 2)
 
print(dataframe5)Lenguaje del código: PHP (php)

Método 6: Leer varias hojas con ‘sheet_name’

# import libreria pandas como pd
import pandas as pd
 
# leer varias hojas
dataframe6 = pd.read_excel('C:/tmp/Libro1.xlsx' , sheet_name =['Hoja1', 'Hoja2'])
 
print(dataframe6)Lenguaje del código: PHP (php)

Escribir un comentario